Principal Site Reliability Engineer

hace 2 semanas


Región Metropolitana, Chile Falabella Equipo Corporativo A tiempo completo

Descripción empresa:

Somos más de 90 mil personas que, día a día, dedicamos nuestra pasión y energía a cumplir nuestro Propósito de “Simplificar y Disfrutar Más la Vida”. Propósito que hoy vive a través de nuestro ecosistema físico y digital en todas nuestras empresas (Falabella Retail, Sodimac, IKEA, Tottus, Mallplaza, Falabella Inmobiliario, Falabella.com, Linio, Falabella Financiero, Banco Falabella, Falabella Soriana, Seguros Falabella, Fazil, Fpay y Falabella Corporativo) y países (Argentina, Brasil, Chile, China, Colombia, India, México, Perú y Uruguay). Valoramos las distintas miradas porque entendemos que la diversidad es la clave de nuestra innovación. Queremos ir más allá de cualquier límite, desafiarnos constantemente, divertirnos haciendo lo que nos gusta y dejar huella en lo que hacemos. Y sabemos que existe una forma de hacerlo: como UN SOLO EQUIPO. Conoce más oportunidades para vivir la #ExperienciaFalabella en

Misión del cargo:

Implementar productos, monitorear, mediante la observación, además de colaborar con el equipo de desarrollo en el ciclo.

Funciones del cargo:
  1. Desempeñarse bajo un enfoque proactivo en la detección de problemas, determinación de puntos de mejora y cuellos de botella en el rendimiento de las plataformas, llevando a cabo el análisis de los sistemas, la gestión de la configuración y desarrollar mejoras para el rendimiento, la disponibilidad y la confiabilidad del software del sistema. Con la finalidad de permitir mejora continua en los procesos operacionales del ciclo de vida del producto y comprender de mejor forma el funcionamiento de ellos y asegurar estabilidad en la producción.
  2. Colaborar en la construcción una cultura SRE en toda la organización al compartir mejores prácticas, enfoques, documentación y código con otros equipos de ingeniería, aplicando mecanismos de observabilidad y seguridad. Para lograr desarrollar un enfoque de comunidad que esté en constante crecimiento en base a conocimientos y experiencias conjuntas.
  3. Solucionar problemas complicados multiplataforma considerando el sistema operativo, las redes y la base de datos en un entorno On Premise, SaaS, IaaS basado en la nube y manejar incidentes de producción en vivo, depurar/solucionar problemas de aplicaciones e infraestructura, seguir e implementar las mejores prácticas de SRE apalancado por la automatización y disminución del TOIL. Para asegurar la comprensión end to end y lograr soluciones efectivas a las problemáticas.
  4. Documentar conocimiento sobre las plataformas a medida que se adquiere con el tiempo, crear runbooks y asegurarse de que la información crítica del sistema esté disponible para aquellos que la necesitan. Para lograr facilidad en el acceso a la información base del producto y con ello asegurar comprensión del mismo en situaciones de crisis (incidentes).
  5. Ser contacto inicial en el proceso de gestión de incidentes, siendo capaz de utilizar e implementar mejoras en el proceso, aplicar conocimientos sobre Gestión de incidentes tales como análisis post-Mortem. Para asegurar respuesta rápida y efectiva ante problemas en los sistemas productivos.
  6. Construcción de herramientas que apoyen la gestión end to end en el ciclo de vida del producto (software y otros), optimizando y priorizando la implementación y utilización de flujos continuos de despliegue (CI/CD) y aplicando automatización y Scripting a cualquier tarea o parte de las plataformas o que se identifique que realiza manualmente y que permita la identificación temprana de problemas en el código. Con la finalidad de asegurar calidad y velocidad en la puesta en producción de nuevos features y reducir el Toil y los riesgos del trabajo manual.
  7. Diseñar e implementar mecanismos que permitan definir e implementar niveles de servicio (SLI, SLO y SLA).
Requisitos:
  • Experiencia en el diseño y mantenimiento de arquitecturas de nube (Azure, GCP).
  • Conocimiento de lenguajes de programación, como Python, Java o Go (al menos uno de forma sólida).
  • Experiencia con Kubernetes en cualquier distribución (también es válido Openshift).
  • Experiencia con plataformas/herramientas de CI/CD como Gitlab (idealmente administrando Runners).
  • Experiencia en la administración de sistemas operativos (Linux).
  • Conocimiento sólido de infraestructura, como servidores, redes, almacenamiento, contenedores, DB.
  • Fuertes habilidades de comunicación y capacidad para colaborar eficazmente con diferentes equipos.
  • Orientación al cliente y capacidad de comprender requisitos comerciales y traducirlos en soluciones.
  • Experiencia en uso de herramientas de supervisión y registro, como DataDog.
  • Conocimiento al menos API Rest (deal Open API).
#J-18808-Ljbffr

  • Región Metropolitana, Chile Prometeo Talent A tiempo completo

    About Us This company provides a software platform powered by AWS. This platform can be easily customized to help various clients, including financial service providers, debt collection agencies, debt buyers, telecommunication companies, utility companies, and others, achieve better results when working with customers facing financial challenges....

  • Electrical Engineer

    hace 1 semana


    Región Metropolitana, Chile WSP A tiempo completo

    Description WSP Caribbean Limited (WSP) provides consultancy services within the Caribbean region, specializing in project management, architecture design, engineering design (civil, structural, mechanical and electrical), and land use planning services. WSP is locally dedicated with international scale, being a part of one of the world’s leading...

  • Field Service Engineer

    hace 3 semanas


    Región Metropolitana, Chile DCS Chile A tiempo completo

    En data Conversion Services nos encontramos en búsqueda de un profesional con experiencia en equipos médicos para desempeñarse como Field Servive Engineer en una importante compañía multinacional. La principal misión del cargo es ayudar a los clientes internos y externos in situ y de forma remota en cuestiones y problemas técnicos. Sus principales...

  • Data engineer

    hace 1 semana


    Región Metropolitana, Chile SystemVan A tiempo completo

    Buscamos Data Engineer, senior, para trabajar con importante banco chileno a través nuestro. Estudios: Titulado de Ingeniería en Informática, computación o carrera compatible con el cargo. Las principales funciones del cargo: 1. Liderar y desarrollar aplicaciones ETL/ELT End to End que permitan mejorar la toma de decisiones en la organización. 2....


  • Región Metropolitana, Chile Latam Airlines A tiempo completo

    RELIABILITY ENGINEERING LEAD Analistas de Redes o Administradores (as) de redes (TI) Estamos en bsqueda de nuestro prximo/a RELIABILITY ENGINEERING LEAD para el equipo de plataforma en Santiago de Chile, quin ser el responsable de brindar las mejores capacidades a los equipos de desarrollo para crear aplicaciones y servicios confiables y resilientes,...


  • Región Metropolitana, Chile SSI OUTSOURCING A tiempo completo

    Sujeto a la ley de inclusión laboral 21015 Funciones Principales: Participar como garante, verificador y certificador de la correcta ejecución de los trabajos en el área minera. Supervisar y asegurar el cumplimiento de los estándares de seguridad, calidad y medio ambiente en todas las actividades mineras. Colaborar en la planificación y ejecución...


  • Región Metropolitana, Chile Axity A tiempo completo

    Axity, Somos una compañía con más de 35 años de trayectoria nuestro portafolio de servicios es uno de los más grandes en la industria: Estrategia Digital, Desarrollo de Software, Bussiness Intelligence, Big Data, Analítica Avanzada, Seguridad, IOT. Buscamos un PM - Ingeniero especialista coordinar de Proyectos de Acceso Requisitos: a) Para el caso...


  • Región Metropolitana, Chile Prismecs A tiempo completo

    Prismecs is at the forefront of transforming industrial solutions on a global scale. As trailblazers in supply chain and engineering, we empower industrial teams to break through barriers in sectors like power generation and oil & gas. With a strategic presence in key markets—USA, Saudi Arabia, and Angola—we're not just a company; we're a...


  • Región Metropolitana, Chile Google A tiempo completo

    Technical Account Manager, Google Cloud Consulting (English, Spanish) corporate_fare Google place Santiago, Chile Apply info_outline info_outline X Info Please submit your resume in English - we can only consider applications submitted in this language. Please submit your resume in English - we can only consider applications submitted in this...


  • Región Metropolitana, Chile GRUPO 360 A tiempo completo

    Importante empresa de ingeniería Hidráulica busca contratar a Ingeniero Industrial o civil Industrial para ocupar la vacante de Líder de Reportabilidad y Servicio. Se busca a un(a) profesional altamente motivado(a) con excelencia en el servicio al cliente y experiencia en liderar y coordinar equipos, así como en el uso de plataformas, herramientas y...