Site Reliability Engineer
hace 5 días
**Descripción del puesto**:
Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.
Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.
Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.
**Lo que buscamos**:
En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nível de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.
En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.
Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.
**Responsabilidades clave**:
- Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
- Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
- Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
- Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
- Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
- Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
- Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
- Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
- Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
- Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
- Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
- Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
- Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
- Participar en una reunión 1:1 con el resto de tu equipo.
- Proporcionar retroalimentación oportuna a tu equipo.
- Participar en la definición de los OKR del producto para tu equipo.
- Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.
**Requisitos**:
- Inglés B1 como mínimo
- Excelentes habilidades de comunicación con partes interesadas de alto nível y de negocios
- Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiência práctica equivalente en un campo relacionado con el software.
- Más de 2 años manejando sistemas operativos Linux
- Más de 3 años de experiência escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
- Amplia experiência con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
- Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
- Comprensión de los sistemas de bases de datos y experiência en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Conocimie
-
Site Reliability Engineer
hace 2 semanas
Santiago de Chile Launchpad Technologies Inc. A tiempo completoLaunchpad, a people-first technology company, is a leader in North America´s rapidly growing tech sector. Through two solutions, Launchpad supports its clients with digital transformation: - PaasportTM, our iPaaS solution, streamlines software integration and automates workflows. - Nearshore Staff Augmentation, our managed IT staffing service, connects top...
-
Senior Site Reliability Engineer
hace 6 días
Santiago de Chile Launchpad Technologies Inc. A tiempo completoLaunchpad, a people-first technology company, is a leader in North America´s rapidly growing tech sector. Through two solutions, Launchpad supports its clients with digital transformation: - PaasportTM, our iPaaS solution, streamlines software integration and automates workflows. - Nearshore Staff Augmentation, our managed IT staffing service, connects top...
-
Work From Home Site Reliability Engineer
hace 3 días
Santiago, Chile BairesDev SA A tiempo completoWho we are BairesDev is proud to be the fastest-growing company in America. With people on five continents and world-class clients, we are only as strong as the multicultural teams at the heart of our business. To consistently deliver the highest quality solutions to our clients, we only hire the Top 1% of the best talents and nurture their professional...
-
Remote Senior Site Reliability Engineering Manager
hace 3 semanas
, , Chile Next League A tiempo completoA leading sports technology consultant is seeking a Senior Engineering Manager for Site Reliability. The successful candidate will lead a team of site reliability engineers, ensuring high availability and performance of systems for clients like NASCAR. This role is remote and requires a minimum of 5 years in SRE and 2 years in management. Offering between...
-
Senior Engineering Manager, Site Reliability
hace 3 semanas
, , Chile Next League A tiempo completoSenior Engineering Manager, Site Reliability Join to apply for the Senior Engineering Manager, Site Reliability role at Next League . As the Senior Manager of Site Reliability Engineering, you will be responsible for ensuring the reliability, scalability, and efficiency for a wide range of client systems, including organizations such as NASCAR, USOPC, and...
-
Site Reliability Engineer
hace 5 días
Santiago, Chile FullStack Labs A tiempo completoFullStack is the fastest-growing software consultancy in the Americas. We help organizations like Uber, GoDaddy, MGM, Siemens, Stanford University, and the State of California, build distributed software development teams, and deliver transformational digital solutions. As an employee-first company, we focus on hiring the most talented software designers and...
-
Software Engineer 2 Site Reliability
hace 6 días
Santiago de Chile ZeroFox A tiempo completo**Opportunity Overview** At ZeroFox, we are passionate about bringing world-class protection to the digital-first world. Together, we have built a system capable of collecting and analyzing data from all over the internet, creating a paradigm-shifting cybersecurity product that helps secure and protect our customers and improves the global threat...
-
Site Reliability
hace 3 días
Santiago de Chile Canonical - Jobs A tiempo completoThis role is an opportunity for a hands-on, but literally hands-off, technologist with a passion for Linux to build a career with Canonical and drive the success with those leveraging Ubuntu and open source products. If you have an affinity for operations automation and a passion for technology, then you will enjoy working with some of the best people in the...
-
Principal Cloud SRE: Cost Optimization
hace 4 semanas
, Región Metropolitana de Santiago, Chile Sovos A tiempo completoA global tax compliance leader in Santiago is searching for a Principal Site Reliability Engineer. The role involves optimizing AWS cloud performance and managing costs while collaborating with DevOps teams. Successful candidates will have a BS in Computer Science and over 7 years of experience. They must possess a deep understanding of AWS services and SaaS...
-
Staff Site Reliability Engineer N5737
hace 2 semanas
Santiago de Chile Nisum A tiempo completoNisum is a leading global digital commerce firm headquartered in California, with services spanning digital strategy and transformation, insights and analytics, blockchain, business agility, and custom software development. Founded in 2000 with the customer-centric motto “_Building Success Together®_,” Nisum has grown to over 1,800 professionals across...