21 may
|
Gauss Control
|
Santiago
21 may
Gauss Control
Santiago
Postúlate en Kit Empleo: kitempleo.cl/empleo/1cz2ng
¿Deseas ser parte de un equipo que transforma personas y organizaciones para un futuro más seguro? Somos una empresa de tecnología enfocada en la prevención de accidentes mediante IA y estamos en búsqueda de nuevos talentos. Buscamos a nuestro/a próximo/a Site Reliability Engineer (SRE), cuyo objetivo será asegurar la disponibilidad, rendimiento y confiabilidad de los servicios críticos de Gauss Control, ejecutando y manteniendo la infraestructura bajo estándares ya definidos por el equipo. El rol opera en colaboración directa con el referente técnico de infraestructura, siendo responsable de la operación diaria, automatización de tareas repetitivas y respuesta a incidentes. Algunos de tus desafíos serán: Operación de infraestructura: Mantener y operar clusters Kubernetes en producción, garantizando alta disponibilidad. IaC: Desarrollar y mantener infraestructura usando Terraform bajo estándares definidos del equipo. Observabilidad: Operar y extender las soluciones de monitoreo existentes (métricas, logging, alertas) con foco en SLIs y SLOs ya establecidos. CI/CD: Mantener y mejorar pipelines de despliegue continuo, incluyendo rollback automático y health checks. Respuesta a incidentes: Participar activamente en la atención y mitigación de incidentes de alta prioridad, incluyendo guardias. Postmortems: Documentar y analizar causas raíz de incidentes para prevenir recurrencia. Automatización:
Reducir toil mediante scripting y herramientas internas. Gestión de configuración: Mantener configuración uniforme entre entornos usando Ansible u otras herramientas del stack. Documentación: Crear y mantener runbooks, diagramas de arquitectura y procedimientos de troubleshooting. Seguridad de la información: Resguardar información según las políticas de seguridad de Gauss Control. Principales requisitos para el rol: Formación académica: Ingeniería de Software / Sistemas, Ingeniería Informática / Ciencias de la Computación o Ingeniería Electrónica y Telecomunicaciones (válida si cuenta con especialización en redes, networking y arquitectura de sistemas distribuidos). Experiencia directa en Kubernetes y pipelines CI/CD en ambientes reales. Participación en guardia y gestión de incidentes críticos. Trabajo en equipos donde la dirección técnica sea colaborativa y haya estándares establecidos. Conocimientos en: Administración Linux y troubleshooting en profundidad; Terraform: escritura y mantenimiento de módulos; Networking: TCP/IP, balanceadores de carga, DNS; Comprensión práctica deSLIs, SLOs y error budgets. Beneficios que te encantarán 20 días de vacaciones hábiles al año. Viernes de desconexión (13:00). Día de cumpleaños libre. Confiable de salud y convenios. #J-18808-Ljbffr
Postúlate en Kit Empleo: kitempleo.cl/empleo/1cz2ng
📌 Site Reliability Engineer (Santiago)
🏢 Gauss Control
📍 Santiago