Responsabilidades
- Crear y gestionar paneles, alertas y mediciones clave utilizando herramientas como Fluent-bit, Alloy, Grafana, Mimir, Loki y Tempo
- Automatizar funciones de supervisión y notificaciones en entornos que incluyen contenedores con Docker y Kubernetes, así como máquinas virtuales
- Establecer indicadores de nivel de servicio (SLI) y acuerdos de nivel de servicio (SLO) en colaboración con equipos de desarrollo y SRE
- Garantizar la disponibilidad continua, las 24 horas del día, los 7 días de la semana, de las plataformas de monitoreo y observabilidad
- Desarrollar y mantener scripts automatizados empleando lenguajes como Bash o Python
- Contribuir al perfeccionamiento constante de los procesos relacionados con la detección, monitoreo y manejo de incidentes
Beneficios
- Entorno laboral positivo bajo un modelo híbrido que fomenta la colaboración, el respeto mutuo, la comunicación efectiva y el compromiso en un equipo dinámico y orientado al crecimiento continuo
- Apoyo al desarrollo profesional mediante capacitaciones, asesoramiento y acceso a nuevos retos técnicos y de liderazgo
- Oportunidad de enfrentar desafíos recurrentes en soluciones críticas que exigen análisis profundo, innovación y mejora sostenida, con impacto directo en la operación y la experiencia del usuario
- Promoción de una cultura DevOps basada en la autonomía, responsabilidad compartida, iteración constante y colaboración estrecha entre desarrollo y operaciones
- Participación en un entorno que impulsa activamente la evolución tecnológica mediante la adopción de nuevas herramientas, metodologías modernas y prácticas de excelencia técnica
Modalidad
Híbrido
Other
- servicio 24/7
- entornos con contenedores (Docker/Kubernetes) y VMs