Site Reliability Engineer
hace 4 días
**Descripción del puesto**:
Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.
Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.
Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.
**Lo que buscamos**:
En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nível de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.
En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.
Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.
**Responsabilidades clave**:
- Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
- Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
- Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
- Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
- Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
- Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
- Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
- Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
- Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
- Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
- Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
- Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
- Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
- Participar en una reunión 1:1 con el resto de tu equipo.
- Proporcionar retroalimentación oportuna a tu equipo.
- Participar en la definición de los OKR del producto para tu equipo.
- Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.
**Requisitos**:
- Inglés B1 como mínimo
- Excelentes habilidades de comunicación con partes interesadas de alto nível y de negocios
- Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiência práctica equivalente en un campo relacionado con el software.
- Más de 2 años manejando sistemas operativos Linux
- Más de 3 años de experiência escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
- Amplia experiência con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
- Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
- Comprensión de los sistemas de bases de datos y experiência en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Conocimie
-
Principal Site Reliability Engineer
hace 7 días
Lima, Perú Groupon A tiempo completoGroupon is a marketplace where customers discover new experiences and services everyday and local businesses thrive. To date we have worked with over a million merchant partners worldwide, connecting over 16 million customers with deals across various categories. In a world often dominated by e-commerce giants, we stand out as one of the few platforms...
-
Senior Site Reliability Engineer
hace 1 día
Lima Metropolitan Area, Perú OpenLoop A tiempo completoOpenLoop is looking for a Senior Site Reliability Engineer to join our team in Lima, Peru.About the RoleCross-Functional CollaborationPartner with engineering teams to improve system reliability and deployment practices.Engage with teams on SRE guidelines and best practices for automation and infrastructure.Work with security teams to implement secure,...
-
Senior Site Reliability Engineer, Americas
hace 2 semanas
Lima, Perú Canonical - Jobs A tiempo completo**Site Reliability Engineer**: To become a member of this team, you need to be a software engineer fluent in Python, you need a genuine interest in the full open source infrastructure stack from metal to containers, and you need the ability to work in a high pressure operations environment with mission-critical services for global brand name customers. As a...
-
Systems Reliability Engineer
hace 2 días
Lima, Perú Scotiabank A tiempo completoHola! Felicitamos y valoramos tu interés por seguir creciendo dentro del Grupo Scotiabank, nos encontramos en búsqueda de talento que aporte con sus conocimientos y experiência a la posición y sobre todo con OPTIMISMO. **Purpose**: As a member of the Global Systems Reliability team,the Global System Reliability Engineer (SRE) will work in collaboration...
-
Site Reliability Engineer
hace 4 días
Lima, Perú Willis Towers Watson A tiempo completo**The Role** We are a group of passionate engineers who have built the largest private Medicare marketplace in the United States. We focus on the continuous improvement of our systems and culture. We improve and maintain a platform that provides the best possible experience to shop for insurance plans, and allows our insurance carriers to be be confident...
-
Site Reliability Engineer
hace 4 días
Lima Metropolitan Area, Perú Nearsure A tiempo completoExplore the Nearsure experience Join our close-knit LATAM remote team:Connect through fun activities like coffee breaks, tech talks, and games with your team-mates and management. Say goodbye to micromanagementWe champion autonomy, open communication, and respect for diversity as our core values.Your well-being matters:Our People Care team is here from day...
-
Reliability Mechanical Engineer
hace 2 semanas
Lima, Perú Hunt Consolidated, Inc. A tiempo completo**ROLES AND RESPONSIBILITIES**: - Monitoring and calculation of reliability KPI (RAM, MTBF, etc). - Analyze predictive alerts from machine learning software ( for Rotaing and Mechanical assets) - Identify threats and opportunities for Plant production and manage them in MTO (mitigate Threats and Opportunities) process. - Analyze data and perform reliability...
-
Senior Site Reliability Engineer
hace 7 días
Lima, Perú Groupon A tiempo completoGroupon is a marketplace where customers discover new experiences and services everyday and local businesses thrive. To date we have worked with over a million merchant partners worldwide, connecting over 16 million customers with deals across various categories. In a world often dominated by e-commerce giants, we stand out as one of the few platforms...
-
Network Site Engineer
hace 4 días
Lima, Perú Tech Source Managed Services A tiempo completo**Role Description** This is a part-time on-site role for a Network Support Engineer located in Peru. The Network Support Engineer will be responsible for network administration, network engineering, technical support, troubleshooting, and network security. **Qualifications** - Network Administration and Network Engineering skills - Technical Support and...
-
Databricks Administrator and Site Reliability
hace 4 días
Lima, Perú DIGITALHUB SAC A tiempo completo**DIGITALHUB** es una empresa peruana de outsourcing de **servicios de BPO y TI.** Nuestra visión es un futuro en el que cada persona pueda encontrar el mejor empleo y donde nuestros partners puedan descubrir lo mejor del talento latinoamericano. En esta oportunidad, nos encontramos buscando un **"Databricks Administrator and Site Reliability Engineer"**...