Site Reliability Engineer
hace 1 semana
**Descripción del puesto**:
Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.
Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.
Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.
**Lo que buscamos**:
En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nível de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.
En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.
Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.
**Responsabilidades clave**:
- Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
- Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
- Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
- Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
- Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
- Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
- Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
- Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
- Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
- Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
- Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
- Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
- Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
- Participar en una reunión 1:1 con el resto de tu equipo.
- Proporcionar retroalimentación oportuna a tu equipo.
- Participar en la definición de los OKR del producto para tu equipo.
- Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.
**Requisitos**:
- Inglés B1 como mínimo
- Excelentes habilidades de comunicación con partes interesadas de alto nível y de negocios
- Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiência práctica equivalente en un campo relacionado con el software.
- Más de 2 años manejando sistemas operativos Linux
- Más de 3 años de experiência escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
- Amplia experiência con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
- Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
- Comprensión de los sistemas de bases de datos y experiência en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Conocimie
-
Site Reliability Engineer
hace 1 semana
Lima, Perú Rappi A tiempo completoIt is time for you to join us to show the world that we are the company that is coming to change paradigms, where we revolutionize hours, minutes and seconds. Because in Rappi WE SEE OPPORTUNITIES where others see problems. WE SEE CLOSENESS where others see distance. WE SEE ADRENALINE where others see pressure. Join a team where we are all capable of...
-
Site Reliability Engineer
hace 1 semana
Lima, Perú WTW A tiempo completoWe have spent many years growing and fostering a DevOps culture by bridging the divide between our Software and Infrastructure Engineering departments. We want the cross-functional teams that we are building to include Site Reliability Engineers. We operate in a complex, multi-tenant, hybrid cloud and on-premises infrastructure that spans both the Windows...
-
Principal Site Reliability Engineer
hace 2 días
Lima Metropolitana, Perú Groupon A tiempo completoGroupon is a marketplace where customers discover new experiences and services every day and local businesses thrive. To date we have worked with over a million merchant partners worldwide, connecting over 16 million customers with deals across various categories. In a world often dominated by e-commerce giants, we stand out as one of the few platforms...
-
Senior Site Reliability Engineer
hace 7 días
Lima, Perú Neara A tiempo completoNeara is a high-growth, venture-backed Series B, tech company headquartered in Sydney, Australia. We work with 75% of the utilities in Australia and New Zealand and are growing rapidly across the US and Europe. Our mission is to revolutionise the utilities industry by helping them future-proof their infrastructure and navigate the challenges of the clean...
-
Principal Site Reliability Engineer
hace 24 horas
Lima Metropolitana, Perú Myworkdayjobs A tiempo completoJoin to apply for the Principal Site Reliability Engineer role at Groupon.Groupon is a marketplace where customers discover new experiences and services every day and local businesses thrive. To date, we have worked with over a million merchant partners worldwide, connecting over 16 million customers with deals across various categories. In a world often...
-
Site Reliability Engineering Manager
hace 21 horas
Lima Metropolitana, Perú Myworkdayjobs A tiempo completoJoin Our Mission to Transform Platform ReliabilityWe are looking for a highly skilled Principal Site Reliability Engineer to join our team at Myworkdayjobs. As a key contributor to our engineering organization, you will be responsible for developing and maintaining scalable, highly available systems that meet the demands of our rapidly growing customer...
-
Reliability Mechanical Engineer
hace 2 semanas
Lima, Perú Hunt Consolidated, Inc. A tiempo completo**ROLES AND RESPONSIBILITIES**: - Monitoring and calculation of reliability KPI (RAM, MTBF, etc). - Analyze predictive alerts from machine learning software ( for Rotaing and Mechanical assets) - Identify threats and opportunities for Plant production and manage them in MTO (mitigate Threats and Opportunities) process. - Analyze data and perform reliability...
-
Systems Reliability Engineer
hace 6 días
Lima, Perú Scotiabank A tiempo completoHola! Felicitamos y valoramos tu interés por seguir creciendo dentro del Grupo Scotiabank, nos encontramos en búsqueda de talento que aporte con sus conocimientos y experiência a la posición y sobre todo con OPTIMISMO. **Purpose**: As a member of the Global Systems Reliability team,the Global System Reliability Engineer (SRE) will work in collaboration...
-
Site Reliability Engineering Professional:
hace 2 semanas
Lima, Perú Kyndryl Peru SRL A tiempo completo**Why Kyndryl** Kyndryl is a market leader that thinks and acts like a start-up. We design, build, manage, and modernize the mission-critical technology systems that the world depends on every day. So why work at Kyndryl? We are always moving forward - always pushing ourselves to go further in our efforts to build a more equitable, inclusive world for our...
-
Site Reliability Engineer Career
hace 3 días
Lima, Perú Equifax, Inc. A tiempo completoComo Site Reliability Engineering (SRE) garantizarás que los servicios internos y externos cumplan o superen las expectativas de fiabilidad y rendimiento al tiempo que se adhieren a los principios de ingeniería de Equifax.¿Que harás?Gestionar el tiempo de actividad de los sistemas en arquitecturas nativas de la nube (GCP).Desarrollar patrones de...
-
Site Reliability Engineering Lead
hace 3 días
Lima Metropolitana, Perú BairesDev A tiempo completoAbout the Position:We are seeking an experienced Site Reliability Engineer to join our team. As a Site Reliability Engineer, you will be responsible for ensuring high service availability, performance, security, and maintainability of our cloud infrastructure hosted on AWS. This includes implementing CI/CD pipelines to automate deployments, automating tools...
-
Site Reliability Engineer
hace 7 días
Lima, Perú Wikimedia Foundation A tiempo completo**Summary** The Wikimedia Foundation is looking for a Site Reliability Engineer (Database) to join our SRE team to build, optimize and support the platform serving the world's favorite encyclopædia to millions of people around the globe. Wikipedia and its sister projects are a globally distributed architecture powered strictly by Free and Open Source...
-
Site Reliability Engineer, Americas
hace 2 semanas
Lima, Perú Canonical - Jobs A tiempo completoThis role is an opportunity for a hands-on technologist with a passion for Linux to build a career with Canonical and drive the success with those leveraging Ubuntu and open source products. If you have an affinity for open source development and a passion for technology, then you will enjoy working with some of the best people in the industry at...
-
Site Reliability Engineering Professional:
hace 2 semanas
Lima, Perú Kyndryl Peru SRL A tiempo completo**Why Kyndryl** Kyndryl is a market leader that thinks and acts like a start-up. We design, build, manage, and modernize the mission-critical technology systems that the world depends on every day. So why work at Kyndryl? We are always moving forward - always pushing ourselves to go further in our efforts to build a more equitable, inclusive world for our...
-
Site Reliability
hace 4 semanas
Lima, Perú Canonical - Jobs A tiempo completoThis role is an opportunity for a hands-on, but literally hands-off, technologist with a passion for Linux to build a career with Canonical and drive the success with those leveraging Ubuntu and open source products. If you have an affinity for operations automation and a passion for technology, then you will enjoy working with some of the best people in the...
-
Databricks Administrator and Site Reliability
hace 1 semana
Lima, Perú DIGITALHUB SAC A tiempo completo**DIGITALHUB** es una empresa peruana de outsourcing de **servicios de BPO y TI.** Nuestra visión es un futuro en el que cada persona pueda encontrar el mejor empleo y donde nuestros partners puedan descubrir lo mejor del talento latinoamericano. En esta oportunidad, nos encontramos buscando un **"Databricks Administrator and Site Reliability Engineer"**...
-
Senior Site Reliability Engineer
hace 2 semanas
Lima, Perú Fusemachines A tiempo completo**About Fusemachines** Fusemachines is a leading AI strategy, talent, and education services provider. Founded by Sameer Maskey Ph.D., Adjunct Associate Professor at Columbia University, Fusemachines has a core mission of democratizing AI. With a presence in 4 countries (Nepal, the United States, Canada, and the Dominican Republic and more than 250...
-
Lead Site Reliability Engineer
hace 1 semana
Lima, Perú AUNA Oficina de Apoyo A tiempo completo**Descripción empresa**: Auna es una organización líder cuyo compromiso principal es llevar salud y bienestar a sus afiliados y pacientes. Buscamos la innovación constante para brindar soluciones de salud con altos estándares de calidad y accesibles para todos. Tenemos presencia en Perú, Colombia y México y contamos con más de 14,500...
-
Software Reliability Specialist
hace 21 horas
Lima Metropolitana, Perú Myworkdayjobs A tiempo completoAbout MyworkdayjobsMyworkdayjobs is a leading marketplace where customers discover new experiences and services every day. Our platform connects over 16 million customers with deals across various categories, making us one of the few platforms uniquely committed to helping local businesses succeed.We're on a radical journey to transform our business with a...
-
IT Support Engineer
hace 7 días
Lima, Perú Mindelta A tiempo completoAn IT Support Engineer and Incident Engineer is responsible for providing technical support and troubleshooting for hardware, software, and network-related issues. This role involves monitoring and managing incidents to ensure timely resolution, maintaining system performance, and minimizing downtime. The engineer collaborates with cross-functional teams to...