Match score not available

Site Reliability Engineer (Colombia,Remote)

Remote: 
Full Remote
Contract: 
Work from: 

Offer summary

Qualifications:

Bachelor's degree in Computer Engineering, Systems Engineering, Computing, or a related field., At least 3 years of experience in managing, optimizing, and monitoring cloud infrastructures, particularly with Kubernetes and OpenStack., Proficiency in monitoring tools such as Prometheus, Grafana, and Elasticsearch, as well as scripting with Bash and/or Python., Intermediate English skills in reading and writing. .

Key responsabilities:

  • Design, implement, and optimize monitoring solutions for cloud infrastructures.
  • Define, analyze, and implement dashboards to visualize critical performance indicators.
  • Ensure the proper functioning of production clouds based on open-source technologies like Kubernetes and OpenStack.
  • Manage and address critical incidents on the platform, escalating to Senior Engineers or the product development team.

Whitestack logo
Whitestack Telecommunication Services Scaleup https://www.whitestack.com/
51 - 200 Employees
See all jobs

Job description

Estamos buscando profesionales capaces de implementar y evolucionar herramientas que permitan un monitoreo automatizado y eficiente, que provea de la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento cloud productivos.

En este cargo tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos.

Responsabilidades

  • Diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud.
  • Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos.
  • Asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como Kubernetes y OpenStack).
  • Atender las incidencias críticas de la plataforma, escalando a los Ingenieros Senior o al área de desarrollo de productos.
  • Supervisar y administrar entornos de desarrollo y testing.
  • Desarrollar, Implementar y Operar un pipeline y herramientas de CI/CD, para la supervisión o actualización de imágenes en un cloud productivo.


Requisitos Técnicos

  • Formación:
    • Estudios de Ingeniería Informática, Ingeniería de Sistemas, Computación o título afín.


Experiencia:

  • Experiencia relacionada de al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como Kubernetes y OpenStack, y el manejo de incidencias y entornos productivos.
  • Experiencia en el diseño y soluciones de monitoreo para infraestructuras cloud, así como gestión del desempeño y coordinación de incidencias críticas con el equipo de desarrollo.
  • Conocimientos Específicos / Requisitos Técnicos:
    • Herramientas de monitoreo (Prometheus, Grafana, Elasticsearch).
    • Uso y administración de clusters de Kubernetes.
    • Automatización (scripting) con Bash y/o Python.
    • Uso y administración de Linux (intermedio).
    • Uso y creación de imágenes de contenedores con Docker (intermedio).
  • Idioma: Inglés intermedio (Escritura/Lectura)

Soft-skills requeridos:

  • Autonomía, disciplina y capacidad autoaprendizaje
  • Pensamiento analítico conceptual
  • Orientación al cliente
  • Tolerancia a la frustración
  • Saber trabajar en equipo


Deseables

  • Experiencia Cloud Público (AWS, GCP, Azure) o Privado (Openstack)
  • Experiencia en metodologías ágiles (Scrum, Kanban, etc.)
  • Capacidad de adaptar open-source existente.
  • Certificaciones en Linux, OpenStack y/o Kubernetes
  • Integración de proyectos de código abierto
  • Conocimientos básicos en Networking


Beneficios

En Whitestack somos líderes en el desarrollo de soluciones Telco Cloud, Open Networking y PaaS para aplicaciones basadas en máquinas virtuales y en microservicios, llevando su implementación a grandes proyectos en América Latina aprovechando proyectos de código abierto (como Openstack, Kubernetes, Rancher, Ceph, Prometheus, Grafana y muchos otros), en colaboración con organizaciones globales como CNCF, ETSI, Open Infra Foundation, Telecom Infra Project, Open Compute Project y otras.

Somos una empresa altamente innovadora, que ofrece una metodología de trabajo flexible, con tecnologías altamente innovadoras, y con todos los beneficios de unirse a una empresa joven con altas expectativas de crecimiento (con una amplia línea de carrera en liderazgo y tecnología)

  • Participar en una exitosa startup tecnológica latinoamericana, con reputación global en nuevas tecnologías.
  • Ambientes orientados al objetivo, donde nos encanta entregar a tiempo.
  • Trabajo con horarios flexibles, en este momento (por Covid) completamente remoto, pronto con flexibilidad Casa / Oficina
  • Aprender mucho del mundo Cloud!
  • Usar tecnologías y frameworks open-source
  • 15 días de vacaciones como mínimo al año o más, según tu país.
  • Otros beneficios acordes a nuestros 4 pilares: Familia & Vida Personal, Crecimiento Personal, Salud & Seguridad y Pertenencia y Recreación.

Required profile

Experience

Industry :
Telecommunication Services
Spoken language(s):
English
Check out the description to know which languages are mandatory.

Other Skills

  • Teamwork
  • Analytical Thinking

Site Reliability Engineer (SRE) Related jobs