Site Reliability Engineering - SRE Pleno

Remote: 
Full Remote
Contract: 
Work from: 

Offer summary

Qualifications:

Practical experience with APM and observability tools such as Dynatrace, Datadog, or New Relic., Knowledge of metrics, logs, and traces, including their implementation., Experience in defining and monitoring SLIs, SLOs, and SLAs., Familiarity with cloud environments and Kubernetes..

Key responsabilities:

  • Monitor and observe technology infrastructure and product teams.
  • Implement and maintain APM solutions like Dynatrace.
  • Define, collect, and analyze performance metrics, logs, and traces.
  • Develop dashboards that translate technical data into business insights.

SOUTH SYSTEM logo
SOUTH SYSTEM Scaleup http://southsystem.com.br/
201 - 500 Employees
See all jobs

Job description

Site Reliability Engineering - SRE

Local: Remoto

Estamos em busca de uma Pessoa Site Reliability Engineering - SRE para ingressar em nossa nave e juntos, decolar o foguete que impulsiona pessoas para inovar o mundo.

E antes de apresentar a vaga, queremos te mostrar as razões para ser South System:

  • As +350 pessoas do nosso time nos elegeram 2 vezes uma das melhores empresas para se trabalhar no país (GPTW) e nos deram 4.9 estrelas no Glassdoor e Indeed;
  • Somos Talent Awards pelo linkedin;
  • Somos Carbon neutral – contribuímos com a compensação das emissões de carbono;
  • Estamos operando com oportunidades em home office e também com oportunidades híbridas;
  • Contemplamos benefícios variados como:

Acesso livre a plataforma de cursos Udemy com certificações exclusivas;

Benefício de home office;

Benefício de educação financeira;

Cartão de benefícios flash.

  • Nosso código de cultura é norteado por atitudes e práticas que fazem parte do nosso dia a dia:

Apoio e incentivo ao crescimento e desenvolvimento das pessoas;

Respeito, lealdade, colaboração e engajamento fazem parte do nosso DNA, cultivamos um ambiente seguro para todos;

Somos diversos e acreditamos no poder da inclusão e da diversidade dos times;

Unimos pessoas e inovação para prover soluções de TI.

  • Amamos nosso planeta e queremos fazer dele um lugar melhor para as próximas gerações por isso cultivamos diversas ações de sustentabilidade;
  • Mantemos e apoiamos ações sociais.

Agora, vamos falar dessa oportunidade!

Nossos profissionais atuam em projetos alocados em clientes, ou projetos de fábrica, e todos têm acompanhamento das nossas business partners, com suporte especializado para que tenham um bom desempenho e progresso de carreira, nossas squads são multidisciplinares disponíveis de forma global atuando no modelo home office. Esta oportunidade é para um cliente no segmento financeiro.

Seu desafio no time:

  • Atuará com monitoramento e observabilidade, sendo o elo entre a área de tecnologia (infraestrutura, SRE, desenvolvimento) e os times de produto.
  • Participará da evolução da esteira de observabilidade, com foco em visibilidade de negócio, experiência do cliente/cooperado e eficiência operacional.
  • Implementar e manter soluções de APM como Dynatrace;
  • Definir, coletar e analisar métricas de desempenho, logs e rastreamentos (traces);
  • Trabalhar junto aos times de produto para definir e acompanhar SLIs, SLOs e SLAs;
  • Desenvolver e manter dashboards que traduzem dados técnicos em insights para negócio e operação;
  • Realizar análises proativas de performance e identificar pontos de melhoria;
  • Participar de incidentes críticos ajudando na identificação da causa raiz;
  • Contribuir na construção de processos e boas práticas de monitoramento, observabilidade e gestão de eventos.

Perfil que buscamos:

  • Experiência prática com ferramentas de APM e observabilidade (ex: Dynatrace, Datadog, New Relic, AppDynamics);
  • Conhecimento de métricas, logs e traces (conceitos e implementação);
  • Vivência com definição e acompanhamento de SLIs, SLOs e SLAs;
  • Experiência com a criação de dashboards técnicos e executivos;
  • Conhecimento de integração com times de desenvolvimento, produto e SRE;
  • Familiaridade com ambientes em nuvem e/ou Kubernetes;
  • Conhecimento em protocolos e infraestrutura (HTTP, TCP/IP, DNS, etc.).

Diferenciais que podem somar pontos:

  • Certificações em ferramentas de observabilidade (ex: Dynatrace Associate/Professional);
  • Conhecimento em Zabbix, Prometheus, Grafana, Elastic Stack;
  • Experiência com automação de monitoramento e auto-healing;
  • Noções de ITSM e integração com ferramentas como ServiceNow;
  • Experiência com scripts ou programação (Python, Bash, etc.) para automações leves.

Além disso, valorizamos a desenvoltura, flexibilidade, automotivação e trabalho em equipe. Defendemos a inclusão e a diversidade, por isso, criamos vagas afirmativas respeitando e priorizando os recortes minoritários em nosso processo de seleção, além de oferecermos núcleos e ações afirmativas dentro da empresa para acompanhamento, inclusão e desenvolvimento de todas as pessoas.



Junte-se a nós e ajude a impulsionar e transformar o mundo!

Required profile

Experience

Industry :
Spoken language(s):
Portuguese
Check out the description to know which languages are mandatory.

Other Skills

  • Teamwork
  • Physical Flexibility
  • Communication
  • Problem Solving

Site Reliability Engineer (SRE) Related jobs