Buscamos um(a) Engenheiro(a) de Dados Pleno para atuar em nossos processos de ingestão, tratamento e governança de dados. Essa pessoa será responsável por desenvolver pipelines de dados escaláveis, promover boas práticas de engenharia e contribuir com a arquitetura e evolução do nosso ecossistema de dados.
Implementar e manter pipelines de ingestão e transformação de dados em larga escala
Automatizar processos de extração e integração de dados (incluindo consumo de APIs)
Garantir a governança e segurança de dados por meio de boas práticas e ferramentas adequadas
Participar da modelagem de dados com foco em soluções analíticas
Monitorar e manter a performance e a integridade dos dados em diferentes camadas
Atuar na orquestração e versionamento dos processos de dados
Apoiar a construção e evolução da arquitetura de dados da companhia
Experiência sólida com AWS, especialmente:
S3 (armazenamento e ingestão de dados)
IAM (controle de acessos e permissões)
Lambda (execução de funções serverless)
Python avançado, com foco em automações, integração com APIs e manipulação de dados
Proficiência em SQL e modelagem de dados para fins analíticos
Experiência com orquestração de pipelines (Airflow ou dbt)
Familiaridade com controle de versão via Git e boas práticas de engenharia de software
Experiência com Databricks (uso de notebooks, Delta Lake, Auto Loader, DLT)
Vivência com ferramentas adicionais da AWS, como:
AWS DMS (Change Data Capture)
CloudWatch (monitoramento e alertas)
VPC (configuração de rede segura)
EC2 (execução de serviços auxiliares)
Conhecimento em arquitetura de dados em camadas
Experiência com dbt Core (modelagem, testes, documentação)
Uso de ferramentas de visualização como Metabase ou similares
Experiência com CDC em Databricks consumindo dados em S3
Interesse ou experiência com Agentic AI (copilotos autônomos, automações com LLMs)
Vimo
Outfield Healthcare Partners
Kalam Customer Experience
Wikimedia Foundation
Meridian Bioscience Inc.