Descrição da vagaA FCamara está em busca de uma pessoa SRE Pleno.
Essa pessoa atuará no time de MLOps, responsável por garantir a confiabilidade, escalabilidade e eficiência da infraestrutura que suporta os modelos e pipelines de Machine Learning em produção.
Trabalhamos em um ambiente colaborativo, com forte cultura de engenharia e incentivo ao desenvolvimento contínuo.
Tudo isso em uma empresa líder no mercado brasileiro de farmácia, referência em Saúde e Bem-estar com mais ***** lojas em todos os estados brasileiros.Responsabilidades e atribuiçõesResponsabilidades:Implementar e manter infraestrutura como código utilizando Terraform, seguindo padrões e boas práticas já estabelecidos pelo time.Operar e dar manutenção em clusters Kubernetes, utilizando Helm e práticas de GitOps para suporte à entrega contínua de aplicações.Atuar na operação do dia a dia de ambientes AWS, contribuindo para a disponibilidade e estabilidade das o diagnóstico de problemas de rede em cloud providers, atuando em conjunto com membros mais sêniores do time em cenários mais complexos.Manter pipelines de CI/CD com GitLab, colaborando com times de desenvolvimento e dados.Acompanhar e utilizar ferramentas de monitoramento e observabilidade (Prometheus, Grafana, Datadog) para identificar anomalias e apoiar a resposta a incidentes.Participar de processos de resposta a incidentes e post-mortems, contribuindo com análises e implementação de melhorias.Apoiar iniciativas de FinOps, auxiliando na identificação de oportunidades de otimização de custos na nuvem.Requisitos e qualificaçõesRequisitos TécnicosObrigatóriosExperiência prática com Terraform para gerenciamento de infraestrutura como código.Conhecimento sólido em AWS.Conhecimento intermediário em Kubernetes, incluindo uso de Helm e fluxos GitOps.Conhecimento intermediário em GitLab (pipelines, CI/CD, repositórios).
Capacidade de diagnóstico em redes em ambientes cloud (VPC, security groups, DNS, load balancers, etc.).
Bom domínio de Linux e administração de sistemas.Familiaridade com ferramentas de observabilidade: Prometheus, Grafana e :Conhecimento introdutório de práticas de FinOps em ambientes cloud.Experiência ou interesse em ambientes de MLOps ou Data EngineeringPerfil comportamentalBoa capacidade de resolução de problemas e raciocínio analítico, com vontade de evoluir em cenários de infraestrutura e sistemas distribuídos.Comunicação clara e facilidade para trabalhar em equipe multidisciplinar.Perfil com senso de dono, proativo e aberto a aprender com o time.