O profissional será responsável por projetar, desenvolver e aprimorar soluções baseadas em IA Generativa, com foco em escalabilidade, governança e integração com metas empresariais, utilizando modelos de linguagem, arquiteturas RAG e práticas consolidadas de engenharia de software aplicadas à inteligência artificial.
Responsabilidades
- Projetar e colocar em prática soluções com modelos de IA Generativa, incluindo LLMs, RAG, ajuste fino e embeddings.
- Desenvolver integrações com APIs de modelos fundamentais e serviços de inteligência artificial.
- Organizar pipelines de dados para ingestão, preparação e recuperação eficiente de informações.
- Implementar arquiteturas RAG com ênfase em desempenho e segurança.
- Colaborar com equipes de dados, arquitetura e produto na definição de casos de uso e priorização técnica.
- Assegurar boas práticas no versionamento de prompts, avaliação de modelos e monitoramento de respostas geradas.
- Participar da definição de padrões de governança, segurança e uso ético da IA.
- Executar testes, benchmarks e otimizações de custo e desempenho.
Requisitos
- Formação acadêmica em Ciência da Computação, Engenharia ou áreas relacionadas.
- Experiência prática com modelos de linguagem de grande porte (LLMs) e frameworks de orquestração como LangChain, LlamaIndex ou similares.
- Conhecimento sólido em Python e bibliotecas de IA e aprendizado de máquina.
- Experiência com APIs, microsserviços e arquitetura em nuvem.
- Familiaridade com conceitos de processamento de linguagem natural, embeddings, vetorização e bancos de dados vetoriais.
- Capacidade analítica e foco na resolução de problemas complexos.
Diferenciais
- Conhecimento em gateway de IA.
- Experiência com ferramentas de agentes como Agent Core, Gemini Enterprise e CrewAI.
Stack técnico
LLMs, RAG, fine-tuning, embeddings, LangChain, LlamaIndex, Python, NLP, vetores, bancos vetoriais, APIs, microsserviços, arquitetura cloud, Agent Core, Gemini Enterprise, CrewAI
Modalidade
híbrido
Informações adicionais
- Vaga híbrida
