Quando chegamos à Ezatta, o problema parecia simples: o sistema de gestão sabia o estoque atual, mas não conseguia prever quando iam faltar peças críticas antes que a linha de produção parasse. O resultado: compras emergenciais, paradas não planejadas e custos que podiam ser evitados.

O desafio técnico, porém, era real — não poderíamos substituir o ERP existente. Precisávamos acoplar inteligência sem refazer o sistema.

O problema com sistemas de inventário tradicionais

ERPs clássicos operam em lógica reativa: alertam quando o estoque já chegou ao ponto de ressuprimento. Para indústrias com lead time longo de fornecedores ou sazonalidade de demanda, isso chega tarde demais.

A Ezatta tinha dados históricos de consumo por SKU, dados de fornecedor (prazo, MOQ, variabilidade) e dados de produção planejada. Tudo estava no banco — mas nenhuma camada de análise os cruzava de forma preditiva.

// O DIAGNÓSTICO

Os dados existiam. O que faltava era uma camada de raciocínio que os cruzasse automaticamente e gerasse sugestões acionáveis — não relatórios para um analista interpretar.

A arquitetura: agente de IA acoplado, não integrado

Optamos por um modelo de agente autônomo em camada separada, que lê os dados do ERP via API interna, processa e escreve sugestões de volta em uma tabela específica. O ERP em si não foi tocado.

A stack que escolhemos para o agente:

  • Python + FastAPI — microserviço do agente
  • PostgreSQL — leitura do banco existente (read replica para não onerar produção)
  • LLM com RAG — para interpretar histórico e gerar texto explicativo das sugestões
  • Scheduler interno — rodadas automáticas diárias + on-demand via painel

Como o agente raciocina

O ciclo de análise do agente segue quatro etapas:

  1. Coleta — puxa consumo dos últimos 90 dias por SKU, estoque atual e pedidos em aberto
  2. Projeção — calcula taxa de consumo médio ponderando sazonalidade e produção planejada
  3. Cruzamento com lead time — compara a data prevista de ruptura com o prazo do fornecedor
  4. Sugestão — gera ordem de compra sugerida com quantidade, fornecedor recomendado e janela ideal de pedido

O texto da sugestão é gerado por LLM — não para parecer inteligente, mas para que o gestor entenda por que o sistema está recomendando aquela ação. Isso eliminou a "caixa preta" que normalmente afasta usuários de sistemas de IA.

"Recomendo pedido de 240 unidades do SKU A-1042 até 15/07. Consumo atual: 18 un/dia. Estoque disponível cobre 11 dias. Lead time do fornecedor principal: 14 dias. Janela de compra segura encerra em 3 dias."

O resultado em produção

Seis semanas após o go-live, os primeiros números consolidados apareceram. O mais relevante: a Ezatta zerou rupturas nos SKUs monitorados durante o trimestre de análise. Os pedidos emergenciais (que carregam custo logístico e de negociação) caíram de forma expressiva.

O ganho secundário foi igualmente importante: o gestor de compras passou de reativo (apagando incêndios) para estratégico (aprovando sugestões e negociando com antecedência).

O que aprendemos sobre IA industrial

O maior erro que vemos em projetos de IA industrial é tentar resolver tudo de uma vez. A Ezatta funcionou porque limitamos o escopo: um problema, um agente, dados confiáveis.

IA acoplada ao sistema existente tem três vantagens sobre uma reescrita completa:

  • Risco zero de interrupção na operação
  • Adoção mais rápida (usuários continuam na mesma interface)
  • Facilidade de rollback se algo não funcionar como esperado
// LIÇÃO PRINCIPAL

Antes de escolher qual modelo de IA usar, garanta que seus dados históricos são consistentes. Nenhum modelo compensa dados sujos — e a maioria dos projetos de IA falha aí, não no algoritmo.

Próximos passos no projeto

A segunda fase do projeto já está em discussão: expandir o agente para incluir análise de qualidade do fornecedor (prazo real vs. prazo prometido) e integração com o módulo de produção para ajustar projeções com base no plano de manufatura semanal.

Se você tem um sistema legado com dados históricos e quer entender como uma camada de IA pode ser acoplada sem reescrever tudo, é exatamente esse tipo de projeto que fazemos.