Por que engenharia de sistemas dita o ritmo da IA: o argumento do CACM e a estreia da CAIS 2026
CACM argumenta que IA hoje e limitada por engenharia de sistemas, nao ideias. Veja como montar pipeline confiavel: SLOs, observabilidade, regressao e fallback.
Resumo: O Communications of the ACM publicou um ensaio direto: o que freia a IA hoje não é falta de ideias, é a capacidade de executá-las de forma confiável, barata e repetível em máquinas reais. O argumento sustenta a estreia da ACM CAIS 2026 (Conference on AI and Agentic Systems), realizada em San Jose entre 26 e 29 de maio. Para times brasileiros, é o sinal de migrar do “prompt + scaffold” para engenharia operacional — com SLOs, observabilidade, testes de regressão e governança de modelo. Este texto traduz o argumento e sugere um plano em seis passos.
Scaffold versus sistema
Um scaffold, no vocabulário do CACM, é uma estrutura temporária — cadeias de prompts, frameworks ad hoc, glue code — usada para extrair capacidade de modelos atuais e provar valor rapidamente. É como andaime: necessário durante a construção, mas frágil para virar prédio. Um AI software system é o prédio: durável, instrumentado, com manutenção e responsabilidade clara. A transição entre os dois é o trabalho que separa PoC de produto.
O segundo argumento do ensaio é que o gargalo migrou do laboratório para a fábrica. Modelos novos chegam toda semana; o que ainda é caro e raro é o pacote operacional capaz de hospedá-los — debug, monitoramento, observabilidade, segurança, deployment, custo por requisição, gestão de drift. A CAIS criou cadeira específica de Engineering & Operations e atribui badges de reprodutibilidade ACM aos papers que entregam métricas verificáveis.
Por que importa — e o status no Brasil
A maioria dos projetos de IA brasileiros está parada no estágio scaffold. Levantamentos da ABDI e da Fundação Dom Cabral em 2025/2026 mostram que entre 60% e 70% das iniciativas não saem do PoC; quando saem, falta arquitetura para sustentar volume e custo. O argumento do CACM oferece a justificativa técnica: o problema não é “qual modelo”, é “qual pipeline”. Em paralelo, currículos brasileiros começam a incluir cadeiras de MLOps/LLMOps: ITA, Insper, USP/IME e PUC-RJ já oferecem trilhas específicas, e o SBC organiza grupo de trabalho. CAIS 2026 deve influenciar essas iniciativas e abrir espaço para participação brasileira em 2027.
Plano em 6 passos: do scaffold ao sistema
1. Defina SLOs claros e mensuráveis
Cada caso de uso precisa de três números fixados antes do código: latência p95, taxa de sucesso definida pela área de negócio e custo por solicitação (em dólares ou reais). Sem SLO, qualquer melhoria parece pequena ou enorme — depende do dia.
2. Instrumente tracing distribuído de ponta a ponta
Use OpenTelemetry com spans dedicados para chamadas a modelos, ferramentas e bancos. Ferramentas como Langfuse, Helicone, Phoenix (Arize) ou New Relic AI Observability ajudam a fechar a foto. Sem trace, depuração de agente vira arqueologia.
3. Versione prompts, modelos e dados juntos
Use Git para prompts, MLflow ou DVC para modelos e datasets. O conjunto (prompt + modelo + dado + retrieval) deve ser tag única — sem isso, impossível reproduzir incidentes.
4. Crie guardrails de segurança e viés
Camadas de input/output validation (Guardrails AI, NeMo Guardrails, Llama Guard) e revisões periódicas com red teaming. Inclua testes de prompt injection, jailbreak e exfiltração — o caso recente do agente da Meta no Instagram mostra como o vetor é real.
5. Implemente política de fallback
Defina o comportamento quando o modelo principal falha: degradar para modelo menor, devolver mensagem padrão, ou escalar para humano. Documente o switch e exponha em métrica. Sistemas sem fallback têm SLA imaginário.
6. Construa teste de regressão com golden set
Reúna entre 50 e 500 casos representativos — incluindo edge cases — e rode a cada release. Use ferramentas como LangSmith, Promptfoo ou DeepEval para automatizar. É o equivalente moderno de unit test para LLM.
Riscos e limitações
Há perigo de sobre-engenharia em fase de descoberta: trazer toda a estrutura de SLO/observabilidade/regressão para um experimento de duas semanas mata o MVP. A engenharia de sistemas é remédio para quem está saindo do scaffold — não para quem ainda está validando hipótese. Há também escassez de profissionais com background combinado de SRE e ML: o mercado brasileiro paga prêmio alto para esse perfil em 2026.
Cenário até 2027
Esperamos consolidação de plataformas LLMOps (Databricks, Vertex AI, Bedrock, Azure AI Studio, plus novos entrantes), padronização de OpenTelemetry para IA, e a primeira leva de cursos brasileiros estruturados em “engenharia de sistemas de IA”. CAIS 2027 deve ter delegação latino-americana presente, e a SBC pode lançar trilha específica.
Conclusão prática
O salto de desempenho que sua aplicação precisa em 2026 raramente está em um modelo novo. Está em transformar o pipeline atual em algo que tolera falha, evolui de forma controlada e mostra valor mensurável. Comece pelos SLOs e pelo golden set; o resto vai cair naturalmente.
Fonte original: Why Systems Engineering Increasingly Sets the Pace of AI Progress — Communications of the ACM.
