Auditoria mostra que LLMs assumem leis dos EUA quando você pergunta em inglês — e por que isso é um problema para o Brasil

Resumo: Um paper publicado no arXiv (cs.CL) em 2026 mediu como sete grandes modelos de linguagem desenvolvidos nos Estados Unidos e na China respondem a perguntas legais e administrativas sem qualquer pista de país. O resultado é desconfortável: quando o usuário escreve em inglês, 74,5% das respostas adotam o enquadramento jurídico dos EUA; quando escreve em mandarim, 53,3% adotam a moldura da China. Os autores chamam isso de “risco de seleção errada de moldura institucional” e o achado tem implicações diretas para qualquer brasileiro que pergunta sobre impostos, INSS, CLT ou SUS a um chatbot — em português ou em outra língua.

O que o estudo fez

Os pesquisadores construíram 60 prompts deliberadamente subespecificados — perguntas reais que cidadãos fazem sobre tributos, proteção do trabalho, saúde, educação, aposentadoria e procedimentos administrativos, sem citar país. Aplicaram cada prompt em inglês e em mandarim a sete LLMs de fronteira treinados nos Estados Unidos ou na China e classificaram a moldura institucional adotada na resposta.

O padrão é nítido: quando o modelo é forçado a dar uma resposta única, ele recorre a “default jurisdictions”. Inglês puxa para a moldura americana; mandarim, para a chinesa. O efeito permanece mesmo quando o usuário está claramente em outra parte do mundo (por endereço de IP, idioma de interface ou pistas no histórico). Os autores propõem uma recomendação simples para fabricantes: a interface deve perguntar a jurisdição quando não houver pista, ou avisar explicitamente em qual sistema a resposta foi formulada.

Por que importa

O Brasil é particularmente exposto. Empresas adotam ChatGPT, Claude, Gemini e DeepSeek para responder dúvidas internas de RH, jurídico, tributário e benefícios. Cidadãos pesquisam direitos trabalhistas, processos no INSS, regras do SUS e questões fiscais usando chatbots. A pesquisa não mediu português, mas o mecanismo (recorrer a uma moldura padrão quando falta contexto) é o mesmo. Quando alguém pergunta “tenho direito a férias proporcionais?” em inglês para um modelo treinado majoritariamente em conteúdo dos EUA, é razoável esperar uma resposta baseada nas leis federais e estaduais americanas — que não existem como CLT.

Status no Brasil

O cenário regulatório brasileiro reforça o problema. A LGPD restringe transferência internacional de dados pessoais. A Receita Federal e o INSS têm regras altamente específicas que LLMs estrangeiros raramente cobrem com precisão. Tribunais já registraram casos em que profissionais usaram precedentes inventados por chatbots em petições — o famoso problema das jurisprudências fictícias. O paper soma mais uma camada: além de inventar fatos, o modelo pode inventar de qual país é a lei. Para usos institucionais sérios, o ideal é combinar o LLM com uma base brasileira (RAG sobre Diário Oficial, jurisprudência do STF/STJ e CLT) e exigir que o modelo cite a fonte.

Riscos e limitações do estudo

O paper testou só duas línguas e sete modelos. É possível que com português ou espanhol o comportamento seja diferente (pode pender para EUA, pode pender para qualquer país hispanohablante, ou ser mais aleatório). Também não simula o comportamento real do produto, onde sistemas de memória, prompt do sistema e RAG corporativo mudam a resposta. Ainda assim, o sinal é forte e replicável: por baixo das interfaces, o LLM “decide” de qual sistema legal ele vai falar com base em pistas frágeis. Para profissionais brasileiros, é prudente assumir esse risco como real até prova em contrário.

Análise SWOT econômica

Forças
Estudo metodologicamente claro; achado replicável; recomendações práticas para fabricantes; agenda relevante para regulação.

Fraquezas
Restrito a inglês e mandarim; apenas sete modelos; pouco teste em integrações reais com RAG corporativo.

Oportunidades
Startups locais especializadas em RAG jurídico/tributário brasileiro; selo de “conformidade jurisdicional” para chatbots; consultoria.

Ameaças
Decisões individuais e corporativas baseadas em respostas confiantes mas erradas; processos por aconselhamento incorreto; perda de confiança em IA.

Cenário e indicativo de futuro

A correção provável virá em duas camadas. Primeiro, fabricantes de modelos vão treinar com sinais explícitos de jurisdição e mover essa pergunta para o produto — algo como “para responder com precisão, em qual país você está?”. Segundo, ecossistemas locais vão emergir: provedores brasileiros que oferecem LLMs com base em CLT, RFB e jurisprudência, integrados a chatbots empresariais. A ANPD e o CNJ podem catalisar esse movimento exigindo que sistemas que prestam orientação jurídica ou tributária indiquem explicitamente a base legal usada. Em escala mais ampla, regulação como o AI Act europeu e equivalentes asiáticas tendem a tornar a transparência de moldura uma obrigação de produto.

Conclusão prática

Três recomendações simples para times brasileiros. Primeiro, escreva sempre o país no prompt: “no Brasil, qual a regra…”. Para mensagens de WhatsApp ou voz, configure o sistema do chatbot corporativo para já injetar essa informação. Segundo, em decisões com peso financeiro ou jurídico, trate a resposta do LLM como rascunho, não como conselho — peça a citação, valide com fonte oficial e, em dúvida, consulte profissional. Terceiro, exija dos fornecedores SLA de jurisdição: contratos com ferramentas de IA usadas em RH, contabilidade e jurídico devem dizer com que base legal as respostas são formuladas e como o usuário é avisado quando a base é incerta. Esta é uma área em que saúde, finanças, jurídico, privacidade e segurança se cruzam — e a recomendação central segue válida: para casos sensíveis, procure profissional habilitado.

Fonte original: Which Institutional Frameworks Do Chatbots Assume? Auditing Jurisdictional Defaults in Multilingual LLMs — arXiv 2606.00333.

Auditoria mostra que LLMs assumem leis dos EUA quando você pergunta em inglês — e por que isso é um problema para o Brasil

O que o estudo fez

Por que importa

Status no Brasil

Riscos e limitações do estudo

Análise SWOT econômica

Cenário e indicativo de futuro

Conclusão prática

Meta demite 8 mil, realoca 7 mil em IA e aposta em pendente e Wearables for Work: o que muda no Brasil

UniAIR, a IA da Nature que prevê o efeito de mutações no sistema imune — e o que isso muda para vacinas no Brasil

IA turbinou cientistas, mas encolheu a ciência: o que 41,3 milhões de papers dizem ao Brasil

Deixe um comentário Cancelar resposta

Tutorial Fooocus completo: instalar, usar inpaint, outpaint, upscale e face swap passo a passo

15 prompts prontos para gerar imagens no SDXL e Fooocus — retrato, produto e marketing (2026)

15 prompts prontos em português para reuniões, e-mails e produtividade no trabalho (2026)

Fooocus: o gerador de imagens local que junta a simplicidade do Midjourney com o controle do SDXL