Auditoria mostra que LLMs assumem leis dos EUA quando você pergunta em inglês — e por que isso é um problema para o Brasil
Estudo do arXiv mostra que LLMs assumem a moldura jurídica dos EUA em 74,5% das respostas em inglês — risco para usuários brasileiros.
Resumo: Um paper publicado no arXiv (cs.CL) em 2026 mediu como sete grandes modelos de linguagem desenvolvidos nos Estados Unidos e na China respondem a perguntas legais e administrativas sem qualquer pista de país. O resultado é desconfortável: quando o usuário escreve em inglês, 74,5% das respostas adotam o enquadramento jurídico dos EUA; quando escreve em mandarim, 53,3% adotam a moldura da China. Os autores chamam isso de “risco de seleção errada de moldura institucional” e o achado tem implicações diretas para qualquer brasileiro que pergunta sobre impostos, INSS, CLT ou SUS a um chatbot — em português ou em outra língua.
O que o estudo fez
Os pesquisadores construíram 60 prompts deliberadamente subespecificados — perguntas reais que cidadãos fazem sobre tributos, proteção do trabalho, saúde, educação, aposentadoria e procedimentos administrativos, sem citar país. Aplicaram cada prompt em inglês e em mandarim a sete LLMs de fronteira treinados nos Estados Unidos ou na China e classificaram a moldura institucional adotada na resposta.
O padrão é nítido: quando o modelo é forçado a dar uma resposta única, ele recorre a “default jurisdictions”. Inglês puxa para a moldura americana; mandarim, para a chinesa. O efeito permanece mesmo quando o usuário está claramente em outra parte do mundo (por endereço de IP, idioma de interface ou pistas no histórico). Os autores propõem uma recomendação simples para fabricantes: a interface deve perguntar a jurisdição quando não houver pista, ou avisar explicitamente em qual sistema a resposta foi formulada.
Por que importa
O Brasil é particularmente exposto. Empresas adotam ChatGPT, Claude, Gemini e DeepSeek para responder dúvidas internas de RH, jurídico, tributário e benefícios. Cidadãos pesquisam direitos trabalhistas, processos no INSS, regras do SUS e questões fiscais usando chatbots. A pesquisa não mediu português, mas o mecanismo (recorrer a uma moldura padrão quando falta contexto) é o mesmo. Quando alguém pergunta “tenho direito a férias proporcionais?” em inglês para um modelo treinado majoritariamente em conteúdo dos EUA, é razoável esperar uma resposta baseada nas leis federais e estaduais americanas — que não existem como CLT.
Status no Brasil
O cenário regulatório brasileiro reforça o problema. A LGPD restringe transferência internacional de dados pessoais. A Receita Federal e o INSS têm regras altamente específicas que LLMs estrangeiros raramente cobrem com precisão. Tribunais já registraram casos em que profissionais usaram precedentes inventados por chatbots em petições — o famoso problema das jurisprudências fictícias. O paper soma mais uma camada: além de inventar fatos, o modelo pode inventar de qual país é a lei. Para usos institucionais sérios, o ideal é combinar o LLM com uma base brasileira (RAG sobre Diário Oficial, jurisprudência do STF/STJ e CLT) e exigir que o modelo cite a fonte.
Riscos e limitações do estudo
O paper testou só duas línguas e sete modelos. É possível que com português ou espanhol o comportamento seja diferente (pode pender para EUA, pode pender para qualquer país hispanohablante, ou ser mais aleatório). Também não simula o comportamento real do produto, onde sistemas de memória, prompt do sistema e RAG corporativo mudam a resposta. Ainda assim, o sinal é forte e replicável: por baixo das interfaces, o LLM “decide” de qual sistema legal ele vai falar com base em pistas frágeis. Para profissionais brasileiros, é prudente assumir esse risco como real até prova em contrário.
Análise SWOT econômica
Estudo metodologicamente claro; achado replicável; recomendações práticas para fabricantes; agenda relevante para regulação.
Restrito a inglês e mandarim; apenas sete modelos; pouco teste em integrações reais com RAG corporativo.
Startups locais especializadas em RAG jurídico/tributário brasileiro; selo de “conformidade jurisdicional” para chatbots; consultoria.
Decisões individuais e corporativas baseadas em respostas confiantes mas erradas; processos por aconselhamento incorreto; perda de confiança em IA.
Cenário e indicativo de futuro
A correção provável virá em duas camadas. Primeiro, fabricantes de modelos vão treinar com sinais explícitos de jurisdição e mover essa pergunta para o produto — algo como “para responder com precisão, em qual país você está?”. Segundo, ecossistemas locais vão emergir: provedores brasileiros que oferecem LLMs com base em CLT, RFB e jurisprudência, integrados a chatbots empresariais. A ANPD e o CNJ podem catalisar esse movimento exigindo que sistemas que prestam orientação jurídica ou tributária indiquem explicitamente a base legal usada. Em escala mais ampla, regulação como o AI Act europeu e equivalentes asiáticas tendem a tornar a transparência de moldura uma obrigação de produto.
Conclusão prática
Três recomendações simples para times brasileiros. Primeiro, escreva sempre o país no prompt: “no Brasil, qual a regra…”. Para mensagens de WhatsApp ou voz, configure o sistema do chatbot corporativo para já injetar essa informação. Segundo, em decisões com peso financeiro ou jurídico, trate a resposta do LLM como rascunho, não como conselho — peça a citação, valide com fonte oficial e, em dúvida, consulte profissional. Terceiro, exija dos fornecedores SLA de jurisdição: contratos com ferramentas de IA usadas em RH, contabilidade e jurídico devem dizer com que base legal as respostas são formuladas e como o usuário é avisado quando a base é incerta. Esta é uma área em que saúde, finanças, jurídico, privacidade e segurança se cruzam — e a recomendação central segue válida: para casos sensíveis, procure profissional habilitado.
Fonte original: Which Institutional Frameworks Do Chatbots Assume? Auditing Jurisdictional Defaults in Multilingual LLMs — arXiv 2606.00333.
