{"id":244,"date":"2026-06-20T06:11:11","date_gmt":"2026-06-20T09:11:11","guid":{"rendered":"https:\/\/plugged.ninja\/ai\/empresas\/nature-machine-intelligence-unfamiliarity-descoberta-farmacos-ml-2026\/"},"modified":"2026-06-20T06:11:11","modified_gmt":"2026-06-20T09:11:11","slug":"nature-machine-intelligence-unfamiliarity-descoberta-farmacos-ml-2026","status":"publish","type":"post","link":"https:\/\/plugged.ninja\/ai\/empresas\/nature-machine-intelligence-unfamiliarity-descoberta-farmacos-ml-2026\/","title":{"rendered":"Nature Machine Intelligence: nova m\u00e9trica &#8220;unfamiliarity&#8221; mostra quando o ML pode ser confi\u00e1vel na descoberta de f\u00e1rmacos"},"content":{"rendered":"<p><strong>Resumo:<\/strong> A revista <em>Nature Machine Intelligence<\/em> publicou em junho de 2026 o trabalho <em>Molecular deep learning at the edge of chemical space<\/em>, que prop\u00f5e uma nova m\u00e9trica chamada <em>unfamiliarity<\/em> para medir, antes de qualquer ensaio, quando um modelo de aprendizado de m\u00e1quina molecular pode ser confi\u00e1vel fora dos dados em que foi treinado. A m\u00e9trica foi validada em mais de 30 conjuntos de dados de bioatividade e ajudou a descobrir inibidores ativos contra dois alvos quinase clinicamente relevantes. Para empresas de descoberta de f\u00e1rmacos, \u00e9 uma resposta direta a uma das maiores fraquezas do ML em qu\u00edmica: a generaliza\u00e7\u00e3o.<\/p>\n<h2>O problema: ML que s\u00f3 v\u00ea o que j\u00e1 viu<\/h2>\n<p>Modelos de propriedade molecular treinados em datasets como ChEMBL ou MoleculeNet costumam acertar dentro da distribui\u00e7\u00e3o qu\u00edmica do treino \u2014 e errar feio quando o qu\u00edmico medicinal manda uma mol\u00e9cula com um scaffold novo, exatamente onde a descoberta de f\u00e1rmacos importa. Esse <em>distribution shift<\/em> \u00e9 o equivalente em qu\u00edmica do que os aut\u00f4nomos enfrentam em estradas n\u00e3o mapeadas: o modelo opera, mas n\u00e3o sabe que n\u00e3o sabe.<\/p>\n<h2>O que \u00e9 &#8220;unfamiliarity&#8221;<\/h2>\n<p>Os autores prop\u00f5em treinar um modelo que faz duas coisas ao mesmo tempo: prever a propriedade (ex.: afinidade ao alvo) <strong>e<\/strong> reconstruir a mol\u00e9cula a partir do seu embedding. A qualidade da reconstru\u00e7\u00e3o vira um term\u00f4metro: quanto pior o modelo reconstr\u00f3i, mais &#8220;desconhecida&#8221; a mol\u00e9cula \u00e9 para ele \u2014 da\u00ed o nome <em>unfamiliarity<\/em>. A m\u00e9trica funciona como um indicador pr\u00e9vio: antes de confiar na predi\u00e7\u00e3o de bioatividade, o qu\u00edmico medicinal olha o n\u00famero de unfamiliarity e decide se faz sentido investir bancada.<\/p>\n<h2>Resultados que chamam a aten\u00e7\u00e3o<\/h2>\n<p>Em an\u00e1lise sistem\u00e1tica sobre mais de 30 datasets de bioatividade, a unfamiliarity:<\/p>\n<ul>\n<li>Identificou de forma robusta mol\u00e9culas <em>out-of-distribution<\/em>.<\/li>\n<li>Previu, com correla\u00e7\u00e3o alta, a queda de performance do classificador em regi\u00f5es novas do espa\u00e7o qu\u00edmico.<\/li>\n<li>Permitiu, na valida\u00e7\u00e3o experimental, encontrar inibidores ativos de dois alvos quinase relevantes para c\u00e2ncer \u2014 mostrando que o m\u00e9todo n\u00e3o \u00e9 s\u00f3 estat\u00edstica, ele aponta para mol\u00e9culas que de fato funcionam.<\/li>\n<\/ul>\n<h2>Por que importa<\/h2>\n<p>Toda a ind\u00fastria farmac\u00eautica que aposta em ML para reduzir custo de R&amp;D enfrenta o mesmo dilema: quanto confiar em uma predi\u00e7\u00e3o? Sem unfamiliarity (ou m\u00e9trica equivalente), um modelo entrega ranking sem dizer onde est\u00e1 adivinhando. Com a m\u00e9trica, o pipeline ganha um <em>gate<\/em> objetivo entre o ML e o ensaio caro. Isso muda como CROs, biotechs e big pharmas alocam capital \u2014 e como contratos de IA com fornecedores podem ser estruturados (por exemplo, pagamento vari\u00e1vel por confian\u00e7a da predi\u00e7\u00e3o).<\/p>\n<h2>Status no Brasil<\/h2>\n<p>O Brasil tem laborat\u00f3rios fortes em qu\u00edmica medicinal (LADETEC\/UFRJ, UNICAMP, IFSC-USP, Fiocruz) e iniciativas nascentes em IA para descoberta \u2014 incluindo o programa Brazilian AI Drug Discovery e parcerias com EMBRAPII. A barreira hist\u00f3rica \u00e9 dado: bibliotecas qu\u00edmicas reais e ensaios pareados s\u00e3o caros e pouco compartilhados. A unfamiliarity ajuda aqui de duas formas: (1) viabiliza usar modelos pr\u00e9-treinados em ChEMBL com mais seguran\u00e7a em s\u00e9ries qu\u00edmicas pr\u00f3prias; (2) abre caminho para combinar ML com qu\u00edmica computacional cl\u00e1ssica (docking, MD) s\u00f3 quando a m\u00e9trica disser que vale o custo. Empresas como Ach\u00e9, Eurofarma e Crist\u00e1lia t\u00eam muito a ganhar embutindo isso nas etapas iniciais de hit-to-lead.<\/p>\n<h2>Riscos e limita\u00e7\u00f5es<\/h2>\n<p>Tr\u00eas pontos a observar. (1) Unfamiliarity mede dist\u00e2ncia no espa\u00e7o de embeddings \u2014 se o embedding \u00e9 pobre, a m\u00e9trica tamb\u00e9m \u00e9. (2) O m\u00e9todo foi validado em alvos quinase; transferir para outros (GPCRs, prote\u00ednas desordenadas, RNA) ainda exige replica\u00e7\u00e3o. (3) A &#8220;unfamiliarity baixa&#8221; n\u00e3o significa &#8220;predi\u00e7\u00e3o boa&#8221; \u2014 apenas &#8220;predi\u00e7\u00e3o dentro da distribui\u00e7\u00e3o&#8221;; o modelo ainda pode errar por motivos estat\u00edsticos cl\u00e1ssicos. A leitura correta \u00e9: descartar mol\u00e9culas com alta unfamiliarity, validar experimentalmente as de baixa unfamiliarity com bom score.<\/p>\n<h2>An\u00e1lise SWOT econ\u00f4mica<\/h2>\n<div style=\"display:grid;grid-template-columns:1fr 1fr;gap:14px;margin:18px 0\">\n<div style=\"background:#e6f4ea;border-left:6px solid #1e8e3e;padding:14px 16px;border-radius:8px\">\n<h3 style=\"margin-top:0;color:#1e8e3e\">For\u00e7as<\/h3>\n<ul style=\"margin:0;padding-left:18px\">\n<li>M\u00e9trica simples, derivada do pr\u00f3prio modelo \u2014 sem custo de infer\u00eancia adicional.<\/li>\n<li>Valida\u00e7\u00e3o experimental real, n\u00e3o s\u00f3 benchmark sint\u00e9tico.<\/li>\n<li>Compat\u00edvel com qualquer pipeline que use embeddings moleculares.<\/li>\n<\/ul><\/div>\n<div style=\"background:#fef3e2;border-left:6px solid #e67c00;padding:14px 16px;border-radius:8px\">\n<h3 style=\"margin-top:0;color:#e67c00\">Fraquezas<\/h3>\n<ul style=\"margin:0;padding-left:18px\">\n<li>Depende fortemente da qualidade do encoder.<\/li>\n<li>N\u00e3o substitui valida\u00e7\u00e3o experimental.<\/li>\n<li>Curva de aprendizado para times de qu\u00edmica sem ML in-house.<\/li>\n<\/ul><\/div>\n<div style=\"background:#e3eefc;border-left:6px solid #1a73e8;padding:14px 16px;border-radius:8px\">\n<h3 style=\"margin-top:0;color:#1a73e8\">Oportunidades<\/h3>\n<ul style=\"margin:0;padding-left:18px\">\n<li>Servir de gate em contratos de IA com pharma (pagamento por confian\u00e7a).<\/li>\n<li>Plataformas SaaS de descoberta podem expor o n\u00famero como API.<\/li>\n<li>Acelera\u00e7\u00e3o de hit-to-lead com menor desperd\u00edcio de ensaio.<\/li>\n<\/ul><\/div>\n<div style=\"background:#fde7e9;border-left:6px solid #c5221f;padding:14px 16px;border-radius:8px\">\n<h3 style=\"margin-top:0;color:#c5221f\">Amea\u00e7as<\/h3>\n<ul style=\"margin:0;padding-left:18px\">\n<li>Concorr\u00eancia de m\u00e9tricas propriet\u00e1rias de big pharmas e CROs.<\/li>\n<li>Risco regulat\u00f3rio: ag\u00eancias querem crit\u00e9rios reproduz\u00edveis para validar modelos.<\/li>\n<li>Depend\u00eancia de qualidade do dataset de treino, que segue desigual no setor.<\/li>\n<\/ul><\/div>\n<\/div>\n<h2>Cen\u00e1rio para os pr\u00f3ximos 12 meses<\/h2>\n<p>Esperamos que a unfamiliarity (ou variantes) entre como crit\u00e9rio em pipelines de empresas como Recursion, Insitro, Schr\u00f6dinger e parceiros brasileiros, e que apare\u00e7am camadas open source (RDKit, DeepChem) implementando a m\u00e9trica. Em paralelo, FDA e EMA devem incorporar discuss\u00f5es sobre &#8220;confidence-aware ML&#8221; em guidance sobre uso de IA em descoberta de f\u00e1rmacos \u2014 o Brasil, via ANVISA, deve seguir a tend\u00eancia alguns trimestres depois.<\/p>\n<h2>Conclus\u00e3o pr\u00e1tica<\/h2>\n<p>Para times de descoberta, o recado \u00e9: pare de ranquear mol\u00e9culas s\u00f3 por <em>predicted score<\/em>; combine sempre com uma m\u00e9trica de confian\u00e7a como a unfamiliarity. Para gestores de plataforma, \u00e9 hora de revisar contratos com fornecedores de IA molecular e exigir relat\u00f3rio por mol\u00e9cula que inclua score + m\u00e9trica de confian\u00e7a. Como em qualquer aplica\u00e7\u00e3o de IA em sa\u00fade, valida\u00e7\u00e3o experimental e revis\u00e3o humana qualificada continuam n\u00e3o-negoci\u00e1veis.<\/p>\n<p><strong>Fonte original:<\/strong> <a href=\"https:\/\/www.nature.com\/articles\/s42256-026-01216-w\" target=\"_blank\" rel=\"noopener nofollow\">Nature Machine Intelligence \u2014 Molecular deep learning at the edge of chemical space<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nova m\u00e9trica publicada na Nature Machine Intelligence mede quando um modelo de ML molecular est\u00e1 extrapolando \u2014 e foi validada experimentalmente em alvo&#8230;<\/p>\n","protected":false},"author":1,"featured_media":245,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5],"tags":[],"class_list":["post-244","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-empresas"],"_links":{"self":[{"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/posts\/244","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/comments?post=244"}],"version-history":[{"count":0,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/posts\/244\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/media\/245"}],"wp:attachment":[{"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/media?parent=244"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/categories?post=244"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/plugged.ninja\/ai\/wp-json\/wp\/v2\/tags?post=244"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}