Fooocus: o gerador de imagens local que junta a simplicidade do Midjourney com o controle do SDXL

0

Fooocus, do criador do ControlNet, oferece geração de imagens SDXL offline, gratuita e simples — 4 GB de VRAM, instalação em 3 cliques e inpaint próprio.

Fooocus: o gerador de imagens local que junta a simplicidade do Midjourney com o controle do SDXL

Resumo: O Fooocus é um gerador de imagens por IA criado por lllyasviel — o mesmo pesquisador por trás do ControlNet — que mira no melhor de dois mundos: a simplicidade de produto do Midjourney e a liberdade de um app local, gratuito e offline. Construído sobre Stable Diffusion XL e Gradio, roda em GPUs Nvidia a partir de 4 GB de VRAM, instala em menos de três cliques e traz inpaint, outpaint, image prompt e face swap próprios. O projeto tem 49,5 mil estrelas no GitHub, atualmente está em fase de suporte estendido (LTS) com apenas correções de bugs e a versão atual do instalador para Windows é a 2.5.0.

O que é o Fooocus

O Fooocus é descrito pelo próprio autor como uma “repensada do design de geradores de imagens”. A ideia central é remover do caminho do usuário todo o ritual técnico que costuma travar quem chega ao Stable Diffusion: escolher sampler, ajustar CFG, configurar VAE, montar prompt em sintaxe complicada, mexer em refiner. No Fooocus, o usuário abre o app, escreve um prompt em linguagem natural — pode ser “house in garden” ou pode ter mil palavras — e clica em gerar. Por baixo, o programa já cuidou de aplicar melhorias de sampling, expansão de prompt com um modelo GPT-2 local, estilos pré-configurados e parâmetros calibrados.

O resultado é um produto que se parece muito com Midjourney no fluxo, mas com três diferenças importantes: roda no seu computador, é gratuito e o código é aberto. Não há mensalidade, fila, censura de servidor nem limite de gerações por dia. As imagens nunca saem da máquina, o que é decisivo para quem trabalha com material confidencial ou simplesmente prefere privacidade.

Recursos que importam

A interface, simples na superfície, esconde um conjunto razoável de ferramentas. Há inpaint e outpaint com algoritmo e modelo próprios do Fooocus — segundo o autor, com qualidade superior aos métodos SDXL padrão. Há Image Prompt (equivalente ao “/imagine com referência” do Midjourney), FaceSwap via InsightFace, Describe para extrair prompt a partir de uma imagem existente, Upscale 1,5× e 2×, e variações sutil/forte de uma mesma composição. Pesos de prompt seguem a sintaxe do Automatic1111 — `”I am (happy:1.5)”` — o que ajuda na hora de copiar prompts do Civitai sem retrabalho.

Os preset launchers run.bat, run_anime.bat e run_realistic.bat mudam o conjunto de modelos e estilos em um clique. Quem quer experimentar checkpoints da comunidade pode baixar do Civitai e jogar na pasta de modelos. Para quem não tem GPU, o repositório oferece um notebook oficial para Google Colab.

Por que importa e o status no Brasil

O Fooocus é hoje uma das melhores portas de entrada para quem quer aprender geração de imagens sem cair direto no labirinto do ComfyUI. Para o público brasileiro, três pontos pesam. Primeiro, custo: assinatura mensal de Midjourney ou Adobe Firefly soma rapidamente em real depois do câmbio, enquanto o Fooocus é grátis. Segundo, hardware: rodar em uma RTX 3060 de 6 GB — comum em notebooks gamer — entrega cerca de 1,35 segundo por iteração, faixa muito utilizável. Terceiro, privacidade: agências, designers freelance, fotógrafos e quem produz material para clientes podem gerar sem mandar nada para a nuvem.

Há ainda um benefício pedagógico. Como o Fooocus expõe gradualmente os controles avançados (Style, Guidance, Sharpness, Negative Prompt, Aspect Ratio), serve como rampa de aprendizado para depois migrar a quem quiser para WebUI Forge — outro projeto do mesmo autor — ou para o ComfyUI/SwarmUI.

Riscos e limitações

O alerta mais importante vem do próprio README: o projeto está em Limited Long-Term Support. Isso significa que o autor não pretende adicionar novas arquiteturas, apenas corrigir bugs. Quem quiser gerar com FLUX, SD3 ou modelos posteriores deve olhar para WebUI Forge, ComfyUI ou SwarmUI. Para SDXL, no entanto, o Fooocus continua entregando qualidade de ponta — e SDXL ainda é base sólida para muito caso de uso.

Outros pontos de atenção: AMD e Mac têm suporte beta, não testado intensivamente; existe um lote enorme de sites falsos (fooocus.com, fooocus.net, fooocus.ai etc.) que se passam pelo projeto — o único canal oficial é o repositório no GitHub; e, como em qualquer ferramenta generativa, há responsabilidade do operador: face swap, geração de pessoas reais e conteúdo sensível exigem cuidado ético e legal. Para questões envolvendo direito de imagem, propriedade intelectual ou uso comercial em larga escala, vale consultar um profissional de jurídico ou direito autoral antes.

Análise SWOT econômica

Forças
Gratuito, offline, open source; instalação em 3 cliques; inpaint próprio; roda em 4 GB VRAM; autor é o mesmo do ControlNet.
Fraquezas
Travado em SDXL; em modo LTS sem novas features; AMD/Mac beta; carece de animação/vídeo nativos; sem API REST oficial.
Oportunidades
Substituir assinaturas pagas em agências e estúdios; treinamento em escolas e bootcamps; uso por times de marketing com dados sensíveis.
Ameaças
Concorrência forte de FLUX e modelos de vídeo; risco de obsolescência se ficar só no SDXL; sites falsos prejudicam reputação.

Como instalar (versão curta)

No Windows, baixe o pacote Fooocus_win64_2-5-0.7z direto do GitHub, descompacte e rode run.bat. Os modelos SDXL padrão (1,3 GB cada) baixam automaticamente na primeira execução. Para gerar imagens em estilo anime ou realista, use run_anime.bat ou run_realistic.bat. No Linux, clone o repositório, crie um ambiente com Anaconda ou venv, instale o requirements_versions.txt e rode python entry_with_update.py. No Mac M1/M2, o caminho passa por PyTorch nightly com MPS, com performance bem mais lenta que GPUs dedicadas. Em qualquer caso, deixe pelo menos 40 GB livres em disco — modelos, cache e imagens geradas ocupam bastante espaço.

Cenário e indicativo de futuro

O Fooocus ocupa hoje um nicho confortável: SDXL maduro, qualidade alta para a maioria dos prompts, fluxo simples. A pergunta de médio prazo é o que acontece quando a comunidade convergir definitivamente para FLUX ou para o próximo paradigma. O próprio autor diz que reavaliará migrar se isso ocorrer “em meio a um ou dois anos”. Para quem precisa de uma ferramenta produtiva agora, isso não muda quase nada — mas vale acompanhar o tema antes de planejar um pipeline corporativo de longo prazo em cima do Fooocus puro.

Conclusão prática

Para um designer freelancer, agência de marketing ou produtor de conteúdo no Brasil, vale testar o Fooocus em paralelo com a ferramenta paga que já se usa. Em uma semana de uso é possível medir três coisas: qualidade percebida das imagens, tempo médio por entrega e economia em real. Se o conjunto fechar, o ROI aparece rápido — uma única assinatura mensal cancelada já paga o esforço de aprender o app. Para empresas que precisam manter material confidencial fora da nuvem, é a opção mais simples e robusta hoje disponível em SDXL. E para quem quer começar a estudar geração de imagens, é o primeiro passo recomendado antes de subir para Forge ou ComfyUI.

Fonte original: lllyasviel/Fooocus — Focus on prompting and generating (GitHub).

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *