Prometheus, da Majestic Labs: o servidor de 128 TB que quer derrubar o memory wall da IA

0

A Majestic Labs lançou o Prometheus, servidor com 128 TB de LPDDR6 e chips Ignite, que promete substituir 10 racks de GPU em modelos de IA gigantes.

majestic-labs-prometheus-128tb-memory-wall-ia-2026

Resumo: A Majestic Labs, startup fundada por ex-engenheiros de Google e Meta, apresentou o Prometheus: um servidor de rack único com até 128 TB de memória LPDDR6 compartilhada e 12 chips Ignite — um SoC próprio que combina núcleos ARM, vetoriais RISC-V e tensoriais em um único die. A promessa: substituir cerca de 10 racks de servidores de GPU convencionais para modelos de trilhões de parâmetros e cargas agênticas, atacando o “memory wall” que tem virado o verdadeiro gargalo dos data centers de IA em 2026.

O que é o Prometheus, em termos técnicos

Os números crus já contam parte da história. Uma GPU NVIDIA Blackwell B200 entrega em torno de 144 GB de HBM3e por placa. O Prometheus, em um único chassi, oferece 128 TB de DRAM LPDDR6 compartilhada — cerca de 1.000x mais memória disponível por nó. A Majestic não usa HBM (a memória empilhada acoplada às GPUs) porque ela é cara, restrita em volume e dominada por SK Hynix e Samsung. LPDDR6 é mais lenta por pino, mas escala de forma brutal em capacidade.

Para que isso funcione com performance aceitável, a Majestic desenvolveu uma interface proprietária de memória feita com cabos de cobre em miniatura, eficaz até cerca de um metro. Dentro do nó, cada um dos 12 chips Ignite enxerga a memória como um espaço unificado — característica essencial para rodar Mixture-of-Experts e cargas agênticas, em que o roteamento dinâmico entre “especialistas” e o keep-alive de muitos contextos longos viram o maior consumo.

Por que isso é um ataque ao gargalo real

Em 2026, o limite prático dos data centers de IA deixou de ser FLOPs e passou a ser memória e movimentação de dados. Modelos de fronteira têm context windows de milhões de tokens, cache KV gigantesco e Mixture-of-Experts com dezenas a centenas de especialistas. O custo dominante deixou de ser “calcular” e passou a ser “manter os dados perto”. É esse o “memory wall” — e é nele que a Majestic decidiu bater.

Se a promessa se confirmar em workloads reais, um servidor Prometheus substitui aproximadamente 10 racks de servidores de GPU, com consolidação proporcional de energia, refrigeração e espaço de piso. Para hyperscalers brigando por megawatts em terras com energia escassa (e isso inclui boa parte da Europa e algumas regiões dos EUA), a economia operacional é direta.

Análise SWOT econômica

Forças

  • 128 TB de memória compartilhada em um único nó (vs ~144 GB de HBM em B200)
  • Substitui ~10 racks de GPU convencional, economizando energia e espaço
  • Time fundador com experiência em Google e Meta em escala
Fraquezas

  • Arquitetura nova exige reescrita ou recompilação dos stacks de IA
  • Sem ecossistema de software comparável ao CUDA
  • Startup pequena disputando contra incumbentes com receita recorrente
Oportunidades

  • Modelos de trilhões de parâmetros e janelas de contexto gigantes ficam viáveis em um nó
  • Mixture-of-Experts e sistemas agênticos pedem memória bruta — não FLOPs puros
  • Reduz dependência geopolítica de HBM (sobretudo SK Hynix e Samsung)
Ameaças

  • NVIDIA está respondendo com Spectrum-X Photonics e roadmap Rubin
  • Concorrência chinesa (Huawei Ascend 950) acelera
  • Risco de não-adoção: clientes corporativos preferem provedor consolidado

Status no Brasil

O Brasil ainda não tem footprint relevante de hyperscaler para treino de modelos de fronteira, mas três pontos merecem atenção:

  • Inferência soberana: provedores nacionais que oferecem modelos para órgãos públicos brasileiros podem se beneficiar de nós como Prometheus por consolidação de carga em poucos chassis — menos exposição cambial em CAPEX, menos espaço alugado.
  • Mercado de data center: anúncios de novos campi de data center no Nordeste e em São Paulo dependem do mix de aceleradores que vai dentro. Servidores que economizam metros e MW mudam a planilha do investimento.
  • Pesquisa e universidades: laboratórios brasileiros pagam preço alto por GPUs com HBM. Uma alternativa baseada em DRAM convencional, se chegar ao mercado em volume, pode democratizar treinamento de modelos médios em universidades.

Riscos e limitações

Três cuidados honestos. Primeiro, a interface de memória proprietária é uma faca de dois gumes: facilita a engenharia da Majestic, mas dificulta interoperabilidade — se a empresa não convencer um grande cliente a adotar e ajudar a portar software, o stack pode ficar isolado. Segundo, a comparação “substitui 10 racks de GPU” depende muito da carga; para treinamentos pesados e dependentes de bandwidth de HBM, a vantagem cai. Terceiro, software importa mais que hardware: NVIDIA tem 15 anos de CUDA, kernels otimizados e comunidade. Qualquer chip novo precisa endereçar isso antes de virar uma decisão racional para um CTO conservador.

Cenário e indicativo de futuro

O Prometheus chega em uma onda. NVIDIA respondeu rápido: anunciou Spectrum-X Photonics (co-packaged optics) para baixar latência entre racks de GPU e prepara o Rubin para 2027. A Huawei prepara o Ascend 950 com meta de 1 petaflop em FP8 e o Atlas 950 SuperPoD com 8.192 chips. Intel investe em packaging avançado para chips ainda maiores. A leitura de mercado é convergente: quem dominar memória e interconexão domina o jogo. Que essa briga seja vencida por uma startup israelense-americana, por uma chinesa ou pela NVIDIA é, hoje, questão aberta.

O que muda na prática

Para arquitetos de plataforma e CTOs: o sinal claro é que decisões de infraestrutura de IA para 2027 não devem ser tomadas só em GPU/HBM. Vale pedir benchmarks com cargas agênticas reais (não só MMLU), considerar TCO em 3–5 anos e exigir provas de portabilidade do stack. Para investidores e analistas: o segmento de “memory-first AI hardware” é, hoje, uma das poucas frentes em que startups têm chance real contra a NVIDIA — não porque consigam ganhar em FLOPs, mas porque escolheram outra dimensão do problema.

Fonte original: IEEE Spectrum — Huge Memory AI Server Aims to Shatter the Memory Wall. Comunicado de imprensa: Majestic Labs / Business Wire (28 de abril de 2026).

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *