GPU NVIDIA Rubin CPX: otimizada para aplicações Super AI com codificação de milhões de tokens, GenAI, memória GDDR7 de 128 GB e desempenho FP4 de 30 PFLOPs

GPU NVIDIA Rubin CPX: otimizada para aplicações Super AI com codificação de milhões de tokens, GenAI, memória GDDR7 de 128 GB e desempenho FP4 de 30 PFLOPs

A NVIDIA está nas manchetes com o lançamento antecipado de sua mais recente inovação, a plataforma Rubin AI. Este sistema avançado contará com CPUs Vera em conjunto com o chip Rubin CPX de última geração, ostentando impressionantes 128 GB de memória GDDR7.

Revelando a plataforma NVIDIA Rubin AI: uma nova era de velocidade e eficiência

A NVIDIA continua a gerar expectativa em torno de sua plataforma de IA Rubin de próxima geração, ao mesmo tempo em que sugere o potencial futuro de sua plataforma Feynman. Atualizações recentes destacam os recursos inovadores das GPUs Rubin, enfatizando a integração de tecnologias avançadas como CPUs Vera e as novas SuperNICs ConnectX-9.

GPU NVIDIA Rubin CPX para contexto massivo apresentada com recursos como memória GDDR7 de 128 GB e disponível no final de 2026.

A NVIDIA anunciou hoje a NVIDIA Rubin CPX, uma nova classe de GPU desenvolvida especificamente para processamento de contexto massivo. Isso permite que sistemas de IA processem codificação de software de milhões de tokens e vídeo generativo com velocidade e eficiência inovadoras.

O Rubin CPX trabalha em conjunto com CPUs NVIDIA Vera e GPUs Rubin dentro da nova plataforma NVIDIA Vera Rubin NVL144 CPX. Este sistema NVIDIA MGX integrado reúne 8 exaflops de computação de IA para fornecer 7, 5 vezes mais desempenho de IA do que os sistemas NVIDIA GB300 NVL72, além de 100 TB de memória rápida e 1, 7 petabytes por segundo de largura de banda de memória em um único rack. Uma bandeja de computação Rubin CPX dedicada também será oferecida para clientes que desejam reutilizar os sistemas Vera Rubin 144 existentes.

O NVIDIA Rubin CPX permite o mais alto desempenho e receita de tokens para processamento de longo contexto — muito além do que os sistemas atuais foram projetados para suportar. Isso transforma assistentes de codificação de IA de simples ferramentas de geração de código em sistemas sofisticados que podem compreender e otimizar projetos de software em larga escala.

Para processar vídeo, os modelos de IA podem usar até 1 milhão de tokens por hora de conteúdo, expandindo os limites da computação tradicional por GPU. O Rubin CPX integra decodificadores e codificadores de vídeo, bem como processamento de inferência de contexto longo, em um único chip, proporcionando recursos sem precedentes em aplicações de formato longo, como busca de vídeo e vídeo generativo de alta qualidade.

Desenvolvida na arquitetura NVIDIA Rubin, a GPU Rubin CPX usa um design de matriz monolítica e econômico, repleto de poderosos recursos de computação NVFP4 e é otimizada para oferecer desempenho e eficiência energética extremamente altos para tarefas de inferência de IA.

via NVIDIA

A família Rubin traz uma nova classe de GPUs projetadas para aplicações de IA exigentes, incluindo codificação avançada de software com milhões de tokens e Geração de IA (GenAI).Essas GPUs revolucionárias prometem velocidade e eficiência incomparáveis.

Anunciando a solução Vera Rubin CPX Dual Rack com a marca NVIDIA, os recursos destacados incluem memória de 1, 7 PB/s e disponibilidade em 2026.

Dentro da plataforma Vera Rubin NVL 144 CPX, os chips Rubin CPX da NVIDIA funcionarão em conjunto com as CPUs Vera de próxima geração, que sucederão a CPU Grace. Este moderno sistema MGX foi projetado para oferecer impressionantes 8 Exaflops de computação de IA, representando uma melhoria de 7, 5 vezes em relação à plataforma Grace Blackwell GB300 NVL72 existente. Além disso, contará com 100 TB de memória rápida e uma largura de banda de memória substancial de 1, 7 Petabytes, triplicando efetivamente o desempenho de atenção em comparação com sistemas anteriores.

Principais vantagens da plataforma NVIDIA Vera Rubin CPX

  • Aumento de 7, 5x na computação de IA (8 Exaflops NVFP4)
  • Largura de banda 3, 0x mais rápida (largura de banda de 1, 7 PB/s)
  • Capacidade de memória 4, 0x maior (150 TB em GDDR7)

Cada GPU NVIDIA Rubin CPX está configurada para fornecer 30 PFLOPs de computação de IA NVFP4 e pode acomodar até 128 GB de memória GDDR7. A escolha de GDDR7 em vez de HBM para a plataforma Rubin CPX é notável, refletindo o compromisso da NVIDIA com soluções econômicas sem comprometer o desempenho. Além disso, espera-se que essas GPUs apresentem recursos NVENC e NVDNC expandidos, aprimorando significativamente o processamento de vídeo para tarefas GenAI.

O roteiro da NVIDIA destaca as arquiteturas Blackwell, Rubin e Feynman de 2025 a 2028, com detalhes da CPU Grace e do switch NVLink.

A NVIDIA prevê que os primeiros sistemas Rubin CPX estarão disponíveis até o final de 2026, com a fase de produção do Vera Rubin prevista para começar em breve, com lançamento previsto para o próximo GTC 2026.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *