NVIDIA lança GPUs de IA ‘Rubin CPX’ com 128 GB de memória GDDR7 para tarefas de inferência de alto valor

NVIDIA lança GPUs de IA ‘Rubin CPX’ com 128 GB de memória GDDR7 para tarefas de inferência de alto valor

A NVIDIA ganhou as manchetes com o lançamento de uma série inovadora de GPUs de IA conhecida como chip Rubin CPX AI, projetada para oferecer recursos de inferência excepcionais quando utilizada em uma configuração de cluster em escala de rack.

GPU Rubin CPX da NVIDIA: uma nova referência em desempenho de IA em escala de rack

Reconhecendo a crescente importância da inferência de IA nos avanços computacionais, a NVIDIA embarcou em uma nova jornada com sua linha “CFX”.O produto inaugural, a série Rubin, foi apresentado durante o AI Infra Summit. Posicionada principalmente para aplicações de IA de longo prazo, a GPU Rubin CPX complementa as GPUs Rubin e as CPUs Vera existentes, anunciando o que a NVIDIA descreve como uma “revolução” na eficiência da inferência de IA.

O Rubin CPX apresenta especificações impressionantes, incluindo 30 petaFLOPs de poder computacional NVFP4 e 128 GB de memória GDDR7 de última geração. Ele será integrado ao rack NVIDIA Vera Rubin NVL144 CPX especialmente projetado, que abrigará 144 GPUs Rubin CPX, 144 GPUs Rubin e 36 CPUs Vera, alcançando, em conjunto, impressionantes oito exaFLOPs de computação NVFP4. Isso representa um aumento significativo de 7, 5 vezes em relação ao sistema Blackwell Ultra e visa lidar com cargas de trabalho de inferência de IA de contexto de um milhão de tokens com desempenho aprimorado por meio de inovações como a Spectrum-X Ethernet.

Bandeja de computação Vera Rubin NVL144 CPX com etiquetas Rubin, Vera, Rubin CPX, ConnectX-9 em um fundo preto.

Esta plataforma foi projetada para proporcionar um notável “retorno sobre o investimento de 30x a 50x”, posicionando o rack Vera Rubin NVL144 CPX como uma ferramenta vital para superar as limitações atualmente enfrentadas no desenvolvimento de aplicações de IA generativa de próxima geração. Embora mais configurações do Rubin CPX sejam esperadas, detalhes específicos ainda não foram divulgados. No entanto, sua integração de memória GDDR7 em vez de HBM sugere uma solução mais econômica para muitos usuários.

A NVIDIA navega com maestria pelas complexidades do cenário da IA, minimizando efetivamente as chances de os concorrentes obterem vantagem. O lançamento iminente da linha Rubin AI de última geração, no próximo ano, promete elevar as capacidades computacionais a patamares sem precedentes.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *