Explorando o NVIDIA Vera Rubin: um dos sistemas de IA mais complexos do mundo, com um milhão de componentes integrados.

Explorando o NVIDIA Vera Rubin: um dos sistemas de IA mais complexos do mundo, com um milhão de componentes integrados.

A NVIDIA iniciou a produção em larga escala de sua arquitetura Vera Rubin de próxima geração, fornecendo uma análise detalhada de seu complexo design de sistema de rack e componentes principais.

Explorando a Vera Rubin da NVIDIA: Chips aprimorados, resfriamento líquido avançado e NVLink 6 de última geração.

O lançamento do Vera Rubin representa um salto significativo na tecnologia de racks da NVIDIA. Informações recentes, divulgadas em um vídeo da CNBC, mostram uma análise detalhada de sua arquitetura, incluindo componentes como o nó de computação principal e os sistemas críticos de rede e refrigeração. Vale destacar que Dion Harris, Diretor Sênior de Infraestrutura da NVIDIA, descreveu o sistema Vera Rubin como um dos “sistemas de IA mais complexos do mundo”, ressaltando a natureza desafiadora de sua implementação.

Como os pedidos de clientes para o sistema Vera Rubin devem ser confirmados em breve, é crucial entender a estrutura do rack NVL72. Um dos pilares dessa arquitetura é o Vera Rubin SuperChip. Já discutimos suas especificações técnicas, enfatizando os avanços substanciais alcançados com a integração da HBM4 à GPU, complementada por módulos SOCAMM especializados. Essa inovação resulta em uma impressionante largura de banda de memória de 1, 2 TB/s.

Imagem ampliada de um chip NVIDIA marcado com 'B_KR 2546-P' e 'E6A382. OA2 e1' em uma placa de circuito impresso.

A Vera Rubin também introduz melhorias significativas na tecnologia de refrigeração, apresentando designs modulares de refrigeração líquida que atendem aos componentes do SuperChip, como a GPU Rubin e a CPU Vera, por meio de placas frias dedicadas. A liderança da NVIDIA afirma que essa abordagem inovadora de refrigeração incentivará os operadores de hiperescala a adotarem sistemas de refrigeração líquida mais avançados. Além disso, os designs atuais promovem a redução do consumo de água, acentuando outro benefício ambiental.

Uma imagem em close-up de um rack de servidores com vários componentes visíveis sobre uma mesa preta, apresentando um chassi metálico e sistema de refrigeração.Uma pessoa segurando os componentes internos de um dispositivo eletrônico sem marca, exibindo diversas conexões.

A tecnologia NVLink é outro componente fundamental da configuração Vera Rubin NVL72. Com sua interconexão de sexta geração, comumente chamada de “NVLink Spine”, a NVIDIA visa oferecer uma largura de banda total notável de 260 TB/s por rack. Harris enfatiza que esta versão mais recente do NVLink aprimora o design modular, facilitando a manutenção sem interrupções e aumentando a confiabilidade por meio de serviços RAS em nível de rack.

Uma placa de circuito impresso exibindo vários chips NVIDIA com dissipadores de calor verdes e componentes ao redor.

Embora as projeções iniciais indiquem que o sistema Vera Rubin possa ter um preço mais elevado, a NVIDIA garante que essa arquitetura permite uma redução de 10 vezes nos custos de tokens de inferência e uma redução de 4 vezes no número de GPUs necessárias para o treinamento de modelos Mixture of Experts (MoE) em comparação com o Blackwell GB200. Isso está alinhado com a filosofia do CEO da NVIDIA de que um investimento maior gera mais economia.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *