Os próximos servidores de IA Rubin da NVIDIA devem ser enviados até agosto de 2023; a Quanta, principal fornecedora, relata produção em massa sem problemas.

Os próximos servidores de IA Rubin da NVIDIA devem ser enviados até agosto de 2023; a Quanta, principal fornecedora, relata produção em massa sem problemas.

A NVIDIA está preparada para entregar seus racks de IA Vera Rubin de última geração aos clientes até o terceiro trimestre deste ano, embora os níveis iniciais de produção devam ser limitados.

Fornecedores preveem uma integração tranquila da produção da Vera Rubin devido à manutenção dos componentes da Blackwell.

Em um anúncio importante, a NVIDIA confirmou que a plataforma Vera Rubin entrou em produção plena no primeiro trimestre de 2026. Esse marco superou as expectativas do mercado, demonstrando o compromisso da NVIDIA com um lançamento acelerado do produto. Embora o cronograma para que os provedores de hiperescala recebam seu primeiro lote de racks de IA permaneça em sigilo, o vice-presidente executivo da Quanta, Mike Yang, indicou que os clientes poderão começar a receber as unidades iniciais já em agosto de 2026, facilitando a integração completa aos sistemas dos provedores de hiperescala até o final do ano.

A transição de designs de chiplets para embalagens avançadas e integração de memória de alta largura de banda (HBM) gerou preocupações quanto à capacidade da NVIDIA de cumprir o cronograma previsto para o segundo semestre de 2026. No entanto, Yang garantiu que muitos componentes da infraestrutura Rubin são derivados da série Blackwell, minimizando assim os riscos de produção nesta fase. Espera-se que a NVIDIA adote uma estratégia inicial de baixo volume semelhante à utilizada com o Blackwell Ultra, aumentando a produção posteriormente no início do próximo ano.

Uma pessoa está em um palco exibindo várias unidades de servidor abertas com sistemas de refrigeração e componentes de hardware visíveis.
Créditos da imagem: NVIDIA

A linha de produtos Rubin foi amplamente apresentada na CES deste ano, exibindo uma notável variedade de seis chips que aprimoram tanto as capacidades de rede quanto as de computação. Os chips em destaque incluem:

  • GPU Rubin (336 bilhões de transistores)
  • CPU Vera (227 bilhões de transistores)
  • Switch NVLINK 6 para interconexão
  • CX9 e BF4 para redes
  • Spectrum-X 102.4T CPO para fotônica de silício

Embora a NVIDIA tenha anunciado uma configuração NVL144 na GTC do ano passado, espera-se que os envios iniciais da série Rubin sejam limitados à configuração NVL72. Essa estratégia visa manter a quantidade de chips em um nível gerenciável, controlando assim a dissipação de calor e otimizando o processo de produção. A experiência da NVIDIA durante a transição do Blackwell para o Blackwell Ultra evidenciou as complexidades envolvidas na adaptação a mudanças arquitetônicas, especialmente com a implementação do design de placa Cordelia.

Uma imagem que exibe o anúncio da 'Plataforma NVIDIA Rubin', apresentando seis novos chips denominados Vera, Rubin, NVLink 6 Switch, CX9, BF4 e Spectrum-X 102.4T CPO, acima de um supercomputador de IA 'Vera Rubin POD', com o logotipo da NVIDIA no canto inferior direito.
Créditos da imagem: NVIDIA

A série Rubin AI da NVIDIA está a caminho de ser totalmente adotada por hiperescaladores entre o quarto trimestre de 2026 e o ​​primeiro trimestre de 2027, com modelos futuros que prometem aprimorar significativamente o desempenho. Entre os primeiros a adotar essa tecnologia de ponta estão gigantes do setor como OpenAI, Microsoft, Google e empresas inovadoras de nuvem como a CoreWeave.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *