Exploration de NVIDIA Vera Rubin : l’un des systèmes d’IA les plus complexes au monde, avec un million de composants intégrés

Exploration de NVIDIA Vera Rubin : l’un des systèmes d’IA les plus complexes au monde, avec un million de composants intégrés

NVIDIA a lancé la production à grande échelle de son architecture Vera Rubin de nouvelle génération, en fournissant une analyse approfondie de la conception complexe de son système de racks et de ses composants clés.

Découverte de la Vera Rubin de NVIDIA : puces améliorées, refroidissement liquide avancé et NVLink 6 haut de gamme

L’introduction de Vera Rubin marque une avancée majeure pour NVIDIA dans le domaine des serveurs rack. Une vidéo récente de CNBC présente une analyse détaillée de son architecture, notamment de composants tels que le nœud de calcul principal et les systèmes critiques de réseau et de refroidissement. Dion Harris, directeur principal de l’infrastructure chez NVIDIA, a notamment décrit le système Vera Rubin comme l’un des « systèmes d’IA les plus complexes au monde », soulignant ainsi la difficulté de sa mise en œuvre.

Alors que les commandes clients pour le système Vera Rubin sont attendues prochainement, il est crucial de comprendre la structure du rack NVL72. Le SuperChip Vera Rubin constitue la pierre angulaire de cette architecture. Nous avons déjà abordé ses spécifications techniques, en soulignant les progrès considérables réalisés grâce à l’intégration de la mémoire HBM4 au GPU, complétée par des modules SOCAMM spécialisés. Cette innovation permet d’atteindre une bande passante mémoire impressionnante de 1, 2 To/s.

Gros plan d'une puce NVIDIA marquée « B_KR 2546-P » et « E6A382. OA2 e1 » sur une carte de circuit imprimé.

La puce Vera Rubin introduit également des améliorations significatives en matière de refroidissement, grâce à des systèmes de refroidissement liquide modulaires adaptés aux composants SuperChip tels que le GPU Rubin et le CPU Vera, via des plaques froides dédiées. La direction de NVIDIA affirme que cette approche innovante incitera les opérateurs de centres de données hyperscale à adopter des systèmes de refroidissement liquide plus performants. De plus, ces conceptions permettent de réduire la consommation d’eau, un autre avantage environnemental non négligeable.

Gros plan sur une baie de serveurs avec plusieurs composants visibles sur une table noire, présentant un châssis métallique et un système de refroidissement.Une personne tenant les composants internes d'un appareil électronique sans marque, montrant ses nombreuses connexions.

La technologie NVLink est un autre élément essentiel de la configuration NVL72 de Vera Rubin. Grâce à son interconnexion de sixième génération, communément appelée « NVLink Spine », NVIDIA vise à fournir une bande passante totale remarquable de 260 To/s par rack. Harris souligne que cette dernière version de NVLink optimise la conception modulaire, facilitant la maintenance sans interruption de service et améliorant la fiabilité grâce aux services RAS au niveau du rack.

Une carte de circuit imprimé présentant plusieurs puces NVIDIA avec des dissipateurs thermiques verts et les composants environnants.

Bien que les premières estimations indiquent que le système Vera Rubin pourrait être plus cher, NVIDIA assure que cette architecture permet de réduire d’un facteur 10 le coût des jetons d’inférence et de diviser par quatre le nombre de GPU nécessaires à l’entraînement des modèles Mixture of Experts (MoE) par rapport au Blackwell GB200. Ceci est conforme à la philosophie du PDG de NVIDIA, selon laquelle un investissement plus important génère des économies plus importantes.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *