NVIDIA a dévoilé sa nouvelle génération de superpuce Vera Rubin lors de l’événement GTC à Washington, marquant un bond en avant significatif vers l’avenir du déploiement de l’intelligence artificielle.
NVIDIA se prépare à la production en série de la superpuce Vera Rubin avec les premiers GPU Rubin en laboratoire
Lors de l’événement GTC d’octobre 2025, le PDG Jensen Huang a présenté la très attendue Vera Rubin Superchip. Il s’agissait de la première présentation publique de cette carte mère, baptisée Superchip par NVIDIA, qui intègre le processeur Vera de pointe et deux GPU Rubin hautes performances. De plus, la carte mère intègre une mémoire système LPDDR importante, qui s’associe parfaitement à la mémoire HBM4 utilisée dans les GPU Rubin.

Le système NVIDIA Vera Rubin NVL144 sera lancé au second semestre 2026
La plateforme NVIDIA Vera Rubin NVL144 sera équipée de deux puces innovantes. Le GPU Rubin intègrera deux puces de la taille d’un réticule, offrant jusqu’à 50 PFLOP de performances FP4 et une impressionnante mémoire HBM4 de pointe de 288 Go. La plateforme intègrera également un processeur Vera 88 cœurs basé sur une architecture Arm personnalisée, offrant 176 threads et une bande passante d’interconnexion NVLINK-C2C de 1, 8 To/s.

Les performances de la plateforme NVIDIA Vera Rubin NVL144 sont remarquables, avec un impressionnant 3, 6 exaflops d’inférence FP4 et 1, 2 exaflops d’entraînement FP8. Cela représente une amélioration significative de 3, 3 fois les performances par rapport au modèle GB300 NVL72. De plus, elle offre 13 To/s de mémoire HBM4 et 75 To de mémoire rapide, soit une amélioration de 60 % par rapport à son prédécesseur, et des performances deux fois supérieures à celles de NVLINK et CX9, avec des débits respectifs de 260 To/s et 28, 8 To/s.
Prochain système NVIDIA Rubin Ultra NVL576 attendu au second semestre 2027
Après le NVL144, NVIDIA devrait lancer la plateforme Rubin Ultra au second semestre 2027. Ce système étendra l’architecture NVL de 144 à 576. Tout en conservant l’architecture du CPU, le GPU Rubin Ultra comportera quatre puces de la taille d’un réticule qui promettent jusqu’à 100 PFLOPS de performances FP4 et une capacité mémoire HBM4e substantielle de 1 To répartie sur 16 sites HBM.

En termes de performances, la carte graphique NVIDIA Rubin Ultra NVL576 devrait offrir 15 exaflops d’inférence FP4 et 5 exaflops d’entraînement FP8, soit un gain remarquable de 14 fois par rapport à la NVL72 du GB300. De plus, elle embarquera une mémoire HBM4 à un débit impressionnant de 4, 6 Po/s et 365 To de mémoire rapide, soit un gain de 8 fois par rapport à la GB300. De plus, les spécifications NVLINK et CX9 bénéficieront de capacités multipliées par 12 et 8, avec des débits atteignant respectivement 1, 5 Po/s et 115, 2 To/s.

Feuille de route complète des GPU IA de NVIDIA
| Nom de code du GPU | Feynman | Rubin (Ultra) | Rubin | Blackwell (Ultra) | Blackwell | Trémie | Ampère | Temps | Pascal |
|---|---|---|---|---|---|---|---|---|---|
| Famille de GPU | GF200 ? | GR300 ? | GR200 ? | GB300 | GB200/GB100 | GH200/GH100 | GA100 | GV100 | GP100 |
| GPU WeU | F200 ? | 300 R? | 200 rands ? | B300 | B100/B200 | H100/H200 | A100 | V100 | P100 |
| Mémoire | HBM4e/HBM5 ? | HBM4 | HBM4 | HBM3e | HBM3e | HBM2e/HBM3/HBM3e | HBM2e | HBM2 | HBM2 |
| Lancement | 2028 | 2027 | 2026 | 2025 | 2024 | 2022-2024 | 2020-2022 | 2018 | 2016 |
Laisser un commentaire