
NVIDIA a dévoilé ses plans ambitieux pour la prochaine génération d’architectures d’IA avec l’introduction des GPU Rubin et Rubin Ultra, ainsi que des processeurs Vera, ouvrant la voie à un bond en avant significatif dans les capacités de calcul de l’IA.
Présentation des GPU Rubin et Rubin Ultra de NVIDIA aux côtés des CPU Vera – Solutions d’IA de nouvelle génération lancées en 2026-2027
Cette année, NVIDIA a enrichi sa suite Blackwell avec le lancement de la plateforme Blackwell Ultra, dotée d’une mémoire HBM3e pouvant atteindre 288 Go. Cependant, l’entreprise se prépare à repousser encore les limites en 2026 avec le lancement de ses plateformes CPU et GPU innovantes, baptisées Rubin et Vera.
Lors de l’événement GTC, NVIDIA a présenté en détail ces plateformes révolutionnaires dont le lancement est prévu fin 2026 et courant 2027. La première offre notable est le système Vera Rubin, conçu pour s’adapter aux solutions NVL72 jusqu’à NVL144. Cette plateforme d’IA nouvelle génération sera disponible au second semestre 2026 et exploitera les techniques avancées de refroidissement liquide de ses racks Obereon.
Concernant les spécifications, la plateforme NVIDIA Vera Rubin NVL144 utilisera deux puces de pointe. Le GPU Rubin est composé de deux puces de la taille d’un réticule, offrant une performance impressionnante de 50 PFLOPs en FP4 et 288 Go de mémoire HBM4 de pointe. Ce processeur est complété par un processeur Vera à 88 cœurs, basé sur une architecture Arm unique, offrant 176 threads et une interconnexion NVLINK-C2C à 1, 8 To/s.

En termes d’amélioration des performances, la NVIDIA Vera Rubin NVL144 devrait atteindre 3, 6 exaflops en inférence FP4 et 1, 2 exaflops en apprentissage FP8. Cela représente un gain de performances substantiel de 3, 3 fois supérieur à celui de la GB300 NVL72, avec 13 To/s de mémoire HBM4 et une impressionnante capacité de 75 To de mémoire rapide. Cette architecture offre également un gain de 60 % par rapport à la GB300, ainsi que des capacités NVLINK et CX9 doublées, atteignant respectivement 260 To/s et 28, 8 To/s.
La prochaine plateforme, Rubin Ultra, devrait être lancée en 2027 et portera le système NVL de 144 à 576 unités. Si l’architecture du processeur reste cohérente avec celle de son prédécesseur, le GPU Rubin Ultra déploiera quatre puces de la taille d’un réticule, améliorant considérablement les performances pour atteindre un remarquable 100 PFLOP de FP4 et une capacité HBM4e totale de 1 To, répartie sur 16 sites HBM.

La plateforme NVIDIA Rubin Ultra NVL576 promet des performances exceptionnelles, avec 15 exaflops pour l’inférence FP4 et 5 exaflops pour l’apprentissage FP8, soit un gain de 14 fois par rapport au GB300 NVL72. Elle offrira 4, 6 Po/s de mémoire HBM4 et 365 To de mémoire haute vitesse, soit un gain de 8 fois par rapport au GB300. De plus, ses performances seront 12 fois supérieures à celles du NVLINK et 8 fois supérieures à celles du CX9, atteignant respectivement 1, 5 Po/s et 115, 2 To/s.
Laisser un commentaire