GPU NVIDIA Rubin CPX : optimisé pour les applications de super IA avec codage à millions de jetons, GenAI, 128 Go de mémoire GDDR7 et 30 PFLOPs de performances FP4

GPU NVIDIA Rubin CPX : optimisé pour les applications de super IA avec codage à millions de jetons, GenAI, 128 Go de mémoire GDDR7 et 30 PFLOPs de performances FP4

NVIDIA fait parler d’elle avec la sortie très attendue de sa dernière innovation, la plateforme d’IA Rubin. Ce système avancé sera équipé de processeurs Vera associés à la puce Rubin CPX de pointe, et bénéficiera d’une remarquable mémoire GDDR7 de 128 Go.

Présentation de la plateforme d’IA NVIDIA Rubin : une nouvelle ère de vitesse et d’efficacité

NVIDIA continue de susciter l’intérêt autour de sa plateforme d’IA Rubin de nouvelle génération, tout en laissant entrevoir le potentiel futur de sa plateforme Feynman. Les récentes mises à jour mettent en avant les capacités innovantes des GPU Rubin, en insistant sur l’intégration de technologies avancées telles que les processeurs Vera et les nouvelles cartes réseau ConnectX-9 SuperNIC.

GPU NVIDIA Rubin CPX pour un contexte massif présenté avec des fonctionnalités telles que 128 Go de mémoire GDDR7 et disponible fin 2026.

NVIDIA a annoncé aujourd’hui le lancement de NVIDIA Rubin CPX, une nouvelle classe de GPU spécialement conçue pour le traitement de contextes massifs. Celle-ci permet aux systèmes d’IA de gérer le codage logiciel de millions de jetons et la vidéo générative avec une rapidité et une efficacité exceptionnelles.

Rubin CPX fonctionne en parfaite harmonie avec les processeurs NVIDIA Vera et les GPU Rubin au sein de la nouvelle plateforme NVIDIA Vera Rubin NVL144 CPX. Ce système NVIDIA MGX intégré offre 8 exaflops de puissance de calcul IA pour des performances IA 7, 5 fois supérieures à celles des systèmes NVIDIA GB300 NVL72, ainsi que 100 To de mémoire rapide et 1, 7 pétaoctet par seconde de bande passante mémoire dans un seul rack. Un plateau de calcul Rubin CPX dédié sera également proposé aux clients souhaitant réutiliser leurs systèmes Vera Rubin 144 existants.

NVIDIA Rubin CPX offre des performances et des revenus de jetons optimaux pour le traitement à long contexte, bien au-delà de ce que les systèmes actuels sont censés gérer. Cela transforme les assistants de codage IA, passant de simples outils de génération de code à des systèmes sophistiqués capables de comprendre et d’optimiser des projets logiciels à grande échelle.

Pour traiter la vidéo, les modèles d’IA peuvent utiliser jusqu’à 1 million de jetons pour une heure de contenu, repoussant ainsi les limites du calcul GPU traditionnel. Rubin CPX intègre un décodeur et des encodeurs vidéo, ainsi qu’un traitement d’inférence à contexte long, dans une seule puce, pour des capacités sans précédent dans les applications à format long, telles que la recherche vidéo et la vidéo générative haute qualité.

Construit sur l’architecture NVIDIA Rubin, le GPU Rubin CPX utilise une conception de matrice monolithique économique dotée de puissantes ressources de calcul NVFP4 et est optimisé pour offrir des performances et une efficacité énergétique extrêmement élevées pour les tâches d’inférence d’IA.

via NVIDIA

La famille Rubin propose une nouvelle classe de GPU conçus pour les applications d’IA exigeantes, notamment le codage logiciel avancé à plusieurs millions de jetons et l’IA de génération (GenAI).Ces GPU révolutionnaires promettent une vitesse et une efficacité inégalées.

Annonce de la solution Vera Rubin CPX Dual Rack avec la marque NVIDIA, les fonctionnalités mises en avant incluent une mémoire de 1, 7 Po/s et une disponibilité en 2026.

Au sein de la plateforme Vera Rubin NVL 144 CPX, les puces Rubin CPX de NVIDIA fonctionneront en tandem avec les processeurs Vera de nouvelle génération, succédant ainsi au processeur Grace. Ce système MGX moderne est conçu pour offrir une puissance de calcul IA impressionnante de 8 exaflops, soit une amélioration de 7, 5 fois par rapport à la plateforme Grace Blackwell GB300 NVL72 existante. De plus, il sera doté de 100 To de mémoire rapide et d’une bande passante mémoire importante de 1, 7 pétaoctet, triplant ainsi les performances d’attention par rapport aux systèmes précédents.

Principaux avantages de la plateforme NVIDIA Vera Rubin CPX

  • Augmentation de 7, 5x de la puissance de calcul de l’IA (8 exaflops NVFP4)
  • Bande passante 3, 0 fois plus rapide (bande passante de 1, 7 Po/s)
  • Capacité de mémoire 4, 0 fois supérieure (150 To en GDDR7)

Chaque GPU NVIDIA Rubin CPX est conçu pour fournir 30 PFLOP de calcul IA NVFP4 et peut accueillir jusqu’à 128 Go de mémoire GDDR7. Le choix de la GDDR7 plutôt que de la mémoire HBM pour la plateforme Rubin CPX est remarquable, reflétant l’engagement de NVIDIA en faveur de solutions rentables sans compromis sur les performances. De plus, ces GPU devraient offrir des fonctionnalités NVENC et NVDNC étendues, améliorant considérablement le traitement vidéo pour les tâches GenAI.

La feuille de route de NVIDIA met en évidence les architectures Blackwell, Rubin et Feynman de 2025 à 2028 avec les détails du processeur Grace et du commutateur NVLink.

NVIDIA prévoit que les premiers systèmes Rubin CPX seront disponibles d’ici la fin de 2026, la phase de production de Vera Rubin devant commencer prochainement, en vue d’un événement de lancement lors du prochain GTC 2026.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *