
NVIDIA a fait la une des journaux avec l’introduction d’une série révolutionnaire de GPU IA connue sous le nom de puce Rubin CPX AI, conçue pour offrir des capacités d’inférence exceptionnelles lorsqu’elle est utilisée dans une configuration de cluster à l’échelle du rack.
GPU Rubin CPX de NVIDIA : une nouvelle référence en matière de performances d’IA à l’échelle du rack
Conscient de l’importance croissante de l’inférence IA dans les avancées informatiques, NVIDIA s’est lancé dans une nouvelle aventure avec sa gamme « CFX ».Le premier produit, la série Rubin, a été présenté lors de l’ AI Infra Summit. Conçu principalement pour les applications d’IA à contexte long, le GPU Rubin CPX viendra compléter les GPU Rubin et les CPU Vera existants, annonçant ce que NVIDIA décrit comme une « révolution » dans l’efficacité de l’inférence IA.
Le Rubin CPX affiche des spécifications impressionnantes, avec notamment 30 pétaflops de puissance de calcul NVFP4 et 128 Go de mémoire GDDR7 de pointe. Il sera intégré au rack NVIDIA Vera Rubin NVL144 CPX spécialement conçu, qui accueillera 144 GPU Rubin CPX, 144 GPU Rubin et 36 CPU Vera, atteignant collectivement un impressionnant huit exaflops de puissance de calcul NVFP4. Ce système représente une augmentation significative de 7, 5 fois par rapport au système Blackwell Ultra et vise à gérer des charges de travail d’inférence d’IA contextuelle d’un million de jetons avec des performances améliorées grâce à des innovations comme Spectrum-X Ethernet.

Cette plateforme devrait offrir un retour sur investissement remarquable de 30 à 50 fois supérieur, positionnant le rack Vera Rubin NVL144 CPX comme un outil essentiel pour surmonter les limites actuelles du développement d’applications d’IA générative de nouvelle génération. D’autres configurations du Rubin CPX sont attendues, mais leurs détails restent confidentiels. Cependant, l’intégration de mémoire GDDR7 au lieu de HBM suggère une solution plus économique pour de nombreux utilisateurs.
NVIDIA maîtrise avec brio les complexités du paysage de l’IA, minimisant ainsi les chances de ses concurrents de prendre l’avantage. Le lancement imminent de la nouvelle génération de processeurs Rubin AI l’année prochaine promet d’élever les capacités de calcul à des niveaux sans précédent.
Laisser un commentaire