
NVIDIA hat mit der Einführung einer bahnbrechenden Reihe von KI-GPUs namens Rubin CPX AI-Chip Schlagzeilen gemacht, die außergewöhnliche Inferenzfähigkeiten bieten sollen, wenn sie in einer Rack-Scale-Cluster-Konfiguration verwendet werden.
NVIDIAs Rubin CPX GPU: Ein neuer Maßstab für KI-Leistung im Rack-Scale
NVIDIA hat die wachsende Bedeutung von KI-Inferenz für den Fortschritt in der Computertechnik erkannt und beschreitet mit seiner CFX-Produktreihe neue Wege. Das erste Produkt, die Rubin-Serie, wurde auf dem AI Infra Summit vorgestellt. Die Rubin CPX GPU ist primär für KI-Anwendungen mit langem Kontext konzipiert und soll die bestehenden Rubin-GPUs und Vera-CPUs ergänzen. Sie läutet laut NVIDIA eine „Revolution“ in der Effizienz von KI-Inferenz ein.
Der Rubin CPX besticht durch beeindruckende Spezifikationen, darunter 30 PetaFLOPs NVFP4-Rechenleistung und 128 GB hochmodernen GDDR7-Speicher. Er wird in das speziell entwickelte NVIDIA Vera Rubin NVL144 CPX-Rack integriert, das 144 Rubin CPX-GPUs, 144 Rubin-GPUs und 36 Vera-CPUs beherbergt und zusammen beeindruckende acht ExaFLOPs NVFP4-Rechenleistung erreicht. Dies stellt eine deutliche 7, 5-fache Steigerung gegenüber dem Blackwell Ultra-System dar und zielt darauf ab, KI-Inferenz-Workloads mit einer Million Token-Kontexten mit verbesserter Leistung durch Innovationen wie Spectrum-X Ethernet zu bewältigen.

Diese Plattform soll eine bemerkenswerte 30- bis 50-fache Kapitalrendite liefern und positioniert das Vera Rubin NVL144 CPX-Rack als wichtiges Werkzeug zur Überwindung der aktuellen Einschränkungen bei der Entwicklung generativer KI-Anwendungen der nächsten Generation. Weitere Konfigurationen des Rubin CPX werden erwartet, Details wurden jedoch noch nicht bekannt gegeben. Die Integration von GDDR7-Speicher anstelle von HBM stellt für viele Anwender jedoch eine kostengünstigere Lösung dar.
NVIDIA meistert die Komplexität der KI-Landschaft geschickt und minimiert so effektiv die Chancen der Konkurrenz, sich einen Vorteil zu verschaffen. Die bevorstehende Markteinführung der Rubin-KI-Reihe der nächsten Generation im nächsten Jahr verspricht, die Rechenleistung auf ein beispielloses Niveau zu heben.
Schreibe einen Kommentar