NVIDIA hat die Serienproduktion seiner Vera Rubin-Architektur der nächsten Generation aufgenommen und liefert eine detaillierte Analyse des komplexen Rack-Systemdesigns und der wichtigsten Komponenten.
NVIDIAs Vera Rubin im Detail: Verbesserte Chips, fortschrittliche Flüssigkeitskühlung und High-End-NVLink 6
Die Einführung von Vera Rubin markiert einen bedeutenden Fortschritt in der Rack-Technologie von NVIDIA. Ein aktuelles Video von CNBC bietet detaillierte Einblicke in die Architektur, einschließlich Komponenten wie dem Hauptrechenknoten und den kritischen Netzwerk- und Kühlsystemen. Dion Harris, Senior Director of Infrastructure bei NVIDIA, bezeichnete das Vera-Rubin-System als eines der „komplexesten KI-Systeme der Welt“ und hob damit die Herausforderungen seiner Implementierung hervor.
Da in Kürze Kundenaufträge für das Vera-Rubin-System erwartet werden, ist das Verständnis der NVL72-Rack-Struktur von entscheidender Bedeutung. Ein zentraler Bestandteil dieser Architektur ist der Vera-Rubin-SuperChip. Wir haben bereits seine technischen Spezifikationen erläutert und dabei die wesentlichen Fortschritte hervorgehoben, die durch die Integration von HBM4 mit der GPU, ergänzt durch spezielle SOCAMM-Module, erzielt wurden. Diese Innovation resultiert in einer beeindruckenden Speicherbandbreite von 1, 2 TB/s.

Vera Rubin bietet zudem bedeutende Verbesserungen in der Kühltechnologie mit modularen Flüssigkeitskühlsystemen, die die SuperChip-Komponenten wie die Rubin-GPU und die Vera-CPU über dedizierte Kühlplatten optimal versorgen. NVIDIA ist überzeugt, dass dieser innovative Kühlansatz Hyperscale-Betreiber dazu bewegen wird, fortschrittlichere Flüssigkeitskühlsysteme einzusetzen. Darüber hinaus tragen die aktuellen Designs zu einem reduzierten Wasserverbrauch bei und bieten somit einen weiteren ökologischen Vorteil.


Die NVLink-Technologie ist ein weiterer zentraler Bestandteil des Vera Rubin NVL72-Systems. Mit ihrer Verbindung der sechsten Generation, allgemein als „NVLink Spine“ bezeichnet, strebt NVIDIA eine bemerkenswerte Gesamtbandbreite von 260 TB/s pro Rack an. Harris betont, dass diese neueste NVLink-Generation ein modulares Design ermöglicht, Wartungsarbeiten ohne Ausfallzeiten erleichtert und die Zuverlässigkeit durch RAS-Dienste auf Rack-Ebene erhöht.

Während erste Prognosen auf einen höheren Preis des Vera-Rubin-Systems hindeuten, versichert NVIDIA, dass diese Architektur im Vergleich zum Blackwell GB200 eine zehnfache Reduzierung der Inferenz-Token-Kosten und eine vierfache Verringerung der für das Training von Mixture-of-Experts-Modellen (MoE) benötigten GPUs ermöglicht. Dies entspricht der Philosophie des NVIDIA-CEOs, dass höhere Investitionen zu größeren Einsparungen führen.
Schreibe einen Kommentar