Erkundung von NVIDIA Vera Rubin: Eines der komplexesten KI-Systeme der Welt mit einer Million integrierter Komponenten

Erkundung von NVIDIA Vera Rubin: Eines der komplexesten KI-Systeme der Welt mit einer Million integrierter Komponenten

NVIDIA hat die Serienproduktion seiner Vera Rubin-Architektur der nächsten Generation aufgenommen und liefert eine detaillierte Analyse des komplexen Rack-Systemdesigns und der wichtigsten Komponenten.

NVIDIAs Vera Rubin im Detail: Verbesserte Chips, fortschrittliche Flüssigkeitskühlung und High-End-NVLink 6

Die Einführung von Vera Rubin markiert einen bedeutenden Fortschritt in der Rack-Technologie von NVIDIA. Ein aktuelles Video von CNBC bietet detaillierte Einblicke in die Architektur, einschließlich Komponenten wie dem Hauptrechenknoten und den kritischen Netzwerk- und Kühlsystemen. Dion Harris, Senior Director of Infrastructure bei NVIDIA, bezeichnete das Vera-Rubin-System als eines der „komplexesten KI-Systeme der Welt“ und hob damit die Herausforderungen seiner Implementierung hervor.

Da in Kürze Kundenaufträge für das Vera-Rubin-System erwartet werden, ist das Verständnis der NVL72-Rack-Struktur von entscheidender Bedeutung. Ein zentraler Bestandteil dieser Architektur ist der Vera-Rubin-SuperChip. Wir haben bereits seine technischen Spezifikationen erläutert und dabei die wesentlichen Fortschritte hervorgehoben, die durch die Integration von HBM4 mit der GPU, ergänzt durch spezielle SOCAMM-Module, erzielt wurden. Diese Innovation resultiert in einer beeindruckenden Speicherbandbreite von 1, 2 TB/s.

Nahaufnahme eines NVIDIA-Chips auf einer Leiterplatte mit der Aufschrift „B_KR 2546-P“ und „E6A382. OA2 e1“.

Vera Rubin bietet zudem bedeutende Verbesserungen in der Kühltechnologie mit modularen Flüssigkeitskühlsystemen, die die SuperChip-Komponenten wie die Rubin-GPU und die Vera-CPU über dedizierte Kühlplatten optimal versorgen. NVIDIA ist überzeugt, dass dieser innovative Kühlansatz Hyperscale-Betreiber dazu bewegen wird, fortschrittlichere Flüssigkeitskühlsysteme einzusetzen. Darüber hinaus tragen die aktuellen Designs zu einem reduzierten Wasserverbrauch bei und bieten somit einen weiteren ökologischen Vorteil.

Nahaufnahme eines Serverschranks mit mehreren sichtbaren Komponenten auf einem schwarzen Tisch, mit metallischem Gehäuse und Kühlung.Eine Person hält die internen Komponenten eines markenlosen elektronischen Geräts in der Hand und zeigt dabei zahlreiche Anschlüsse.

Die NVLink-Technologie ist ein weiterer zentraler Bestandteil des Vera Rubin NVL72-Systems. Mit ihrer Verbindung der sechsten Generation, allgemein als „NVLink Spine“ bezeichnet, strebt NVIDIA eine bemerkenswerte Gesamtbandbreite von 260 TB/s pro Rack an. Harris betont, dass diese neueste NVLink-Generation ein modulares Design ermöglicht, Wartungsarbeiten ohne Ausfallzeiten erleichtert und die Zuverlässigkeit durch RAS-Dienste auf Rack-Ebene erhöht.

Eine Leiterplatte mit mehreren NVIDIA-Chips, grünen Kühlkörpern und umgebenden Bauteilen.

Während erste Prognosen auf einen höheren Preis des Vera-Rubin-Systems hindeuten, versichert NVIDIA, dass diese Architektur im Vergleich zum Blackwell GB200 eine zehnfache Reduzierung der Inferenz-Token-Kosten und eine vierfache Verringerung der für das Training von Mixture-of-Experts-Modellen (MoE) benötigten GPUs ermöglicht. Dies entspricht der Philosophie des NVIDIA-CEOs, dass höhere Investitionen zu größeren Einsparungen führen.

Quellen & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert