NVIDIAs kommende Rubin-KI-Server sollen voraussichtlich im August 2023 ausgeliefert werden; der Hauptlieferant Quanta meldet eine reibungslose Massenproduktion.

NVIDIAs kommende Rubin-KI-Server sollen voraussichtlich im August 2023 ausgeliefert werden; der Hauptlieferant Quanta meldet eine reibungslose Massenproduktion.

NVIDIA ist bereit, seine Vera Rubin AI-Racks der nächsten Generation bis zum dritten Quartal dieses Jahres an Kunden auszuliefern, obwohl die anfänglichen Produktionsmengen voraussichtlich begrenzt sein werden.

Die Zulieferer erwarten einen reibungslosen Produktionsstart von Vera Rubin dank der Beibehaltung von Blackwell Components.

In einer bemerkenswerten Ankündigung bestätigte NVIDIA, dass die Vera-Rubin-Plattform im ersten Quartal 2026 in die Serienproduktion ging. Dieser Meilenstein übertraf die Markterwartungen und unterstreicht NVIDIAs Engagement für eine beschleunigte Produkteinführung. Der genaue Zeitplan für die Auslieferung der ersten KI-Racks an Hyperscaler ist zwar noch nicht bekannt, doch Mike Yang, Executive Vice President von Quanta, deutete an, dass Kunden bereits ab August 2026 erste Einheiten erhalten könnten. Dies würde eine vollständige Integration in die Systeme der Hyperscaler bis Ende des Jahres ermöglichen.

Der Übergang von Chiplet-Designs zu fortschrittlichen Packaging-Technologien und der Integration von High-Bandwidth Memory (HBM) weckte Bedenken hinsichtlich der Fähigkeit von NVIDIA, den geplanten Zeitplan für das zweite Halbjahr 2026 einzuhalten. Yang versicherte jedoch, dass viele Komponenten der Rubin-Infrastruktur von der Blackwell-Serie abgeleitet seien, wodurch die Produktionsrisiken in dieser Phase minimiert würden. Es wird erwartet, dass NVIDIA eine ähnliche Strategie mit zunächst geringen Stückzahlen wie bei Blackwell Ultra verfolgen und die Produktion Anfang nächsten Jahres steigern wird.

Eine Person steht auf der Bühne und präsentiert verschiedene geöffnete Servereinheiten mit sichtbaren Kühlsystemen und Hardwarekomponenten.
Bildnachweis: NVIDIA

Die Rubin-Produktpalette wurde auf der diesjährigen CES ausführlich vorgestellt und präsentierte eine bemerkenswerte Auswahl von sechs Chips, die sowohl die Netzwerk- als auch die Rechenleistung verbessern. Zu den vorgestellten Chips gehören:

  • Rubin-GPU (336 Milliarden Transistoren)
  • Vera-CPU (227 Milliarden Transistoren)
  • NVLINK 6-Switch für die Verbindung
  • CX9 & BF4 für Netzwerktechnik
  • Spectrum-X 102.4T CPO für Siliziumphotonik

Obwohl NVIDIA auf der letztjährigen GTC eine NVL144-Konfiguration angekündigt hat, werden die ersten Auslieferungen der Rubin-Serie voraussichtlich auf die NVL72-Konfiguration beschränkt sein. Diese Strategie zielt darauf ab, die Anzahl der Chips überschaubar zu halten, die Wärmeabgabe zu kontrollieren und den Produktionsprozess zu optimieren. NVIDIAs Erfahrungen beim Übergang von Blackwell zu Blackwell Ultra haben die Komplexität der Anpassung an Architekturänderungen, insbesondere bei der Implementierung des Cordelia-Board-Designs, deutlich gemacht.

Ein Bild, das die Ankündigung der „NVIDIA Rubin Platform“ mit sechs neuen Chips mit den Bezeichnungen Vera, Rubin, NVLink 6 Switch, CX9, BF4 und Spectrum-X 102.4T CPO über einem KI-Supercomputer namens „Vera Rubin POD“ zeigt, mit dem NVIDIA-Logo in der unteren rechten Ecke.
Bildnachweis: NVIDIA

Die Rubin-AI-Serie von NVIDIA wird voraussichtlich zwischen dem vierten Quartal 2026 und dem ersten Quartal 2027 vollständig von Hyperscalern eingeführt, wobei zukünftige Modelle die Leistung deutlich steigern sollen. Zu den ersten Anwendern dieser Spitzentechnologie zählen Branchengrößen wie OpenAI, Microsoft und Google sowie innovative Cloud-Anbieter wie CoreWeave.

Quellen & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert