NVIDIA enthüllt Details zum GB10-Superchip für DGX AI-PCs: 3-nm-Technologie, 20 ARM v9.2-CPU-Kerne, 1000 TOPS NVFP4 Blackwell-GPU, LPDDR5x-9400-Speicherunterstützung und 140 W TDP

NVIDIA enthüllt Details zum GB10-Superchip für DGX AI-PCs: 3-nm-Technologie, 20 ARM v9.2-CPU-Kerne, 1000 TOPS NVFP4 Blackwell-GPU, LPDDR5x-9400-Speicherunterstützung und 140 W TDP

NVIDIA hat vor Kurzem seinen hochmodernen GB10-Superchip vorgestellt, der die Blackwell-GPU-Architektur nutzt und die neuesten DGX AI Mini-Supercomputer antreibt.

NVIDIA GB10 Superchip: Eine revolutionäre SoC- und GPU-Architektur

Im Fokus steht derzeit NVIDIAs DGX Spark, das bahnbrechende System mit dem GB10-Superchip, das einen bedeutenden Einstieg in den KI-PC-Markt markiert. Nach seiner Ankündigung haben zahlreiche Unternehmen begonnen, eigene KI-PC-Plattformen auf Basis der GB10-Technologie zu entwickeln. Auf der Hot Chips 2025-Konferenz präsentierte NVIDIA den GB10-Superchip ausführlich und demonstrierte, wie er die Blackwell-Architektur für Mini-Entwicklerstationen und -Workstations effektiv skaliert.

Diagramm der NVIDIA Blackwell GPU-Architektur mit Rechenzentrumsintegration.

Der DGX Spark wurde als Mini-KI-Supercomputer konzipiert, der auf der fortschrittlichen Blackwell-Architektur basiert.

Diagramm zum Bau eines Mini-KI-Supercomputers mit Blackwell-Technologiefunktionen und DGX Spark.

Hauptmerkmale der DGX Spark Workstation

Die DGX Spark Workstation verfügt über mehrere herausragende Funktionen:

  • GB10 Grace Blackwell Superchip: Optimiert für KI-, Data Science-, Compute-, Rendering- und Visualisierungsaufgaben.
  • 128 GB kohärenter einheitlicher Systemspeicher: Kann große KI-Modelle mit bis zu 200 Milliarden Parametern verarbeiten und Modelle mit bis zu 70 Milliarden Parametern feinabstimmen.
  • ConnectX-7-Netzwerk: Erleichtert die Verbindung zwischen zwei DGX Spark-Systemen und ermöglicht die Zusammenarbeit an Modellen mit bis zu 405 Milliarden Parametern.
  • DGX Base OS und NVIDIA AI Software Stack: Dies gewährleistet eine reibungslose Übertragung von Workloads zwischen DGX Spark und DGX Cloud oder einer beliebigen beschleunigten Cloud-Infrastruktur.
  • Vielseitige Bereitstellungsoptionen: Kann entweder als KI-Workstation oder als netzwerkverbundene persönliche KI-Cloud konfiguriert werden.
  • Verbessertes Benutzererlebnis: Bietet Unterstützung für Multi-Head-Displays und verschiedene Konnektivitätsoptionen.
  • Kompaktes und energieeffizientes Design: Passt bequem auf jeden Schreibtisch und funktioniert mit einer Standardsteckdose.
Die NVIDIA DGX Spark Workstation bietet leistungsstarke KI-Funktionen und ein kompaktes, effizientes Design.

Tiefer tauchen: Spezifikationen des GB10-Superchips

Bei genauerer Betrachtung des GB10-Superchips stellt sich heraus, dass sein System-on-Chip (SoC) aus zwei Chips besteht: dem S-Chip, der die CPU und das Speichersubsystem beherbergt, und dem G-Chip, der dem GPU-Kern zugeordnet ist. Beide Chips nutzen die Advanced 2.5D Packaging-Technologie und werden im hochmodernen 3-nm-Prozess von TSMC hergestellt.

NVIDIA GB10 Superchip: KI-Leistungsspezifikationen, einschließlich 20 Arm-Kernen und 128 GB Speicher.

Die CPU-Architektur basiert auf dem v9.2-Design von ARM und umfasst insgesamt 20 Kerne, die in zwei Clustern konfiguriert sind. Jeder Kern verfügt über einen dedizierten L2-Cache sowie einen gemeinsamen L3-Cache von 32 MB, der von den Clustern gemeinsam genutzt wird.

NVIDIA GB10-Datenblatt mit CPU-, GPU- und Speicherdetails.

Der GPU-Teil des Chips nutzt die GB100 Blackwell-Architektur und fungiert aufgrund seiner Platzierung im selben Chipgehäuse als integrierte GPU (iGPU).Er verfügt über fortschrittliche Funktionen, darunter Tensor-Cores der 5. Generation mit DLSS 4-Unterstützung und RTX Ray Tracing-Cores, die eine beeindruckende Rechenleistung von bis zu 31 TFLOPs für FP32- und 1000 TOPS für NVFP4-Operationen (FP4) bieten, die speziell auf KI-Anwendungen zugeschnitten sind. Zusätzlich verfügt die GPU über einen 24 MB großen L2-Cache zur Leistungssteigerung.

In puncto Speicherkapazität unterstützt der NVIDIA GB10 Superchip 256b LPDDR5x (Unified Memory Architecture) mit Zugriffsgeschwindigkeiten von bis zu 9400 MT/s, was einer bemerkenswerten Rohbandbreite von bis zu 301 GB/s entspricht. Dieses Setup ermöglicht eine maximale Speicherkapazität von 128 GB. Sein leistungsstarkes kohärentes Fabric ist auf das CHI-E Coherency Protocol abgestimmt und versorgt die GPU über die C2X-Schnittstelle mit einer umfangreichen Gesamtsystembandbreite von 600 GB/s.

NVIDIA GB10-Spezifikationen: Anzeige, Sicherheit, TDP und Betriebssystemdetails mit Chipgrafik.

Darüber hinaus verfügt das GB10 über einen 16 MB großen System Level Cache, der als L4 für die CPU ausgelegt ist und einen energieeffizienten Datenaustausch zwischen mehreren SoC-Engines ermöglicht. Die C2C-Schnittstelle mit hoher Bandbreite und geringem Stromverbrauch nutzt die NVLINK-Technologie von NVIDIA.

Die Anschlussmöglichkeiten sind vielfältig und unterstützen PCIe, USB und Ethernet über PCIe. Bis zu vier Displays (drei DisplayPorts + ein HDMI-Anschluss) können gleichzeitig mit Auflösungen von bis zu 4K bei 120 Hz im DP-Alt-Modus betrieben werden. Mit HDMI 2.1a werden sogar 8K bei 120 Hz unterstützt. Sicherheit wird ebenfalls großgeschrieben: Dual Secure Root-Unterstützung, ein SROOT-Prozessor, ein OSROOT-Prozessor und Kompatibilität mit fTPM und diskretem TPM. Der Chip arbeitet mit einer Gesamtleistung (TDP) von 140 W.

Diagramm der GB10-Skalierbarkeit mit NVIDIA ConnectX für Multi-GPU-Rechenleistung.

Skalierbarkeit des GB10 Superchips

Ein weiteres bemerkenswertes Merkmal des GB10-Superchips ist seine Skalierbarkeit. Mehrere GB10-Chips können über NVIDIAs ConnectX-Technologie miteinander verbunden werden, was einen verbesserten Durchsatz, eine höhere Bandbreite und höhere DRAM-Kapazitäten ermöglicht, die für die Unterstützung größerer KI-Modelle entscheidend sind. Jede ConnectX-Netzwerkkarte (NIC) ist über eine PCIe Gen5 x8-Schnittstelle mit dem GB10-SoC verbunden, wobei die Einheiten über ein Ethernet-Framework kommunizieren.

Diagramm der Zusammenarbeit zwischen NVIDIA und Mediatek, bei dem CPU- und GPU-Architekturen zur Steigerung der Effizienz zusammengeführt werden.

NVIDIA beschreibt den GB10 Superchip SoC als ein Ergebnis erfolgreicher Partnerschaft mit Mediatek unter Nutzung von Mediateks CPU-IP. Der Chip wurde einer detaillierten Leistungsmodellierung der GPU-Speicherinteraktionen innerhalb der Speicherinfrastruktur von Mediatek unterzogen.

NVIDIA DGX Spark-Computer mit Display, der die KI- und GPU-Leistung für Entwickler optimiert.

Zukunftsaussichten des GB10-Superchips

Das Spannendste am GB10-Superchip ist sein Potenzial, irgendwann auch in den Consumer-Markt, beispielsweise für Laptops und Mini-PCs, vorzudringen. Berichten zufolge könnten die kommenden N1X- und N1-SoCs die ersten verbraucherorientierten NVIDIA-SoCs sein, wobei der GB10 einen Einblick in die Möglichkeiten dieser Chips bietet.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert