
NVIDIA hat vor Kurzem seinen hochmodernen GB10-Superchip vorgestellt, der die Blackwell-GPU-Architektur nutzt und die neuesten DGX AI Mini-Supercomputer antreibt.
NVIDIA GB10 Superchip: Eine revolutionäre SoC- und GPU-Architektur
Im Fokus steht derzeit NVIDIAs DGX Spark, das bahnbrechende System mit dem GB10-Superchip, das einen bedeutenden Einstieg in den KI-PC-Markt markiert. Nach seiner Ankündigung haben zahlreiche Unternehmen begonnen, eigene KI-PC-Plattformen auf Basis der GB10-Technologie zu entwickeln. Auf der Hot Chips 2025-Konferenz präsentierte NVIDIA den GB10-Superchip ausführlich und demonstrierte, wie er die Blackwell-Architektur für Mini-Entwicklerstationen und -Workstations effektiv skaliert.

Der DGX Spark wurde als Mini-KI-Supercomputer konzipiert, der auf der fortschrittlichen Blackwell-Architektur basiert.

Hauptmerkmale der DGX Spark Workstation
Die DGX Spark Workstation verfügt über mehrere herausragende Funktionen:
- GB10 Grace Blackwell Superchip: Optimiert für KI-, Data Science-, Compute-, Rendering- und Visualisierungsaufgaben.
- 128 GB kohärenter einheitlicher Systemspeicher: Kann große KI-Modelle mit bis zu 200 Milliarden Parametern verarbeiten und Modelle mit bis zu 70 Milliarden Parametern feinabstimmen.
- ConnectX-7-Netzwerk: Erleichtert die Verbindung zwischen zwei DGX Spark-Systemen und ermöglicht die Zusammenarbeit an Modellen mit bis zu 405 Milliarden Parametern.
- DGX Base OS und NVIDIA AI Software Stack: Dies gewährleistet eine reibungslose Übertragung von Workloads zwischen DGX Spark und DGX Cloud oder einer beliebigen beschleunigten Cloud-Infrastruktur.
- Vielseitige Bereitstellungsoptionen: Kann entweder als KI-Workstation oder als netzwerkverbundene persönliche KI-Cloud konfiguriert werden.
- Verbessertes Benutzererlebnis: Bietet Unterstützung für Multi-Head-Displays und verschiedene Konnektivitätsoptionen.
- Kompaktes und energieeffizientes Design: Passt bequem auf jeden Schreibtisch und funktioniert mit einer Standardsteckdose.

Tiefer tauchen: Spezifikationen des GB10-Superchips
Bei genauerer Betrachtung des GB10-Superchips stellt sich heraus, dass sein System-on-Chip (SoC) aus zwei Chips besteht: dem S-Chip, der die CPU und das Speichersubsystem beherbergt, und dem G-Chip, der dem GPU-Kern zugeordnet ist. Beide Chips nutzen die Advanced 2.5D Packaging-Technologie und werden im hochmodernen 3-nm-Prozess von TSMC hergestellt.

Die CPU-Architektur basiert auf dem v9.2-Design von ARM und umfasst insgesamt 20 Kerne, die in zwei Clustern konfiguriert sind. Jeder Kern verfügt über einen dedizierten L2-Cache sowie einen gemeinsamen L3-Cache von 32 MB, der von den Clustern gemeinsam genutzt wird.

Der GPU-Teil des Chips nutzt die GB100 Blackwell-Architektur und fungiert aufgrund seiner Platzierung im selben Chipgehäuse als integrierte GPU (iGPU).Er verfügt über fortschrittliche Funktionen, darunter Tensor-Cores der 5. Generation mit DLSS 4-Unterstützung und RTX Ray Tracing-Cores, die eine beeindruckende Rechenleistung von bis zu 31 TFLOPs für FP32- und 1000 TOPS für NVFP4-Operationen (FP4) bieten, die speziell auf KI-Anwendungen zugeschnitten sind. Zusätzlich verfügt die GPU über einen 24 MB großen L2-Cache zur Leistungssteigerung.
In puncto Speicherkapazität unterstützt der NVIDIA GB10 Superchip 256b LPDDR5x (Unified Memory Architecture) mit Zugriffsgeschwindigkeiten von bis zu 9400 MT/s, was einer bemerkenswerten Rohbandbreite von bis zu 301 GB/s entspricht. Dieses Setup ermöglicht eine maximale Speicherkapazität von 128 GB. Sein leistungsstarkes kohärentes Fabric ist auf das CHI-E Coherency Protocol abgestimmt und versorgt die GPU über die C2X-Schnittstelle mit einer umfangreichen Gesamtsystembandbreite von 600 GB/s.

Darüber hinaus verfügt das GB10 über einen 16 MB großen System Level Cache, der als L4 für die CPU ausgelegt ist und einen energieeffizienten Datenaustausch zwischen mehreren SoC-Engines ermöglicht. Die C2C-Schnittstelle mit hoher Bandbreite und geringem Stromverbrauch nutzt die NVLINK-Technologie von NVIDIA.
Die Anschlussmöglichkeiten sind vielfältig und unterstützen PCIe, USB und Ethernet über PCIe. Bis zu vier Displays (drei DisplayPorts + ein HDMI-Anschluss) können gleichzeitig mit Auflösungen von bis zu 4K bei 120 Hz im DP-Alt-Modus betrieben werden. Mit HDMI 2.1a werden sogar 8K bei 120 Hz unterstützt. Sicherheit wird ebenfalls großgeschrieben: Dual Secure Root-Unterstützung, ein SROOT-Prozessor, ein OSROOT-Prozessor und Kompatibilität mit fTPM und diskretem TPM. Der Chip arbeitet mit einer Gesamtleistung (TDP) von 140 W.

Skalierbarkeit des GB10 Superchips
Ein weiteres bemerkenswertes Merkmal des GB10-Superchips ist seine Skalierbarkeit. Mehrere GB10-Chips können über NVIDIAs ConnectX-Technologie miteinander verbunden werden, was einen verbesserten Durchsatz, eine höhere Bandbreite und höhere DRAM-Kapazitäten ermöglicht, die für die Unterstützung größerer KI-Modelle entscheidend sind. Jede ConnectX-Netzwerkkarte (NIC) ist über eine PCIe Gen5 x8-Schnittstelle mit dem GB10-SoC verbunden, wobei die Einheiten über ein Ethernet-Framework kommunizieren.

NVIDIA beschreibt den GB10 Superchip SoC als ein Ergebnis erfolgreicher Partnerschaft mit Mediatek unter Nutzung von Mediateks CPU-IP. Der Chip wurde einer detaillierten Leistungsmodellierung der GPU-Speicherinteraktionen innerhalb der Speicherinfrastruktur von Mediatek unterzogen.

Zukunftsaussichten des GB10-Superchips
Das Spannendste am GB10-Superchip ist sein Potenzial, irgendwann auch in den Consumer-Markt, beispielsweise für Laptops und Mini-PCs, vorzudringen. Berichten zufolge könnten die kommenden N1X- und N1-SoCs die ersten verbraucherorientierten NVIDIA-SoCs sein, wobei der GB10 einen Einblick in die Möglichkeiten dieser Chips bietet.
Schreibe einen Kommentar