
NVIDIA hat seine revolutionäre ConnectX-8-Netzwerkschnittstellenkarte (NIC) vorgestellt, die speziell für die Blackwell-Systeme entwickelt wurde. Diese fortschrittliche Technologie ist so innovativ, dass NVIDIA sie SuperNIC genannt hat.
Vorstellung von NVIDIAs ConnectX-8 SuperNIC für Blackwell Systems
In seiner neuesten Version betont NVIDIA die besonderen Anforderungen von KI-Trainings- und Inferenz-Workloads. Während Inferenzaufgaben durch ihre disaggregierte Natur und Latenzempfindlichkeit gekennzeichnet sind und eine umfangreiche Interaktion mit externen Systemen erfordern, sind Trainings-Workloads synchronisiert, langwierig und empfindlich gegenüber der Tail-Latenz, erfordern aber weniger externe Kommunikation.

Die ConnectX-8-NIC wurde hinsichtlich ihrer Leistung erheblich verbessert und ist sowohl mit der Spectrum-X-Ethernet- als auch mit der Quantum-X-Infiniband-Technologie kompatibel, was ihre Eignung als SuperNIC weiter stärkt.

Hauptmerkmale des ConnectX-8 SuperNIC
Zu den bemerkenswerten Funktionen des ConnectX-8 gehören:
- Robuste RDMA-Technologie, die über Millionen von GPUs genutzt wird
- Kapazitäten für bis zu 800G RDMA-Hardware-Pipelines, zugeschnitten auf KI-Workloads
- Integrierte Protokolle für Lastausgleich, Überlastungsmanagement und Zuverlässigkeit
- Erweiterte Datenpfadprogrammierbarkeit für Vielseitigkeit in KI-Anwendungen
- Nahtlose Integration in die Systemarchitektur
- Sicherheitsverbesserungen auf Unternehmensniveau

Spezifikationsübersicht
Die ConnectX-8 SuperNIC ist kompatibel mit Industriestandards wie Verbs, NCCL, NIXL und DOCA APIs. Sie bietet eine 800 Gb/s Infiniband XDR-Lösung oder eine duale 400G Ethernet-Schnittstelle mit bis zu acht Ports. Die Integration einer PCIe Gen6-Schnittstelle mit 48 Lanes wird durch einen integrierten PCIe-Switch ermöglicht.

NVIDIA gibt an, dass die RDMA-Funktionen des ConnectX-8 unbegrenzte Skalierbarkeit mit der bahnbrechenden Geschwindigkeit von 800G über verschiedene Nachrichtengrößen von 64 KB bis 1 MB bieten. Dadurch kann der SuperNIC als ASIC fungieren, der GPUs nahtlos mit anderen Clustern verbindet.

Zunächst wird die ConnectX-8-Netzwerkkarte in NVIDIAs fortschrittlichen Blackwell GB300 NVL72-Systemen eingesetzt, die mit der neuen Blackwell Ultra GPU ausgestattet sind. Der eingeführte CX8 PCIe-Switch ermöglicht eine optimierte Bandbreitennutzung über die gesamte NVLINK-Architektur.

Jeder CX8 PCIe-Switch enthält Gen5 x16-Lanes für die Grace-CPU und Gen6 x16-Lanes, die für die Blackwell Ultra-GPU konfiguriert sind, ergänzt durch eine PCIe Gen5 x4-Lane für SSDs.

Skalierbarkeit über GPU-Konfigurationen hinweg
NVIDIA hat veranschaulicht, wie ConnectX-8 bemerkenswerte Skalierungsmöglichkeiten über Konfigurationen von bis zu 64 GPUs hinweg erreicht.

In einer Zeit, in der KI-Skalierbarkeit von größter Bedeutung ist, erweist sich der ConnectX-8 Integrated Spectrum-X Ethernet Switch von NVIDIA als leistungsstarke Lösung, die die Funktionalität des bestehenden Spectrum-X Ethernet-Frameworks erweitert. Dieses System bietet erweiterte Lastausgleichs- und Überlastungskontrollfunktionen, die für KI-Workloads entscheidend sind, während der ConnectX-8 Packet Processor die Sicherheits- und Routing-Funktionen für KI-Umgebungen verbessert.






ConnectX-8 enthält einen Data Path Accelerator, einen 16T RISC-V-Ereignisprozessor, der für maximale Netzwerkeffizienz sorgt. NVIDIA rühmt sich, dass die Spectrum-X-Ethernet-Technologie die Trainingsschrittzeit um 60 % verkürzt und die Tail-Latenz im Vergleich zu herkömmlichen RDMA-Netzwerkkarten und -Switches drastisch reduziert.


Leistungsmetriken
Aktuelle Daten von NVIDIA zur Spectrum-X-Leistung enthalten beeindruckende Kennzahlen:
- 1, 6-fach höhere effektive Bandbreite durch Lastenausgleich
- 1, 3-fach verbesserte kollektive Bandbreite mit Auswirkungen auf die Tail-Latenz
- 2, 2-fache Steigerung der All-Reduce-Bandbreite zur Geräuschisolierung
- 1, 3-fache Erhöhung der Gesamtbandbreite für mehr Ausfallsicherheit
- 1000-fache Beschleunigung bei der Telemetrieerfassung für Hochfrequenzanforderungen

Mit einer bahnbrechenden Leistung von 800G und Unterstützung für PCIe Gen6 werden NVIDIAs Spectrum-X und ConnectX-8 SuperNIC die Netzwerklandschaft in den Blackwell-Systemen revolutionieren. Weitere Details und Entwicklungen werden in den kommenden Monaten erwartet.
Schreibe einen Kommentar