NVIDIA ConnectX-8: SuperNIC für Blackwell-Systeme mit PCIe G6 und 800GbE-Geschwindigkeit

NVIDIA ConnectX-8: SuperNIC für Blackwell-Systeme mit PCIe G6 und 800GbE-Geschwindigkeit

NVIDIA hat seine revolutionäre ConnectX-8-Netzwerkschnittstellenkarte (NIC) vorgestellt, die speziell für die Blackwell-Systeme entwickelt wurde. Diese fortschrittliche Technologie ist so innovativ, dass NVIDIA sie SuperNIC genannt hat.

Vorstellung von NVIDIAs ConnectX-8 SuperNIC für Blackwell Systems

In seiner neuesten Version betont NVIDIA die besonderen Anforderungen von KI-Trainings- und Inferenz-Workloads. Während Inferenzaufgaben durch ihre disaggregierte Natur und Latenzempfindlichkeit gekennzeichnet sind und eine umfangreiche Interaktion mit externen Systemen erfordern, sind Trainings-Workloads synchronisiert, langwierig und empfindlich gegenüber der Tail-Latenz, erfordern aber weniger externe Kommunikation.

KI-Training und Inferenzeffizienz mit fungiblen Netzwerkrichtlinien veranschaulicht.

Die ConnectX-8-NIC wurde hinsichtlich ihrer Leistung erheblich verbessert und ist sowohl mit der Spectrum-X-Ethernet- als auch mit der Quantum-X-Infiniband-Technologie kompatibel, was ihre Eignung als SuperNIC weiter stärkt.

ConnectX-8 800G SuperNIC: Erweiterte Vernetzung für KI, RDMA, Zuverlässigkeit, Sicherheit und Integration.

Hauptmerkmale des ConnectX-8 SuperNIC

Zu den bemerkenswerten Funktionen des ConnectX-8 gehören:

  • Robuste RDMA-Technologie, die über Millionen von GPUs genutzt wird
  • Kapazitäten für bis zu 800G RDMA-Hardware-Pipelines, zugeschnitten auf KI-Workloads
  • Integrierte Protokolle für Lastausgleich, Überlastungsmanagement und Zuverlässigkeit
  • Erweiterte Datenpfadprogrammierbarkeit für Vielseitigkeit in KI-Anwendungen
  • Nahtlose Integration in die Systemarchitektur
  • Sicherheitsverbesserungen auf Unternehmensniveau
Übersicht über ConnectX-8 SuperNIC mit hervorgehobenen Funktionen.

Spezifikationsübersicht

Die ConnectX-8 SuperNIC ist kompatibel mit Industriestandards wie Verbs, NCCL, NIXL und DOCA APIs. Sie bietet eine 800 Gb/s Infiniband XDR-Lösung oder eine duale 400G Ethernet-Schnittstelle mit bis zu acht Ports. Die Integration einer PCIe Gen6-Schnittstelle mit 48 Lanes wird durch einen integrierten PCIe-Switch ermöglicht.

Diagramm der ConnectX-8 RDMA-Skalierungsleistung bei 800 G.

NVIDIA gibt an, dass die RDMA-Funktionen des ConnectX-8 unbegrenzte Skalierbarkeit mit der bahnbrechenden Geschwindigkeit von 800G über verschiedene Nachrichtengrößen von 64 KB bis 1 MB bieten. Dadurch kann der SuperNIC als ASIC fungieren, der GPUs nahtlos mit anderen Clustern verbindet.

Diagramm der traditionellen Rechenzentrumskomponenten.

Zunächst wird die ConnectX-8-Netzwerkkarte in NVIDIAs fortschrittlichen Blackwell GB300 NVL72-Systemen eingesetzt, die mit der neuen Blackwell Ultra GPU ausgestattet sind. Der eingeführte CX8 PCIe-Switch ermöglicht eine optimierte Bandbreitennutzung über die gesamte NVLINK-Architektur.

ConnectX-8 PCIe-Switch-Diagramm.

Jeder CX8 PCIe-Switch enthält Gen5 x16-Lanes für die Grace-CPU und Gen6 x16-Lanes, die für die Blackwell Ultra-GPU konfiguriert sind, ergänzt durch eine PCIe Gen5 x4-Lane für SSDs.

Diagramm des ConnectX-Rechenzentrums.

Skalierbarkeit über GPU-Konfigurationen hinweg

NVIDIA hat veranschaulicht, wie ConnectX-8 bemerkenswerte Skalierungsmöglichkeiten über Konfigurationen von bis zu 64 GPUs hinweg erreicht.

Diagramm der ConnectX-8 GPU-Skalenintegration von NVIDIA.

In einer Zeit, in der KI-Skalierbarkeit von größter Bedeutung ist, erweist sich der ConnectX-8 Integrated Spectrum-X Ethernet Switch von NVIDIA als leistungsstarke Lösung, die die Funktionalität des bestehenden Spectrum-X Ethernet-Frameworks erweitert. Dieses System bietet erweiterte Lastausgleichs- und Überlastungskontrollfunktionen, die für KI-Workloads entscheidend sind, während der ConnectX-8 Packet Processor die Sicherheits- und Routing-Funktionen für KI-Umgebungen verbessert.

ConnectX-8-Switch für skalierbare KI.
ConnectX-8 RDMA präsentiert KI-Netzwerklösungen.
ConnectX-8-Paketprozessordiagramm.
ConnectX-8 Data Path Accelerator-Diagramm.
Spectrum-X-Ethernet-Funktionen für KI-Workloads.
ConnectX-8-Überlastungskontrolle in Hardware.

ConnectX-8 enthält einen Data Path Accelerator, einen 16T RISC-V-Ereignisprozessor, der für maximale Netzwerkeffizienz sorgt. NVIDIA rühmt sich, dass die Spectrum-X-Ethernet-Technologie die Trainingsschrittzeit um 60 % verkürzt und die Tail-Latenz im Vergleich zu herkömmlichen RDMA-Netzwerkkarten und -Switches drastisch reduziert.

Diagramm zum Vergleich der Trainingsschrittzeiten von Spectrum-X Ethernet.
Diagramm, das die Latenzleistung des Spectrum-X-Ethernets darstellt.

Leistungsmetriken

Aktuelle Daten von NVIDIA zur Spectrum-X-Leistung enthalten beeindruckende Kennzahlen:

  • 1, 6-fach höhere effektive Bandbreite durch Lastenausgleich
  • 1, 3-fach verbesserte kollektive Bandbreite mit Auswirkungen auf die Tail-Latenz
  • 2, 2-fache Steigerung der All-Reduce-Bandbreite zur Geräuschisolierung
  • 1, 3-fache Erhöhung der Gesamtbandbreite für mehr Ausfallsicherheit
  • 1000-fache Beschleunigung bei der Telemetrieerfassung für Hochfrequenzanforderungen
Visualisierung der Spectrum-X-Leistungsmetriken.

Mit einer bahnbrechenden Leistung von 800G und Unterstützung für PCIe Gen6 werden NVIDIAs Spectrum-X und ConnectX-8 SuperNIC die Netzwerklandschaft in den Blackwell-Systemen revolutionieren. Weitere Details und Entwicklungen werden in den kommenden Monaten erwartet.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert