NVIDIA ConnectX-8: SuperNIC dla systemów Blackwell z obsługą PCIe G6 i szybkością 800 GbE

NVIDIA ConnectX-8: SuperNIC dla systemów Blackwell z obsługą PCIe G6 i szybkością 800 GbE

NVIDIA zaprezentowała swoją rewolucyjną kartę sieciową ConnectX-8 (NIC), zaprojektowaną specjalnie dla systemów Blackwell. Ta zaawansowana technologia jest tak nowatorska, że ​​NVIDIA nadała jej nazwę SuperNIC.

Prezentacja karty sieciowej ConnectX-8 SuperNIC firmy NVIDIA dla systemów Blackwell

W najnowszej wersji NVIDIA podkreśla specyficzne potrzeby obciążeń związanych z treningiem i wnioskowaniem sztucznej inteligencji. Podczas gdy zadania wnioskowania charakteryzują się rozproszonym charakterem i wrażliwością na opóźnienia, wymagając rozległej interakcji z systemami zewnętrznymi, obciążenia szkoleniowe są zsynchronizowane, czasochłonne i wrażliwe na opóźnienia ogonowe, ale wymagają mniejszej komunikacji zewnętrznej.

Ilustracja efektywności szkolenia sztucznej inteligencji i wnioskowania przy użyciu zmiennych zasad sieciowych.

Karta sieciowa ConnectX-8 została znacznie udoskonalona pod kątem wydajności i jest kompatybilna z technologiami Spectrum-X Ethernet i Quantum-X Infiniband, co jeszcze bardziej wzmacnia jej przydatność jako karty SuperNIC.

ConnectX-8 800G SuperNIC: zaawansowana sieć zapewniająca sztuczną inteligencję, RDMA, niezawodność, bezpieczeństwo i integrację.

Główne cechy karty ConnectX-8 SuperNIC

Do najważniejszych cech ConnectX-8 należą:

  • Solidna technologia RDMA wykorzystywana na milionach procesorów graficznych
  • Pojemność do 800G dla sprzętowych potoków RDMA dostosowanych do obciążeń AI
  • Wbudowane równoważenie obciążenia, zarządzanie przeciążeniem i protokoły niezawodności
  • Zaawansowana programowalność ścieżki danych zapewniająca wszechstronność w aplikacjach AI
  • Bezproblemowa integracja z architekturą systemu
  • Ulepszenia bezpieczeństwa klasy korporacyjnej
Omówienie funkcji ConnectX-8 SuperNIC.

Przegląd specyfikacji

Karta sieciowa ConnectX-8 SuperNIC oferuje zgodność ze standardami branżowymi, takimi jak Verbs, NCCL, NIXL i DOCA API. Oferuje rozwiązanie Infiniband XDR o przepustowości 800 Gb/s lub podwójny interfejs Ethernet 400G, wyposażony w maksymalnie osiem portów. Integrację interfejsu PCIe Gen6 z 48 liniami ułatwia wbudowany przełącznik PCIe.

Wykres wydajności skalowania RDMA ConnectX-8 przy prędkości 800G.

Firma NVIDIA twierdzi, że możliwości RDMA karty ConnectX-8 oferują nieograniczoną skalowalność z przełomową prędkością 800 Gb/s przy różnych rozmiarach komunikatów, od 64 KB do 1 MB. Dzięki temu SuperNIC może działać jako układ ASIC, który płynnie łączy procesory graficzne z innymi klastrami.

Schemat tradycyjnych komponentów centrum danych.

Początkowo karta sieciowa ConnectX-8 będzie wdrażana w zaawansowanych systemach NVIDIA Blackwell GB300 NVL72, wyposażonych w nowy procesor graficzny Blackwell Ultra. Wprowadzony przełącznik PCIe CX8 umożliwia zoptymalizowane wykorzystanie przepustowości w całej architekturze NVLINK.

Schemat przełącznika ConnectX-8 PCIe.

Każdy przełącznik CX8 PCIe zawiera linie Gen5 x16 dla procesora Grace i linie Gen6 x16 skonfigurowane dla procesora graficznego Blackwell Ultra, uzupełnione linią PCIe Gen5 x4 dla dysków SSD.

Schemat centrum danych ConnectX.

Skalowalność w różnych konfiguracjach GPU

Firma NVIDIA pokazała, w jaki sposób ConnectX-8 zapewnia niezwykłe możliwości skalowania w konfiguracjach obejmujących nawet 64 procesory GPU.

Schemat integracji skali procesora graficznego ConnectX-8 firmy NVIDIA.

W erze, w której skalowalność sztucznej inteligencji ma kluczowe znaczenie, zintegrowany przełącznik Ethernet Spectrum-X firmy NVIDIA ConnectX-8 staje się potężnym rozwiązaniem, rozszerzającym funkcjonalność istniejącej infrastruktury Ethernet Spectrum-X. System ten oferuje zaawansowane funkcje równoważenia obciążenia i kontroli przeciążenia, kluczowe dla obciążeń AI, a procesor pakietów ConnectX-8 wzmacnia bezpieczeństwo i możliwości routingu w środowiskach AI.

Przełącznik ConnectX-8 zapewniający skalowalną sztuczną inteligencję.
ConnectX-8 RDMA prezentuje rozwiązania sieciowe oparte na sztucznej inteligencji.
Schemat procesora pakietów ConnectX-8.
Schemat akceleratora ścieżki danych ConnectX-8.
Funkcje Spectrum-X Ethernet dla obciążeń AI.
Kontrola przeciążenia ConnectX-8 w sprzęcie.

ConnectX-8 zawiera akcelerator ścieżki danych (Data Path Accelerator), 16-bitowy procesor zdarzeń RISC-V, zaprojektowany w celu zapewnienia maksymalnej wydajności sieci. NVIDIA chwali się, że technologia Spectrum-X Ethernet pozwala na skrócenie czasu szkolenia o 60%, a także drastyczną redukcję opóźnień w porównaniu z tradycyjnymi kartami sieciowymi i przełącznikami RDMA.

Wykres porównujący czas trwania etapu szkolenia Ethernetu Spectrum-X.
Wykres przedstawiający wydajność opóźnienia ogonowego Ethernetu Spectrum-X.

Metryki wydajności

Najnowsze dane firmy NVIDIA dotyczące wydajności Spectrum-X zawierają imponujące wyniki:

  • 1, 6-krotnie większa efektywna przepustowość dzięki równoważeniu obciążenia
  • 1, 3-krotnie zwiększona zbiorcza przepustowość wpływająca na opóźnienie końcowe
  • 2, 2-krotny wzrost przepustowości w trybie all-reduce w celu izolacji szumów
  • 1, 3-krotny wzrost przepustowości między wszystkimi urządzeniami, zapewniający odporność
  • 1000-krotne przyspieszenie w zbieraniu danych telemetrycznych dla potrzeb wysokiej częstotliwości
Wizualizacja wskaźników wydajności Spectrum-X.

Dzięki przełomowej wydajności 800G i obsłudze PCIe Gen6, karty graficzne Spectrum-X i ConnectX-8 SuperNIC firmy NVIDIA zrewolucjonizują środowisko sieciowe w systemach Blackwell. Więcej szczegółów i informacji o rozwoju sytuacji spodziewanych jest w nadchodzących miesiącach.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *