NVIDIA ConnectX-8 : SuperNIC pour systèmes Blackwell avec PCIe G6 et vitesse 800 GbE

NVIDIA ConnectX-8 : SuperNIC pour systèmes Blackwell avec PCIe G6 et vitesse 800 GbE

NVIDIA a dévoilé sa carte d’interface réseau (NIC) révolutionnaire ConnectX-8, spécialement conçue pour les systèmes Blackwell. Cette technologie avancée est si avant-gardiste que NVIDIA l’a baptisée SuperNIC.

Dévoilement du ConnectX-8 SuperNIC de NVIDIA pour Blackwell Systems

Dans sa dernière version, NVIDIA met l’accent sur les besoins spécifiques des charges de travail d’entraînement et d’inférence de l’IA. Alors que les tâches d’inférence se caractérisent par leur nature désagrégée et leur sensibilité à la latence, nécessitant une interaction importante avec des systèmes externes, les charges de travail d’entraînement sont synchronisées, longues et sensibles à la latence de queue, mais impliquent moins de communication externe.

Efficacité de la formation et de l'inférence de l'IA avec des politiques de réseau fongibles illustrées.

La carte réseau ConnectX-8, dont les performances sont considérablement améliorées, est compatible avec les technologies Spectrum-X Ethernet et Quantum-X Infiniband, renforçant ainsi sa capacité en tant que SuperNIC.

ConnectX-8 800G SuperNIC : mise en réseau avancée pour l'IA, le RDMA, la fiabilité, la sécurité et l'intégration.

Principales caractéristiques du ConnectX-8 SuperNIC

Les caractéristiques notables du ConnectX-8 incluent :

  • Technologie RDMA robuste exploitée sur des millions de GPU
  • Capacités pour pipelines matériels RDMA jusqu’à 800 G adaptés aux charges de travail de l’IA
  • Protocoles intégrés d’équilibrage de charge, de gestion de la congestion et de fiabilité
  • Programmabilité avancée du chemin de données pour une polyvalence dans les applications d’IA
  • Intégration transparente avec l’architecture du système
  • Améliorations de sécurité de niveau entreprise
Présentation de ConnectX-8 SuperNIC mettant en évidence les fonctionnalités.

Aperçu des spécifications

La carte ConnectX-8 SuperNIC est compatible avec les normes industrielles telles que Verbs, NCCL, NIXL et les API DOCA. Elle offre une solution Infiniband XDR 800 Gbit/s ou une double interface Ethernet 400G, équipée de huit ports maximum. L’intégration d’une interface PCIe Gen6 à 48 voies est facilitée par un commutateur PCIe intégré.

Graphique des performances de mise à l'échelle ConnectX-8 RDMA à 800G.

NVIDIA affirme que les capacités RDMA du ConnectX-8 offrent une évolutivité illimitée à la vitesse révolutionnaire de 800 G sur différentes tailles de messages, allant de 64 Ko à 1 Mo. Cela permet au SuperNIC de fonctionner comme un ASIC interconnectant les GPU avec d’autres clusters de manière transparente.

Diagramme des composants d'un centre de données traditionnel.

Dans un premier temps, la carte réseau ConnectX-8 sera déployée sur les systèmes Blackwell GB300 NVL72 de NVIDIA, équipés du nouveau GPU Blackwell Ultra. Le commutateur PCIe CX8 introduit permet une utilisation optimisée de la bande passante sur l’architecture NVLINK.

Schéma du commutateur PCIe ConnectX-8.

Chaque commutateur PCIe CX8 intègre des voies Gen5 x16 pour le processeur Grace et des voies Gen6 x16 configurées pour le GPU Blackwell Ultra, complétées par une voie PCIe Gen5 x4 pour les SSD.

Schéma du centre de données ConnectX.

Évolutivité sur toutes les configurations GPU

NVIDIA a illustré comment le ConnectX-8 atteint des capacités de mise à l’échelle remarquables sur des configurations allant jusqu’à 64 GPU.

Schéma d'intégration de l'échelle GPU ConnectX-8 par NVIDIA.

À l’ère où l’évolutivité de l’IA est primordiale, le commutateur Ethernet Spectrum-X intégré ConnectX-8 de NVIDIA s’impose comme une solution performante, étendant les fonctionnalités de l’infrastructure Ethernet Spectrum-X existante. Ce système offre des fonctions avancées d’équilibrage de charge et de contrôle de congestion, essentielles aux charges de travail d’IA, tandis que le processeur de paquets ConnectX-8 renforce les capacités de sécurité et de routage des environnements IA.

Commutateur ConnectX-8 pour une IA évolutive.
ConnectX-8 RDMA présente des solutions de réseau IA.
Diagramme du processeur de paquets ConnectX-8.
Diagramme de l'accélérateur de chemin de données ConnectX-8.
Fonctionnalités Ethernet Spectrum-X pour les charges de travail d'IA.
Contrôle de congestion ConnectX-8 dans le matériel.

Le ConnectX-8 intègre un accélérateur de chemin de données (Data Path Accelerator), un processeur d’événements RISC-V 16T, conçu pour garantir un fonctionnement optimal du réseau. NVIDIA affirme que la technologie Ethernet Spectrum-X permet de réduire de 60 % le temps d’apprentissage, ainsi que de réduire considérablement la latence de queue par rapport aux cartes réseau et commutateurs RDMA traditionnels.

Graphique comparant le temps d'étape de formation Ethernet Spectrum-X.
Graphique illustrant les performances de latence de queue de Spectrum-X Ethernet.

Indicateurs de performance

Les données récentes de NVIDIA sur les performances de Spectrum-X incluent des mesures impressionnantes :

  • Bande passante effective augmentée de 1, 6x grâce à l’équilibrage de charge
  • Bande passante collective améliorée de 1, 3x impactant la latence de queue
  • Augmentation de 2, 2x de la bande passante entièrement réduite pour une isolation phonique optimale
  • Augmentation de 1, 3x de la bande passante globale garantissant la résilience
  • Accélération 1000x de la collecte de données télémétriques pour les besoins haute fréquence
Visualisation des mesures de performance Spectrum-X.

Avec des performances révolutionnaires de 800 G et la prise en charge du PCIe Gen6, les cartes réseau Spectrum-X et ConnectX-8 SuperNIC de NVIDIA vont révolutionner le paysage réseau des systèmes Blackwell. Plus de détails et de développements sont attendus dans les prochains mois.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *