NVIDIA ConnectX-8: SuperNIC per sistemi Blackwell con velocità PCIe G6 e 800GbE

NVIDIA ConnectX-8: SuperNIC per sistemi Blackwell con velocità PCIe G6 e 800GbE

NVIDIA ha presentato la sua rivoluzionaria scheda di interfaccia di rete (NIC) ConnectX-8, progettata specificamente per i sistemi Blackwell. Questa tecnologia avanzata è così all’avanguardia che NVIDIA l’ha soprannominata SuperNIC.

Presentazione di ConnectX-8 SuperNIC di NVIDIA per Blackwell Systems

Nella sua ultima release, NVIDIA sottolinea le specifiche esigenze dei carichi di lavoro di training e inferenza dell’IA. Mentre le attività di inferenza sono caratterizzate dalla loro natura disaggregata e dalla sensibilità alla latenza, richiedendo un’ampia interazione con sistemi esterni, i carichi di lavoro di training sono sincronizzati, lunghi e sensibili alla latenza di coda, ma comportano meno comunicazioni esterne.

Efficienza dell'addestramento e dell'inferenza dell'intelligenza artificiale illustrata con policy di rete fungibili.

La scheda di rete ConnectX-8, notevolmente migliorata in termini di prestazioni, è compatibile sia con le tecnologie Spectrum-X Ethernet che Quantum-X Infiniband, consolidando ulteriormente la sua capacità di SuperNIC.

ConnectX-8 800G SuperNIC: networking avanzato per AI, RDMA, affidabilità, sicurezza e integrazione.

Caratteristiche principali di ConnectX-8 SuperNIC

Le caratteristiche più importanti del ConnectX-8 includono:

  • Robusta tecnologia RDMA sfruttata su milioni di GPU
  • Capacità per pipeline hardware RDMA fino a 800G su misura per carichi di lavoro AI
  • Protocolli integrati di bilanciamento del carico, gestione della congestione e affidabilità
  • Programmabilità avanzata del percorso dati per la versatilità nelle applicazioni di intelligenza artificiale
  • Integrazione perfetta con l’architettura del sistema
  • Miglioramenti della sicurezza di livello aziendale
Panoramica di ConnectX-8 SuperNIC con evidenziate le funzionalità.

Panoramica delle specifiche

ConnectX-8 SuperNIC vanta la compatibilità con standard di settore come Verbs, NCCL, NIXL e API DOCA. Offre una soluzione Infiniband XDR da 800 Gb/s o una doppia interfaccia Ethernet da 400 Gb/s, dotata di un massimo di otto porte. L’integrazione di un’interfaccia PCIe Gen6 a 48 canali è facilitata da uno switch PCIe integrato.

Grafico delle prestazioni di ridimensionamento RDMA di ConnectX-8 a 800G.

NVIDIA ha affermato che le funzionalità RDMA di ConnectX-8 offrono una scalabilità illimitata alla velocità rivoluzionaria di 800G su varie dimensioni di messaggio, da 64 KB a 1 MB. Ciò consente a SuperNIC di funzionare come un ASIC che interconnette le GPU con altri cluster senza soluzione di continuità.

Diagramma dei componenti tradizionali del data center.

Inizialmente, la scheda di rete ConnectX-8 verrà implementata nei sistemi avanzati Blackwell GB300 NVL72 di NVIDIA, dotati della nuova GPU Blackwell Ultra. Lo switch PCIe CX8 introdotto consente un utilizzo ottimizzato della larghezza di banda nell’architettura NVLINK.

Schema dello switch PCIe ConnectX-8.

Ogni switch CX8 PCIe incorpora corsie Gen5 x16 per la CPU Grace e corsie Gen6 x16 configurate per la GPU Blackwell Ultra, integrate da una corsia PCIe Gen5 x4 per gli SSD.

Diagramma del data center ConnectX.

Scalabilità tra le configurazioni GPU

NVIDIA ha illustrato come ConnectX-8 raggiunga notevoli capacità di scalabilità su configurazioni fino a 64 GPU.

Diagramma dell'integrazione della scala GPU ConnectX-8 da parte di NVIDIA.

In un’epoca in cui la scalabilità dell’intelligenza artificiale è fondamentale, lo switch Ethernet Spectrum-X integrato ConnectX-8 di NVIDIA si propone come una soluzione potente, estendendo le funzionalità dell’attuale framework Ethernet Spectrum-X. Questo sistema offre funzioni avanzate di bilanciamento del carico e controllo della congestione, fondamentali per i carichi di lavoro di intelligenza artificiale, mentre il processore di pacchetti ConnectX-8 rafforza le capacità di sicurezza e routing per gli ambienti di intelligenza artificiale.

Switch ConnectX-8 per un'intelligenza artificiale scalabile.
ConnectX-8 RDMA presenta soluzioni di rete basate sull'intelligenza artificiale.
Schema del processore di pacchetti ConnectX-8.
Diagramma dell'acceleratore del percorso dati ConnectX-8.
Funzionalità Ethernet Spectrum-X per carichi di lavoro AI.
Controllo della congestione ConnectX-8 nell'hardware.

ConnectX-8 integra un Data Path Accelerator, un processore di eventi RISC-V da 16T, progettato per garantire la massima efficienza della rete. NVIDIA vanta che la tecnologia Ethernet Spectrum-X può ridurre del 60% i tempi di training, oltre a ridurre drasticamente la latenza di coda rispetto alle tradizionali schede di rete e switch RDMA.

Grafico che confronta i tempi di addestramento Ethernet di Spectrum-X.
Grafico che illustra le prestazioni di latenza di coda di Spectrum-X Ethernet.

Metriche delle prestazioni

I dati recenti di NVIDIA sulle prestazioni di Spectrum-X includono parametri impressionanti:

  • Larghezza di banda effettiva aumentata di 1, 6 volte grazie al bilanciamento del carico
  • Larghezza di banda collettiva migliorata di 1, 3 volte con impatto sulla latenza di coda
  • Aumento di 2, 2 volte della larghezza di banda ridotta per l’isolamento acustico
  • Aumento di 1, 3 volte della larghezza di banda totale, garantendo resilienza
  • Accelerazione 1000x nella raccolta di dati di telemetria per esigenze ad alta frequenza
Visualizzazione delle metriche delle prestazioni di Spectrum-X.

Con prestazioni rivoluzionarie di 800G e il supporto per PCIe Gen6, Spectrum-X e ConnectX-8 SuperNIC di NVIDIA sono destinati a rivoluzionare il panorama delle reti nei sistemi Blackwell. Ulteriori dettagli e sviluppi sono previsti nei prossimi mesi.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *