AMD lancia la prima scheda di rete Pensando Pollara 400 AI “UEC-Ready”, che raggiunge velocità di 400 GbE

AMD ha recentemente presentato la sua innovativa scheda di rete AI Pensando Pollara 400 all’Hot Chips 2025, segnando l’introduzione della prima scheda di interfaccia di rete (NIC) AI compatibile con l’Ultra Ethernet Consortium (UEC) del settore.

AMD migliora le prestazioni del 25% con la scheda di rete Pensando Pollara 400 AI da 400 GbE

Basandosi sui suoi sviluppi precedenti, lo scorso anno AMD ha presentato Pensando Pollara 400. Questa scheda di rete all’avanguardia, progettata specificamente per i sistemi di intelligenza artificiale, vanta una notevole larghezza di banda di 400 Gbps, che la pone in diretta concorrenza con ConnectX-7 di NVIDIA. Tuttavia, NVIDIA ha anche lanciato il più avanzato ConnectX-8, che offre impressionanti velocità di 800 GbE con i suoi ultimi sistemi Blackwell Ultra.

AMD Pensando Pollara 400 AI NIC; la prima scheda di rete AI Ultra Ethernet del settore, con velocità di 400 Gbps.

Il Pensando Pollara 400 è dotato di numerose caratteristiche all’avanguardia:

Pipeline hardware programmabile
Miglioramento delle prestazioni fino a 1, 25 volte
Capacità di trasmissione di 400 Gbps
Compatibilità dell’ecosistema aperto
Funzionalità RDMA pronte per UEC
Tempo di completamento del lavoro ridotto
Disponibilità eccezionale

Diagramma dell'architettura del sistema AMD Instinct con Infinity Fabric e connessioni dello switch PCIe.

L’architettura delle soluzioni Pensando Networking è strettamente allineata alle architetture dei data center esistenti di AMD, in particolare alle famiglie EPYC e Instinct, che utilizzano switch PCIe per connettere in modo efficiente NIC e CPU.

AMD sviluppa soluzioni per data center con CPU, GPU e hardware di rete.

È importante sottolineare che la scheda di rete Pensando funziona senza uno switch PCIe e si interfaccia direttamente con una connessione Gen5 x16. L’architettura di base è descritta nel diagramma seguente:

Diagramma a blocchi che mostra l'architettura NIC AMD Pensando con interconnessione NOC e componenti P4DMA.

Grazie all’utilizzo di un’architettura P4, la scheda di rete Pensando Pollara 400 AI raggiunge un’efficienza notevole.

Diagramma dell'architettura AMD Pensando P4 che mostra l'elaborazione dei pacchetti e i percorsi del flusso di memoria.

I componenti più importanti dell’architettura comprendono il Table Engine (TE), responsabile della generazione delle chiavi di tabella dal vettore dell’intestazione del pacchetto, oltre all’esecuzione di letture di memoria specifiche in base al tipo di dati.

Diagramma dei componenti della pipeline P4 che evidenzia la generazione delle chiavi del motore di tabella e l'accesso alla memoria.

Il progetto prevede anche una Match Processing Unit (MPU), un processore specializzato che utilizza codici operativi ottimizzati per la manipolazione del campo, facilitando interfacce distinte per memoria, tabella e PHV.

Diagramma dei componenti della pipeline P4 che mostra l'unità di elaborazione delle corrispondenze e le interfacce.

Inoltre, innovazioni come la capacità di conversione da indirizzo virtuale a indirizzo fisico (va2pa) migliorano ulteriormente le prestazioni del sistema.

Diagramma di flusso del processo di traduzione degli indirizzi virtuali in fisici nell'architettura informatica.

Per quanto riguarda le operazioni di memoria atomica, AMD le ha implementate accanto ai sistemi SRAM per una maggiore efficienza.

Panoramica dei miglioramenti AMD nelle operazioni atomiche con vantaggi per la memoria SRAM.

La coerenza della cache della pipeline utilizza una logica di invalidazione/aggiornamento, garantendo che la coerenza P4 funzioni in modo efficace in base all’intervallo di indirizzi.

Diagramma dei miglioramenti della coerenza della cache della pipeline con spiegazione della logica di invalidazione/aggiornamento.

AMD individua diverse sfide che incidono sulle prestazioni dei sistemi di intelligenza artificiale nelle reti scale-out. Problemi come l’utilizzo inefficiente dei collegamenti legato al bilanciamento del carico ECMP, la congestione della rete e la perdita di pacchetti ostacolano l’efficacia complessiva.

Rete scalabile AI: sfide nelle prestazioni del sistema e problemi di rete come congestione e perdita di pacchetti.

L’azienda sottolinea inoltre che le reti di intelligenza artificiale presentano tassi di utilizzo significativamente più elevati rispetto alle reti generiche, spesso spingendo al limite la disponibilità di larghezza di banda della rete.

Elevato utilizzo della rete: le reti backend basate sull'intelligenza artificiale gestiscono i trasferimenti di dati con un utilizzo del 95%.

AMD presenta l’Ultra Ethernet Consortium (UEC) come una soluzione fondamentale per superare questi ostacoli. L’UEC promuove un framework aperto, interoperabile e ad alte prestazioni, progettato per soddisfare i requisiti di rete essenziali per le applicazioni di intelligenza artificiale e di calcolo ad alte prestazioni (HPC) su larga scala.

Ultra Ethernet Consortium: Ethernet aperta, scalabile e conveniente per le esigenze di intelligenza artificiale e HPC.

Progettato per essere efficiente e conveniente, l’UEC mira a soddisfare le crescenti esigenze delle moderne reti dati.

AMD Pensando Pollara 400 AI NIC con RDMA, trasporto AI UEC, controllo della congestione, ripristino rapido.

Ulteriori vantaggi dell’UEC includono tecniche di routing avanzate e soluzioni di gestione della rete progettate per risolvere i problemi legati alla congestione e alla perdita di pacchetti.

Grafico delle prestazioni Pollara RDMA vs RoCEv2 RPC, che evidenzia i guadagni in termini di efficienza della rete.

In sintesi, la scheda di rete RDMA Pensando Pollara 400 AI UEC-ready di AMD dimostra un miglioramento delle prestazioni del 25% rispetto a RoCEv2 con 4 Qpair e un notevole aumento del 40% rispetto a RoCEv2 con 1 Qpair, consolidando il suo ruolo di leader nella tecnologia di rete.

Fonte e immagini

AMD lancia la prima scheda di rete Pensando Pollara 400 AI “UEC-Ready”, che raggiunge velocità di 400 GbE

AMD migliora le prestazioni del 25% con la scheda di rete Pensando Pollara 400 AI da 400 GbE

Articoli correlati:

GPU AMD Instinct MI350: libera la potenza dell'intelligenza artificiale con chiplet 3D da 3 nm, architettura CDNA 4, 185 miliardi di transistor, TBP da 1400 W e 288 GB di memoria per oltre 4000 miliardi di supporto LLM

AMD collabora con IBM per lo sviluppo del supercomputing quantistico: aprendo la strada a una nuova era nell'informatica

Lascia un commento Annulla risposta