
AMD ha recentemente presentato la sua innovativa scheda di rete AI Pensando Pollara 400 all’Hot Chips 2025, segnando l’introduzione della prima scheda di interfaccia di rete (NIC) AI compatibile con l’Ultra Ethernet Consortium (UEC) del settore.
AMD migliora le prestazioni del 25% con la scheda di rete Pensando Pollara 400 AI da 400 GbE
Basandosi sui suoi sviluppi precedenti, lo scorso anno AMD ha presentato Pensando Pollara 400. Questa scheda di rete all’avanguardia, progettata specificamente per i sistemi di intelligenza artificiale, vanta una notevole larghezza di banda di 400 Gbps, che la pone in diretta concorrenza con ConnectX-7 di NVIDIA. Tuttavia, NVIDIA ha anche lanciato il più avanzato ConnectX-8, che offre impressionanti velocità di 800 GbE con i suoi ultimi sistemi Blackwell Ultra.

Il Pensando Pollara 400 è dotato di numerose caratteristiche all’avanguardia:
- Pipeline hardware programmabile
- Miglioramento delle prestazioni fino a 1, 25 volte
- Capacità di trasmissione di 400 Gbps
- Compatibilità dell’ecosistema aperto
- Funzionalità RDMA pronte per UEC
- Tempo di completamento del lavoro ridotto
- Disponibilità eccezionale

L’architettura delle soluzioni Pensando Networking è strettamente allineata alle architetture dei data center esistenti di AMD, in particolare alle famiglie EPYC e Instinct, che utilizzano switch PCIe per connettere in modo efficiente NIC e CPU.

È importante sottolineare che la scheda di rete Pensando funziona senza uno switch PCIe e si interfaccia direttamente con una connessione Gen5 x16. L’architettura di base è descritta nel diagramma seguente:

Grazie all’utilizzo di un’architettura P4, la scheda di rete Pensando Pollara 400 AI raggiunge un’efficienza notevole.

I componenti più importanti dell’architettura comprendono il Table Engine (TE), responsabile della generazione delle chiavi di tabella dal vettore dell’intestazione del pacchetto, oltre all’esecuzione di letture di memoria specifiche in base al tipo di dati.

Il progetto prevede anche una Match Processing Unit (MPU), un processore specializzato che utilizza codici operativi ottimizzati per la manipolazione del campo, facilitando interfacce distinte per memoria, tabella e PHV.

Inoltre, innovazioni come la capacità di conversione da indirizzo virtuale a indirizzo fisico (va2pa) migliorano ulteriormente le prestazioni del sistema.

Per quanto riguarda le operazioni di memoria atomica, AMD le ha implementate accanto ai sistemi SRAM per una maggiore efficienza.

La coerenza della cache della pipeline utilizza una logica di invalidazione/aggiornamento, garantendo che la coerenza P4 funzioni in modo efficace in base all’intervallo di indirizzi.

AMD individua diverse sfide che incidono sulle prestazioni dei sistemi di intelligenza artificiale nelle reti scale-out. Problemi come l’utilizzo inefficiente dei collegamenti legato al bilanciamento del carico ECMP, la congestione della rete e la perdita di pacchetti ostacolano l’efficacia complessiva.

L’azienda sottolinea inoltre che le reti di intelligenza artificiale presentano tassi di utilizzo significativamente più elevati rispetto alle reti generiche, spesso spingendo al limite la disponibilità di larghezza di banda della rete.

AMD presenta l’Ultra Ethernet Consortium (UEC) come una soluzione fondamentale per superare questi ostacoli. L’UEC promuove un framework aperto, interoperabile e ad alte prestazioni, progettato per soddisfare i requisiti di rete essenziali per le applicazioni di intelligenza artificiale e di calcolo ad alte prestazioni (HPC) su larga scala.

Progettato per essere efficiente e conveniente, l’UEC mira a soddisfare le crescenti esigenze delle moderne reti dati.

Ulteriori vantaggi dell’UEC includono tecniche di routing avanzate e soluzioni di gestione della rete progettate per risolvere i problemi legati alla congestione e alla perdita di pacchetti.

In sintesi, la scheda di rete RDMA Pensando Pollara 400 AI UEC-ready di AMD dimostra un miglioramento delle prestazioni del 25% rispetto a RoCEv2 con 4 Qpair e un notevole aumento del 40% rispetto a RoCEv2 con 1 Qpair, consolidando il suo ruolo di leader nella tecnologia di rete.
Lascia un commento