
AMD a récemment dévoilé sa carte réseau IA innovante Pensando Pollara 400 lors du Hot Chips 2025, marquant l’introduction de la première carte d’interface réseau IA (NIC) compatible Ultra Ethernet Consortium (UEC) du secteur.
AMD améliore les performances de 25 % avec la carte réseau 400 GbE Pensando Pollara 400 AI
S’appuyant sur ses développements précédents, AMD a présenté l’année dernière la Pensando Pollara 400. Cette carte réseau de pointe, spécialement conçue pour les systèmes d’IA, offre une bande passante remarquable de 400 Gbit/s, ce qui la place en concurrence directe avec la ConnectX-7 de NVIDIA. Cependant, NVIDIA a également lancé la ConnectX-8, plus avancée, offrant des débits impressionnants de 800 GbE avec ses derniers systèmes Blackwell Ultra.

Le Pensando Pollara 400 est doté de plusieurs fonctionnalités de pointe :
- Pipeline matériel programmable
- Amélioration des performances jusqu’à 1, 25x
- Débit de 400 Gbit/s
- Compatibilité avec l’écosystème ouvert
- Capacités RDMA compatibles UEC
- Réduction du temps d’exécution des tâches
- Disponibilité exceptionnelle

L’architecture des solutions Pensando Networking est étroitement alignée sur les architectures de centre de données existantes d’AMD, en particulier les familles EPYC et Instinct, qui utilisent des commutateurs PCIe pour connecter efficacement les cartes réseau et les processeurs.

Il est important de noter que la carte réseau Pensando fonctionne sans commutateur PCIe et s’interface directement avec une connexion Gen5 x16. L’architecture sous-jacente est présentée dans le schéma suivant :

Grâce à l’utilisation d’une architecture P4, la carte réseau Pensando Pollara 400 AI atteint une efficacité remarquable.

Les composants importants de l’architecture englobent le moteur de table (TE), responsable de la génération de clés de table à partir du vecteur d’en-tête du package, ainsi que de l’exécution de lectures de mémoire spécifiques en fonction du type de données.

La conception comprend également une unité de traitement de correspondance (MPU), un processeur spécialisé utilisant des opcodes optimisés pour la manipulation de terrain, facilitant des interfaces distinctes de mémoire, de table et de PHV.

De plus, des innovations telles que les capacités de traduction d’adresse virtuelle en adresse physique (va2pa) améliorent encore les performances du système.

En termes d’opérations de mémoire atomique, AMD les a implémentées à côté des systèmes SRAM pour une plus grande efficacité.

La cohérence du cache du pipeline utilise une logique d’invalidation/mise à jour, garantissant que la cohérence P4 fonctionne efficacement sur une base de plage d’adresses.

AMD identifie plusieurs défis affectant les performances des systèmes d’IA sur les réseaux évolutifs. Des problèmes tels que l’utilisation inefficace des liens liée à l’équilibrage de charge ECMP, la congestion du réseau et la perte de paquets nuisent à l’efficacité globale.

L’entreprise souligne également que les réseaux d’IA connaissent des taux d’utilisation nettement plus élevés que les réseaux à usage général, repoussant souvent les limites de la disponibilité de la bande passante du réseau.

AMD présente l’Ultra Ethernet Consortium (UEC) comme une solution essentielle pour surmonter ces obstacles. L’UEC favorise un cadre ouvert, interopérable et performant, conçu pour répondre aux exigences réseau essentielles aux applications d’IA et de calcul haute performance (HPC) à grande échelle.

Conçu pour être efficace et abordable, l’UEC vise à répondre aux exigences importantes de plus en plus imposées aux réseaux de données modernes.

Les avantages supplémentaires de l’UEC incluent des techniques de routage améliorées et des solutions de gestion de réseau conçues pour résoudre les problèmes liés à la congestion et à la perte de paquets.

En résumé, la carte réseau RDMA Pensando Pollara 400 AI UEC-ready d’AMD démontre une amélioration des performances de 25 % par rapport à RoCEv2 avec 4 Qpairs, et une augmentation notable de 40 % par rapport à RoCEv2 avec 1 Qpair, consolidant son rôle de leader dans la technologie des réseaux.
Laisser un commentaire