
AMD presentó recientemente su innovadora NIC de IA Pensando Pollara 400 en Hot Chips 2025, lo que marca la introducción de la primera tarjeta de interfaz de red de IA (NIC) preparada para Ultra Ethernet Consortium (UEC) de la industria.
AMD mejora el rendimiento en un 25 % con la NIC Pensando Pollara 400 AI de 400 GbE
Basándose en su desarrollo previo, AMD presentó el año pasado la Pensando Pollara 400. Esta tarjeta de red de vanguardia, diseñada específicamente para sistemas de IA, cuenta con un impresionante ancho de banda de 400 Gbps, lo que la sitúa en competencia directa con el ConnectX-7 de NVIDIA. Sin embargo, NVIDIA también ha lanzado el ConnectX-8, más avanzado, que ofrece impresionantes velocidades de 800 GbE con sus últimos sistemas Blackwell Ultra.

El Pensando Pollara 400 viene equipado con varias características de vanguardia:
- Tubería de hardware programable
- Mejora del rendimiento hasta 1, 25 veces
- Rendimiento de 400 Gbps
- Compatibilidad de ecosistemas abiertos
- Capacidades RDMA compatibles con UEC
- Reducción del tiempo de finalización del trabajo
- Disponibilidad excepcional

La arquitectura de las soluciones de redes Pensando está estrechamente alineada con las arquitecturas de centros de datos existentes de AMD, particularmente las familias EPYC e Instinct, que utilizan conmutadores PCIe para conectar de manera eficiente las NIC y las CPU.

Es importante destacar que la tarjeta de red Pensando funciona sin un conmutador PCIe y se conecta directamente a una conexión x16 Gen5. La arquitectura subyacente se describe en el siguiente diagrama:

Mediante el uso de una arquitectura P4, la NIC Pensando Pollara 400 AI logra una eficiencia notable.

Los componentes importantes de la arquitectura abarcan el motor de tabla (TE), responsable de generar claves de tabla a partir del vector de encabezado del paquete, además de ejecutar lecturas de memoria específicas basadas en el tipo de datos.

El diseño también incluye una unidad de procesamiento de coincidencias (MPU), un procesador especializado que utiliza códigos de operación optimizados para la manipulación de campos, lo que facilita interfaces de memoria, tabla y PHV diferenciadas.

Además, innovaciones como las capacidades de traducción de direcciones virtuales a direcciones físicas (va2pa) mejoran aún más el rendimiento del sistema.

En términos de operaciones de memoria atómica, AMD las ha implementado junto a los sistemas SRAM para una mayor eficiencia.

La coherencia de caché de canalización emplea una lógica de invalidación/actualización, lo que garantiza que la coherencia P4 funcione de manera efectiva sobre la base de un rango de direcciones.

AMD identifica varios desafíos que afectan el rendimiento de los sistemas de IA en redes de escalamiento horizontal. Problemas como la utilización ineficiente de enlaces relacionada con el balanceo de carga ECMP, la congestión de la red y la pérdida de paquetes afectan negativamente la eficacia general.

La empresa también destaca que las redes de IA experimentan tasas de utilización significativamente más altas en comparación con las redes de propósito general, lo que a menudo supera los límites de disponibilidad del ancho de banda de la red.

AMD presenta el Consorcio Ultra Ethernet (UEC) como una solución vital para superar estos obstáculos. El UEC promueve un marco abierto, interoperable y de alto rendimiento, diseñado para abordar los requisitos de red esenciales para las aplicaciones de IA y computación de alto rendimiento (HPC) a escala.

Diseñado para ser eficiente y asequible, el UEC tiene como objetivo satisfacer las demandas cada vez más significativas que se imponen a las redes de datos modernas.

Las ventajas adicionales de la UEC incluyen técnicas de enrutamiento mejoradas y soluciones de gestión de red diseñadas para abordar problemas relacionados con la congestión y la pérdida de paquetes.

En resumen, la NIC RDMA Pensando Pollara 400 AI UEC-ready de AMD demuestra una mejora del rendimiento del 25 % en comparación con RoCEv2 con 4 Qpairs, y un notable aumento del 40 % en comparación con RoCEv2 con 1 Qpair, lo que consolida su papel como líder en tecnología de redes.
Deja una respuesta