
AMD ha desarrollado su arquitectura de GPU RDNA 4 y el innovador diseño de SoC modular, presentando estrategias avanzadas de compresión de memoria y ancho de banda que mejoran el rendimiento.
Revisitando la arquitectura de GPU RDNA 4 de AMD y las innovaciones de SoC modulares en Hot Chips 2025
A principios de febrero, AMD lanzó su descripción general completa de la arquitectura RDNA 4. Presentaciones recientes en Hot Chips 2025 brindan más información, en particular sobre la naturaleza modular de este chip, diseñado para aplicaciones versátiles.
Un aspecto destacable que AMD abordó es la incorporación de memoria LPDDR para sus SoC GPU RDNA 4 de gama baja. Si bien la memoria LPDDR es reconocida por su menor consumo de energía, AMD indica que carece del ancho de banda necesario. Como resultado, el tamaño físico del chip aumenta, lo que hace que la memoria LPDDR no sea adecuada para tarjetas gráficas de alto rendimiento.












Al ser preguntado sobre la reducción del ancho de banda de memoria en comparación con RDNA 3, AMD explicó que la eficiencia del ancho de banda de memoria depende en gran medida de las cargas de trabajo específicas. El ajuste de la arquitectura gráfica de RDNA 4 ha resultado en una reducción significativa de los requisitos de ancho de banda sin comprometer el rendimiento.
Durante la presentación de Hot Chips, AMD destacó la flexibilidad de su arquitectura SoC modular. El modelo RDNA 4 ha sido diseñado como un chip versátil que permite diversas configuraciones para diversos productos Radeon. Laks Pappu, arquitecto de SoC de AMD, destacó las capacidades modulares, que se espera que se extiendan a las futuras generaciones de RDNA 5 y UDNA.

La arquitectura utiliza un diagrama de flujo de datos que presenta múltiples motores de sombreado integrados dentro de los SoC Navi 4X, donde cada motor de sombreado comprende varios procesadores de grupo de trabajo (WGP) equipados con unidades de cómputo duales.
La red de comunicación entre estos componentes se facilita mediante una caché GL2 en la GPU, conectada al Infinity Fabric mejorado, un mecanismo de interconexión coherente. Este diseño modular incluye varias estaciones coherentes junto con los controladores de memoria LLC y de doble canal, conectados directamente a la DRAM (GDDR6) en la PCB. Cabe destacar que el Infinity Fabric opera a 1 KB por ciclo de reloj con un rango de frecuencia de 1, 5 a 2, 5 GHz.

Centrándose en el diseño modular de SoC, AMD articuló su potencial para crear SoC más pequeños de forma eficiente. Una línea roja en los diagramas de AMD ilustra la segmentación modular del chip y su escalabilidad en diversas unidades de procesamiento central (WU).Por ejemplo, la configuración bajo la línea roja indica un diseño Navi 44 con dos motores de sombreado y cuatro controladores de memoria GDDR6, lo que permite ajustes en ambas direcciones, ampliando o reduciendo la escala según las necesidades.

La arquitectura modular no solo permite añadir más motores de sombreado, cachés L3, interconexiones Infinity Fabric y controladores de memoria GDDR para unidades de estado sólido (WeU) de gama alta, como el Navi 48 de la tarjeta gráfica RX 9070 XT, sino que también mejora la seguridad. Permite un acceso controlado y diferentes niveles de privilegios para la gestión de la seguridad, la regulación de la energía y las funciones del microcontrolador. Las funciones RAS (Fiabilidad, Disponibilidad y Facilidad de Servicio) están integradas en varios componentes de esta matriz modular.

AMD también destacó sus avanzados algoritmos de compresión y descompresión SoC RDNA 4. Se dice que estas nuevas metodologías ofrecen un aumento del 15 % en el rendimiento en ciertas cargas de trabajo rasterizadas, a la vez que logran una reducción del 25 % en el ancho de banda de la estructura. Esta eficiencia no solo reduce el consumo de energía, sino que también minimiza la necesidad del software de gestionar la compresión, ya que esta funcionalidad se gestiona de forma inherente dentro del hardware.

AMD reiteró la flexibilidad de configuración inherente a su diseño de SoC modular, lo que permite la creación de diversas unidades de procesamiento de datos (WeU) para satisfacer las cambiantes demandas del mercado. Las configuraciones disponibles se estructuran en cuatro niveles de recolección:
- SEHarvest
- Cosecha de WGP
- Cosecha asimétrica (que potencialmente incorpora distribuciones de sombreadores computacionales y de píxeles ponderados)
- Recolección de dispositivos de memoria (granularidad de dispositivo único y granularidad de 64 bits)

Actualmente, AMD presenta cuatro Navi 48 WeU y tres Navi 44 WeU, con la naturaleza escalable de SoC modular de RDNA 4 allanando el camino para aún más configuraciones en el futuro.
Deja una respuesta