Explorando AMD RDNA 4: Diseño de SoC modular y configurabilidad para GPU compactas como Navi 44, con eficiencia de memoria y ancho de banda

Explorando AMD RDNA 4: Diseño de SoC modular y configurabilidad para GPU compactas como Navi 44, con eficiencia de memoria y ancho de banda

AMD ha desarrollado su arquitectura de GPU RDNA 4 y el innovador diseño de SoC modular, presentando estrategias avanzadas de compresión de memoria y ancho de banda que mejoran el rendimiento.

Revisitando la arquitectura de GPU RDNA 4 de AMD y las innovaciones de SoC modulares en Hot Chips 2025

A principios de febrero, AMD lanzó su descripción general completa de la arquitectura RDNA 4. Presentaciones recientes en Hot Chips 2025 brindan más información, en particular sobre la naturaleza modular de este chip, diseñado para aplicaciones versátiles.

Un aspecto destacable que AMD abordó es la incorporación de memoria LPDDR para sus SoC GPU RDNA 4 de gama baja. Si bien la memoria LPDDR es reconocida por su menor consumo de energía, AMD indica que carece del ancho de banda necesario. Como resultado, el tamaño físico del chip aumenta, lo que hace que la memoria LPDDR no sea adecuada para tarjetas gráficas de alto rendimiento.

Lanzamiento de la GPU AMD RDNA 4 Radeon 9000 en el evento Hot Chips 2025, vista detallada del chip.
RDNA 4 Vision: Arquitectura de GPU optimizada para juegos con rendimiento mejorado y trazado de rayos.
Diagrama que detalla las características de AMD Radeon RX 9070 XT, enfatizando la renderización, el trazado de rayos y la memoria.
AMD RDNA 4: transmisión de juegos mejorada, video de baja latencia y detalles de optimización de FreeSync.
Arquitectura de trazado de rayos RDNA 4: aceleradores mejorados y gráfico de memoria BVH optimizado
Análisis más profundo de los cuadros delimitadores orientados y la optimización transversal con comparación de mapas de calor
Las colas de memoria fuera de orden mejoran el rendimiento de la GPU RDNA 4 al manejar las solicitudes de manera eficiente.
La arquitectura RDNA 4 mejora el rendimiento de la travesía de rayos con múltiples factores de optimización.
Gráfico que compara la asignación de registros estáticos de RDNA 3 frente a la asignación dinámica de RDNA 4 en sombreadores.
Capacidades de inteligencia artificial de RDNA 4 para juegos y creación de contenido, que muestran una eficiencia y un rendimiento mejorados.
Comparación de los métodos de trazado de rayos y trazado de trayectorias con diagramas y diferencias clave explicadas.
Acogedor taller con robots y herramientas tecnológicas iluminados por luces de colores, que muestran el seguimiento de rutas de RDNA 4.

Al ser preguntado sobre la reducción del ancho de banda de memoria en comparación con RDNA 3, AMD explicó que la eficiencia del ancho de banda de memoria depende en gran medida de las cargas de trabajo específicas. El ajuste de la arquitectura gráfica de RDNA 4 ha resultado en una reducción significativa de los requisitos de ancho de banda sin comprometer el rendimiento.

Durante la presentación de Hot Chips, AMD destacó la flexibilidad de su arquitectura SoC modular. El modelo RDNA 4 ha sido diseñado como un chip versátil que permite diversas configuraciones para diversos productos Radeon. Laks Pappu, arquitecto de SoC de AMD, destacó las capacidades modulares, que se espera que se extiendan a las futuras generaciones de RDNA 5 y UDNA.

Diapositiva de presentación de la arquitectura SoC RDNA 4 con diseño geométrico abstracto y logotipo de AMD.

La arquitectura utiliza un diagrama de flujo de datos que presenta múltiples motores de sombreado integrados dentro de los SoC Navi 4X, donde cada motor de sombreado comprende varios procesadores de grupo de trabajo (WGP) equipados con unidades de cómputo duales.

La red de comunicación entre estos componentes se facilita mediante una caché GL2 en la GPU, conectada al Infinity Fabric mejorado, un mecanismo de interconexión coherente. Este diseño modular incluye varias estaciones coherentes junto con los controladores de memoria LLC y de doble canal, conectados directamente a la DRAM (GDDR6) en la PCB. Cabe destacar que el Infinity Fabric opera a 1 KB por ciclo de reloj con un rango de frecuencia de 1, 5 a 2, 5 GHz.

Flujo de datos de la arquitectura SOC que muestra los motores de sombreado y las conexiones Infinity Fabric.

Centrándose en el diseño modular de SoC, AMD articuló su potencial para crear SoC más pequeños de forma eficiente. Una línea roja en los diagramas de AMD ilustra la segmentación modular del chip y su escalabilidad en diversas unidades de procesamiento central (WU).Por ejemplo, la configuración bajo la línea roja indica un diseño Navi 44 con dos motores de sombreado y cuatro controladores de memoria GDDR6, lo que permite ajustes en ambas direcciones, ampliando o reduciendo la escala según las necesidades.

Descripción general de la arquitectura SoC modular con características de seguridad y diseño de componentes, destacando el chip RDNA4.

La arquitectura modular no solo permite añadir más motores de sombreado, cachés L3, interconexiones Infinity Fabric y controladores de memoria GDDR para unidades de estado sólido (WeU) de gama alta, como el Navi 48 de la tarjeta gráfica RX 9070 XT, sino que también mejora la seguridad. Permite un acceso controlado y diferentes niveles de privilegios para la gestión de la seguridad, la regulación de la energía y las funciones del microcontrolador. Las funciones RAS (Fiabilidad, Disponibilidad y Facilidad de Servicio) están integradas en varios componentes de esta matriz modular.

Diagrama central de compresión/descompresión para la optimización de la arquitectura SoC

AMD también destacó sus avanzados algoritmos de compresión y descompresión SoC RDNA 4. Se dice que estas nuevas metodologías ofrecen un aumento del 15 % en el rendimiento en ciertas cargas de trabajo rasterizadas, a la vez que logran una reducción del 25 % en el ancho de banda de la estructura. Esta eficiencia no solo reduce el consumo de energía, sino que también minimiza la necesidad del software de gestionar la compresión, ya que esta funcionalidad se gestiona de forma inherente dentro del hardware.

Descripción general de los SKU del producto SOC RDNA 4, especificaciones para las GPU de las series Radeon RX 9070 y 9060.

AMD reiteró la flexibilidad de configuración inherente a su diseño de SoC modular, lo que permite la creación de diversas unidades de procesamiento de datos (WeU) para satisfacer las cambiantes demandas del mercado. Las configuraciones disponibles se estructuran en cuatro niveles de recolección:

  • SEHarvest
  • Cosecha de WGP
  • Cosecha asimétrica (que potencialmente incorpora distribuciones de sombreadores computacionales y de píxeles ponderados)
  • Recolección de dispositivos de memoria (granularidad de dispositivo único y granularidad de 64 bits)
Detalles de la GPU AMD Radeon RX 9070 XT con funciones RDNA 4 para juegos y creación.

Actualmente, AMD presenta cuatro Navi 48 WeU y tres Navi 44 WeU, con la naturaleza escalable de SoC modular de RDNA 4 allanando el camino para aún más configuraciones en el futuro.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *