
A AMD aprimorou sua arquitetura de GPU RDNA 4 e o inovador design Modular SoC, introduzindo estratégias avançadas de compressão de memória e largura de banda que melhoram o desempenho.
Revisitando a arquitetura de GPU RDNA 4 da AMD e as inovações em SoC modulares na Hot Chips 2025
No início de fevereiro, a AMD lançou sua visão geral abrangente da arquitetura RDNA 4. Apresentações recentes no Hot Chips 2025 fornecem mais insights, especialmente em relação à natureza modular deste chip projetado para aplicações versáteis.
Um aspecto notável abordado pela AMD é a incorporação de memória LPDDR em seus SoCs de GPU RDNA 4 de nível inferior. Embora a memória LPDDR seja reconhecida por seu baixo consumo de energia, a AMD indica que ela não possui a largura de banda necessária. Como resultado, o espaço físico do chip aumenta, tornando o LPDDR inadequado para placas de vídeo de alto desempenho.












Questionada sobre a redução da largura de banda da memória em comparação com o RDNA 3, a AMD explicou que a eficiência da largura de banda da memória depende muito de cargas de trabalho específicas. O ajuste da arquitetura gráfica do RDNA 4 levou a uma redução significativa nos requisitos de largura de banda sem comprometer o desempenho.
Durante a apresentação dos Hot Chips, a AMD enfatizou a flexibilidade de sua arquitetura de SoC modular. O modelo RDNA 4 foi projetado como um chip versátil que permite diversas configurações para diversos produtos Radeon. Laks Pappu, arquiteto de SoC da AMD, destacou os recursos modulares, que devem se estender às futuras gerações de RDNA 5 e UDNA.

A arquitetura utiliza um fluxograma de dados que apresenta vários Shader Engines integrados aos SoCs Navi 4X, onde cada Shader Engine compreende vários Work Group Processors (WGPs) equipados com duas unidades de computação.
A rede de comunicação entre esses componentes é facilitada por um cache GL2 no lado da GPU, que se conecta ao Infinity Fabric aprimorado, um mecanismo de interconexão coerente. Este design modular inclui várias Estações Coerentes, além do LLC e controladores de memória de canal duplo conectados diretamente à DRAM (GDDR6) na placa de circuito impresso. Notavelmente, o Infinity Fabric opera a 1 KB por ciclo de clock com uma faixa de frequência de 1, 5 a 2, 5 GHz.

Com foco no design do SoC modular, a AMD articulou seu potencial para criar SoCs menores com eficiência. Uma linha vermelha nos diagramas da AMD ilustra a segmentação do chip modular e sua escalabilidade entre vários WeUs. Por exemplo, a configuração abaixo da linha vermelha indica um design Navi 44 com dois Shader Engines e quatro controladores de memória GDDR6, permitindo ajustes em ambas as direções — aumentando ou diminuindo a escala de acordo com os requisitos.

A arquitetura modular não só permite a adição de mais Shader Engines, caches L3, interconexões Infinity Fabric e controladores de memória GDDR para WeUs de ponta, como o Navi 48 presente na placa de vídeo RX 9070 XT, como também aprimora os níveis de segurança. Ela permite acesso controlado e diferentes níveis de privilégio para gerenciamento de segurança, regulação de energia e funções de microcontrolador. Os recursos RAS (Confiabilidade, Disponibilidade e Facilidade de Manutenção) estão incorporados em vários componentes desta matriz modular.

A AMD também destacou seus algoritmos avançados de compressão e descompressão RDNA 4 SoC. Acredita-se que essas novas metodologias proporcionem um aumento de 15% no desempenho em determinadas cargas de trabalho raster, além de uma redução de 25% na largura de banda da malha. Essa eficiência não apenas reduz o consumo de energia, como também minimiza a necessidade do software de lidar com a compressão, já que essa funcionalidade é gerenciada inerentemente pelo hardware.

A AMD reiterou a flexibilidade de configuração inerente ao design do seu SoC Modular, permitindo a criação de diversos WeUs de produtos para atender às crescentes demandas do mercado. As configurações disponíveis são estruturadas em quatro níveis de coleta:
- SEHarvest
- Colheita WGP
- Colheita assimétrica (potencialmente incorporando distribuições ponderadas de pixels e shaders de computação)
- Coleta de dispositivos de memória (granularidade de dispositivo único e granularidade de 64 bits)

Atualmente, a AMD apresenta quatro Navi 48 WeUs e três Navi 44 WeUs, com a natureza escalável do Modular SoC do RDNA 4 abrindo caminho para ainda mais configurações no futuro.
Deixe um comentário