Explorando o AMD RDNA 4: Design e configurabilidade de SoC modular para GPUs compactas como a Navi 44, com eficiência de memória e largura de banda

Explorando o AMD RDNA 4: Design e configurabilidade de SoC modular para GPUs compactas como a Navi 44, com eficiência de memória e largura de banda

A AMD aprimorou sua arquitetura de GPU RDNA 4 e o inovador design Modular SoC, introduzindo estratégias avançadas de compressão de memória e largura de banda que melhoram o desempenho.

Revisitando a arquitetura de GPU RDNA 4 da AMD e as inovações em SoC modulares na Hot Chips 2025

No início de fevereiro, a AMD lançou sua visão geral abrangente da arquitetura RDNA 4. Apresentações recentes no Hot Chips 2025 fornecem mais insights, especialmente em relação à natureza modular deste chip projetado para aplicações versáteis.

Um aspecto notável abordado pela AMD é a incorporação de memória LPDDR em seus SoCs de GPU RDNA 4 de nível inferior. Embora a memória LPDDR seja reconhecida por seu baixo consumo de energia, a AMD indica que ela não possui a largura de banda necessária. Como resultado, o espaço físico do chip aumenta, tornando o LPDDR inadequado para placas de vídeo de alto desempenho.

Lançamento da GPU AMD RDNA 4 Radeon 9000 no evento Hot Chips 2025, visão detalhada do chip.
RDNA 4 Vision: arquitetura de GPU otimizada para jogos com desempenho e raytracing aprimorados.
Diagrama detalhando os recursos da AMD Radeon RX 9070 XT, enfatizando renderização, traçado de raios e memória.
AMD RDNA 4: streaming de jogos aprimorado, vídeo de baixa latência e detalhes de otimização do FreeSync.
Arquitetura de Raytracing RDNA 4: Aceleradores aprimorados e gráfico de memória BVH otimizado
Mergulho mais profundo em caixas delimitadoras orientadas e otimização de travessia com comparação de mapas de calor
Filas de memória fora de ordem melhoram o desempenho da GPU RDNA 4 ao lidar com solicitações de forma eficiente.
A arquitetura RDNA 4 aprimora o desempenho de travessia de raios com vários fatores de otimização.
Gráfico comparando alocação de registros estáticos do RDNA 3 com alocação dinâmica do RDNA 4 em shaders.
Recursos de IA do RDNA 4 para jogos e criação de conteúdo, demonstrando eficiência e desempenho aprimorados.
Comparação dos métodos Raytracing e Pathtracing com diagramas e principais diferenças explicadas.
Oficina aconchegante com robôs e ferramentas tecnológicas iluminadas por luzes coloridas, apresentando o RDNA 4 Path Tracing.

Questionada sobre a redução da largura de banda da memória em comparação com o RDNA 3, a AMD explicou que a eficiência da largura de banda da memória depende muito de cargas de trabalho específicas. O ajuste da arquitetura gráfica do RDNA 4 levou a uma redução significativa nos requisitos de largura de banda sem comprometer o desempenho.

Durante a apresentação dos Hot Chips, a AMD enfatizou a flexibilidade de sua arquitetura de SoC modular. O modelo RDNA 4 foi projetado como um chip versátil que permite diversas configurações para diversos produtos Radeon. Laks Pappu, arquiteto de SoC da AMD, destacou os recursos modulares, que devem se estender às futuras gerações de RDNA 5 e UDNA.

Slide de apresentação da arquitetura RDNA 4 SoC com design geométrico abstrato e logotipo da AMD.

A arquitetura utiliza um fluxograma de dados que apresenta vários Shader Engines integrados aos SoCs Navi 4X, onde cada Shader Engine compreende vários Work Group Processors (WGPs) equipados com duas unidades de computação.

A rede de comunicação entre esses componentes é facilitada por um cache GL2 no lado da GPU, que se conecta ao Infinity Fabric aprimorado, um mecanismo de interconexão coerente. Este design modular inclui várias Estações Coerentes, além do LLC e controladores de memória de canal duplo conectados diretamente à DRAM (GDDR6) na placa de circuito impresso. Notavelmente, o Infinity Fabric opera a 1 KB por ciclo de clock com uma faixa de frequência de 1, 5 a 2, 5 GHz.

Fluxo de dados da arquitetura SOC mostrando mecanismos de shader e conexões do Infinity Fabric.

Com foco no design do SoC modular, a AMD articulou seu potencial para criar SoCs menores com eficiência. Uma linha vermelha nos diagramas da AMD ilustra a segmentação do chip modular e sua escalabilidade entre vários WeUs. Por exemplo, a configuração abaixo da linha vermelha indica um design Navi 44 com dois Shader Engines e quatro controladores de memória GDDR6, permitindo ajustes em ambas as direções — aumentando ou diminuindo a escala de acordo com os requisitos.

Visão geral da arquitetura modular SoC com recursos de segurança e layout de componentes, destacando o chip RDNA4.

A arquitetura modular não só permite a adição de mais Shader Engines, caches L3, interconexões Infinity Fabric e controladores de memória GDDR para WeUs de ponta, como o Navi 48 presente na placa de vídeo RX 9070 XT, como também aprimora os níveis de segurança. Ela permite acesso controlado e diferentes níveis de privilégio para gerenciamento de segurança, regulação de energia e funções de microcontrolador. Os recursos RAS (Confiabilidade, Disponibilidade e Facilidade de Manutenção) estão incorporados em vários componentes desta matriz modular.

Diagrama de compressão/descompressão central para otimização da arquitetura SoC

A AMD também destacou seus algoritmos avançados de compressão e descompressão RDNA 4 SoC. Acredita-se que essas novas metodologias proporcionem um aumento de 15% no desempenho em determinadas cargas de trabalho raster, além de uma redução de 25% na largura de banda da malha. Essa eficiência não apenas reduz o consumo de energia, como também minimiza a necessidade do software de lidar com a compressão, já que essa funcionalidade é gerenciada inerentemente pelo hardware.

Visão geral dos SKUs de produtos SOC RDNA 4, especificações para GPUs Radeon RX séries 9070 e 9060.

A AMD reiterou a flexibilidade de configuração inerente ao design do seu SoC Modular, permitindo a criação de diversos WeUs de produtos para atender às crescentes demandas do mercado. As configurações disponíveis são estruturadas em quatro níveis de coleta:

  • SEHarvest
  • Colheita WGP
  • Colheita assimétrica (potencialmente incorporando distribuições ponderadas de pixels e shaders de computação)
  • Coleta de dispositivos de memória (granularidade de dispositivo único e granularidade de 64 bits)
Detalhes da GPU AMD Radeon RX 9070 XT com recursos RDNA 4 para jogos e criação.

Atualmente, a AMD apresenta quatro Navi 48 WeUs e três Navi 44 WeUs, com a natureza escalável do Modular SoC do RDNA 4 abrindo caminho para ainda mais configurações no futuro.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *