
AMD ha elaborato la sua architettura GPU RDNA 4 e l’innovativo design SoC modulare, introducendo strategie avanzate di compressione della memoria e della larghezza di banda che migliorano le prestazioni.
Rivisitazione dell’architettura GPU RDNA 4 di AMD e delle innovazioni SoC modulari a Hot Chips 2025
All’inizio di febbraio, AMD ha lanciato la sua panoramica completa dell’architettura RDNA 4. Le recenti presentazioni a Hot Chips 2025 forniscono ulteriori approfondimenti, in particolare per quanto riguarda la natura modulare di questo chip progettato per applicazioni versatili.
Un aspetto degno di nota affrontato da AMD è l’integrazione della memoria LPDDR nei suoi SoC GPU RDNA 4 di fascia bassa. Sebbene la memoria LPDDR sia nota per il suo basso consumo energetico, AMD afferma che non offre la larghezza di banda necessaria. Di conseguenza, l’ingombro fisico del chip aumenta, rendendo la LPDDR inadatta alle schede grafiche ad alte prestazioni.












Alla domanda sulla riduzione della larghezza di banda della memoria rispetto a RDNA 3, AMD ha spiegato che l’efficienza della larghezza di banda della memoria dipende fortemente da carichi di lavoro specifici. L’ottimizzazione dell’architettura grafica di RDNA 4 ha portato a una significativa riduzione dei requisiti di larghezza di banda senza compromettere le prestazioni.
Durante la presentazione di Hot Chips, AMD ha sottolineato la flessibilità della sua architettura SoC modulare. Il modello RDNA 4 è stato progettato come un chip versatile che consente diverse configurazioni per vari prodotti Radeon. Laks Pappu, SoC Architect di AMD, ha evidenziato le capacità modulari, che si prevede si estenderanno alle future generazioni RDNA 5 e UDNA.

L’architettura utilizza un diagramma di flusso dei dati che presenta più Shader Engine integrati nei SoC Navi 4X, dove ogni Shader Engine comprende diversi Work Group Processor (WGP) dotati di due unità di calcolo.
La rete di comunicazione tra questi componenti è facilitata da una cache GL2 sul lato GPU, che si collega all’Infinity Fabric migliorato, un meccanismo di interconnessione coerente. Questo design modulare include diverse stazioni coerenti insieme all’LLC e controller di memoria a doppio canale collegati direttamente alla DRAM (GDDR6) sul PCB. In particolare, l’Infinity Fabric opera a 1 KB per ciclo di clock con un intervallo di frequenza da 1, 5 a 2, 5 GHz.

Concentrandosi sul design modulare del SoC, AMD ha articolato il suo potenziale per creare SoC più piccoli in modo efficiente. Una linea rossa nei diagrammi di AMD illustra la segmentazione modulare dei chip e la sua scalabilità su diverse WeU. Ad esempio, la configurazione sotto la linea rossa indica un design Navi 44 con due Shader Engine e quattro controller di memoria GDDR6, consentendo così regolazioni in entrambe le direzioni, aumentando o diminuendo la scalabilità in base alle esigenze.

L’architettura modulare non solo consente l’aggiunta di più Shader Engine, cache L3, interconnessioni Infinity Fabric e controller di memoria GDDR per WeU di fascia alta, come il Navi 48 presente nella scheda grafica RX 9070 XT, ma migliora anche i livelli di sicurezza. Consente l’accesso controllato e diversi livelli di privilegio per la gestione della sicurezza, la regolazione dell’alimentazione e le funzioni del microcontrollore. Le funzionalità RAS (affidabilità, disponibilità e facilità di manutenzione) sono integrate in vari componenti di questo die modulare.

AMD ha inoltre evidenziato i suoi algoritmi avanzati di compressione e decompressione RDNA 4 SoC. Si dice che queste nuove metodologie producano un aumento delle prestazioni del 15% in determinati carichi di lavoro raster, ottenendo al contempo una riduzione del 25% della larghezza di banda del fabric. Questa efficienza non solo riduce il consumo energetico, ma riduce anche al minimo la necessità del software di gestire la compressione, poiché questa funzionalità è intrinsecamente gestita dall’hardware.

AMD ha ribadito la flessibilità di configurazione insita nel design del suo SoC modulare, consentendo la creazione di diverse WeU di prodotto per soddisfare le esigenze in continua evoluzione del mercato. Le configurazioni disponibili sono strutturate in quattro livelli di harvesting:
- SEHarvest
- Raccolta WGP
- Raccolta asimmetrica (che potenzialmente incorpora distribuzioni di pixel ponderati e shader di calcolo)
- Raccolta di dispositivi di memoria (granularità del singolo dispositivo e granularità a 64 bit)

Attualmente, AMD presenta quattro Navi 48 WeU e tre Navi 44 WeU, con la natura SoC modulare scalabile di RDNA 4 che apre la strada a ulteriori configurazioni in futuro.
Lascia un commento