
AMD a développé son architecture GPU RDNA 4 et la conception innovante du SoC modulaire, en introduisant des stratégies avancées de compression de la mémoire et de la bande passante qui améliorent les performances.
Revue de l’architecture GPU RDNA 4 d’AMD et des innovations SoC modulaires au Hot Chips 2025
Début février, AMD a publié sa présentation complète de l’architecture RDNA 4. Les récentes présentations au salon Hot Chips 2025 apportent des éclairages supplémentaires, notamment sur la modularité de cette puce conçue pour des applications polyvalentes.
Un aspect notable abordé par AMD est l’intégration de la mémoire LPDDR dans ses SoC GPU RDNA 4 d’entrée de gamme. Bien que la mémoire LPDDR soit reconnue pour sa faible consommation énergétique, AMD indique qu’elle manque de bande passante nécessaire. Par conséquent, l’encombrement physique de la puce augmente, rendant la mémoire LPDDR inadaptée aux cartes graphiques hautes performances.












Interrogé sur la réduction de la bande passante mémoire par rapport à RDNA 3, AMD a expliqué que l’efficacité de cette bande passante dépend fortement des charges de travail spécifiques. Le réglage de l’architecture graphique RDNA 4 a permis de réduire considérablement les besoins en bande passante sans compromettre les performances.
Lors de la présentation Hot Chips, AMD a mis en avant la flexibilité de son architecture SoC modulaire. Le modèle RDNA 4 a été conçu comme une puce polyvalente permettant diverses configurations pour différents produits Radeon. Laks Pappu, architecte SoC d’AMD, a souligné les capacités modulaires, qui devraient s’étendre aux futures générations RDNA 5 et UDNA.

L’architecture utilise un diagramme de flux de données qui comprend plusieurs moteurs de shader intégrés dans les SoC Navi 4X, où chaque moteur de shader comprend plusieurs processeurs de groupe de travail (WGP) équipés de deux unités de calcul.
La communication entre ces composants est facilitée par un cache GL2 côté GPU, connecté à l’Infinity Fabric amélioré, un mécanisme d’interconnexion cohérent. Cette conception modulaire comprend plusieurs stations cohérentes, ainsi que des contrôleurs LLC et mémoire double canal directement reliés à la DRAM (GDDR6) sur le circuit imprimé. L’Infinity Fabric fonctionne notamment à 1 Ko par cycle d’horloge avec une plage de fréquences comprise entre 1, 5 et 2, 5 GHz.

En se concentrant sur la conception modulaire des SoC, AMD a exposé son potentiel pour créer efficacement des SoC plus petits. Une ligne rouge sur les schémas AMD illustre la segmentation modulaire des puces et son évolutivité sur différentes unités de calcul. Par exemple, la configuration sous la ligne rouge indique une conception Navi 44 dotée de deux moteurs Shader et de quatre contrôleurs mémoire GDDR6, permettant ainsi des ajustements bidirectionnels, avec une évolutivité à la hausse ou à la baisse selon les besoins.

L’architecture modulaire permet non seulement l’ajout de moteurs de shader, de caches L3, d’interconnexions Infinity Fabric et de contrôleurs mémoire GDDR pour les WeU haut de gamme, comme le Navi 48 de la carte graphique RX 9070 XT, mais améliore également les niveaux de sécurité. Elle autorise un accès contrôlé et différents niveaux de privilèges pour la gestion de la sécurité, la régulation de l’alimentation et les fonctions du microcontrôleur. Les fonctionnalités RAS (fiabilité, disponibilité et facilité de maintenance) sont intégrées à divers composants de cette puce modulaire.

AMD a également mis en avant les algorithmes avancés de compression et de décompression de son SoC RDNA 4. Ces nouvelles méthodologies devraient permettre une amélioration des performances de 15 % sur certaines charges de travail raster, tout en réduisant de 25 % la bande passante du fabric. Cette efficacité permet non seulement de réduire la consommation d’énergie, mais aussi de minimiser la nécessité pour le logiciel de gérer la compression, cette fonctionnalité étant gérée de manière intégrée au matériel.

AMD a réitéré la flexibilité de configuration inhérente à sa conception SoC modulaire, permettant la création de diverses unités de calcul pour répondre à l’évolution des besoins du marché. Les configurations disponibles sont structurées en quatre niveaux de rendement :
- SEHarvest
- Récolte WGP
- Récolte asymétrique (incorporant potentiellement des distributions pondérées de pixels et de shaders de calcul)
- Récolte de périphériques mémoire (granularité d’un seul périphérique et granularité 64 bits)

Actuellement, AMD présente quatre Navi 48 WeU et trois Navi 44 WeU, la nature SoC modulaire évolutive du RDNA 4 ouvrant la voie à encore plus de configurations à l’avenir.
Laisser un commentaire