AMD RDNA 4 im Überblick: Modulares SoC-Design und Konfigurierbarkeit für kompakte GPUs wie Navi 44 mit Speicher- und Bandbreiteneffizienz

AMD RDNA 4 im Überblick: Modulares SoC-Design und Konfigurierbarkeit für kompakte GPUs wie Navi 44 mit Speicher- und Bandbreiteneffizienz

AMD hat seine RDNA 4-GPU-Architektur und das innovative modulare SoC-Design weiterentwickelt und erweiterte Speicher- und Bandbreitenkomprimierungsstrategien eingeführt, die die Leistung verbessern.

AMDs RDNA 4-GPU-Architektur und modulare SoC-Innovationen auf der Hot Chips 2025 erneut im Blick

Anfang Februar veröffentlichte AMD seinen umfassenden Überblick über die RDNA 4-Architektur. Jüngste Präsentationen auf der Hot Chips 2025 bieten weitere Einblicke, insbesondere hinsichtlich der modularen Natur dieses für vielseitige Anwendungen konzipierten Chips.

Ein bemerkenswerter Aspekt, den AMD angesprochen hat, ist die Integration von LPDDR-Speicher in seine RDNA 4 GPU-SoCs der unteren Preisklasse. Während LPDDR-Speicher für seinen geringeren Stromverbrauch bekannt ist, weist AMD darauf hin, dass ihm die erforderliche Bandbreite fehlt. Dadurch vergrößert sich der Platzbedarf des Chips, was LPDDR für Hochleistungsgrafikkarten ungeeignet macht.

Vorstellung der AMD RDNA 4 Radeon 9000 GPU beim Hot Chips 2025-Event, Detailansicht des Chips.
RDNA 4 Vision: Optimierte GPU-Architektur für Gaming mit verbesserter Leistung und Raytracing.
Diagramm mit detaillierten Funktionen der AMD Radeon RX 9070 XT, mit Schwerpunkt auf Rendering, Raytracing und Speicher.
AMD RDNA 4: Verbessertes Game-Streaming, Video mit geringer Latenz und FreeSync-Optimierungsdetails.
RDNA 4 Raytracing-Architektur: Verbesserte Beschleuniger und optimiertes BVH-Speicherdiagramm
Tieferer Einblick in orientierte Begrenzungsrahmen und Traversierungsoptimierung mit Heatmap-Vergleich
Out-of-Order-Speicherwarteschlangen verbessern die GPU-Leistung von RDNA 4 durch effiziente Verarbeitung von Anfragen.
Die RDNA 4-Architektur verbessert die Ray-Traversal-Leistung mit mehreren Optimierungsfaktoren.
Diagramm zum Vergleich der statischen und dynamischen Registerzuweisung in Shadern von RDNA 3 und RDNA 4.
RDNA 4-KI-Funktionen für Gaming und Content-Erstellung, die verbesserte Effizienz und Leistung demonstrieren.
Vergleich der Raytracing- und Pathtracing-Methoden mit Diagrammen und Erläuterung der wichtigsten Unterschiede.
Gemütliche Werkstatt mit Robotern und technischen Werkzeugen, die von bunten Lichterketten beleuchtet werden und RDNA 4 Path Tracing vorführen.

Auf die Frage nach der reduzierten Speicherbandbreite im Vergleich zu RDNA 3 erklärte AMD, dass die Effizienz der Speicherbandbreite stark von spezifischen Arbeitslasten abhängt. Die Optimierung der RDNA 4-Grafikarchitektur habe zu einer deutlichen Reduzierung des Bandbreitenbedarfs geführt, ohne die Leistung zu beeinträchtigen.

Während der Hot Chips-Präsentation betonte AMD die Flexibilität seiner modularen SoC-Architektur. Das RDNA 4-Modell wurde als vielseitiger Chip konzipiert, der vielfältige Konfigurationen für verschiedene Radeon-Produkte ermöglicht. Laks Pappu, AMDs SoC-Architekt, hob die modularen Fähigkeiten hervor, die voraussichtlich auch auf zukünftige RDNA 5- und UDNA-Generationen ausgeweitet werden.

Präsentationsfolie zur RDNA 4-SoC-Architektur mit abstraktem geometrischem Design und AMD-Logo.

Die Architektur verwendet ein Datenflussdiagramm mit mehreren in die Navi 4X SoCs integrierten Shader-Engines, wobei jede Shader-Engine aus mehreren Work Group Processors (WGPs) besteht, die mit dualen Compute Units ausgestattet sind.

Das Kommunikationsnetzwerk zwischen diesen Komponenten wird durch einen GL2-Cache auf der GPU-Seite unterstützt, der mit dem verbesserten Infinity Fabric, einem kohärenten Verbindungsmechanismus, verbunden ist. Dieses modulare Design umfasst mehrere Coherent Stations neben den LLC- und Dual-Channel-Speichercontrollern, die direkt mit dem DRAM (GDDR6) auf der Leiterplatte verbunden sind. Das Infinity Fabric arbeitet mit 1 KB pro Taktzyklus und einem Frequenzbereich von 1, 5 bis 2, 5 GHz.

Datenfluss der SOC-Architektur mit Shader-Engines und Infinity Fabric-Verbindungen.

AMD konzentriert sich auf das modulare SoC-Design und verdeutlichte sein Potenzial, kleinere SoCs effizient zu entwickeln. Eine rote Linie in AMDs Diagrammen veranschaulicht die modulare Chipsegmentierung und ihre Skalierbarkeit über verschiedene WeUs hinweg. Die Konfiguration unterhalb der roten Linie zeigt beispielsweise ein Navi 44-Design mit zwei Shader-Engines und vier GDDR6-Speichercontrollern, wodurch Anpassungen in beide Richtungen möglich sind – je nach Bedarf nach oben oder unten.

Übersicht über die modulare SoC-Architektur mit Sicherheitsfunktionen und Komponentenlayout, mit Schwerpunkt auf dem RDNA4-Chip.

Die modulare Architektur ermöglicht nicht nur die Integration weiterer Shader-Engines, L3-Caches, Infinity Fabric-Verbindungen und GDDR-Speichercontroller für höherwertige WeUs, wie den Navi 48 der Grafikkarte RX 9070 XT, sondern erhöht auch die Sicherheit. Sie ermöglicht kontrollierten Zugriff und verschiedene Berechtigungsstufen für Sicherheitsmanagement, Leistungsregelung und Mikrocontrollerfunktionen. RAS-Funktionen (Reliability, Availability und Serviceability) sind in verschiedene Komponenten dieses modularen Chips integriert.

Zentrales Komprimierungs-/Dekomprimierungsdiagramm zur SoC-Architekturoptimierung

AMD stellte außerdem seine fortschrittlichen Komprimierungs- und Dekomprimierungsalgorithmen für den RDNA 4 SoC vor. Diese neuen Methoden sollen bei bestimmten Raster-Workloads eine Leistungssteigerung von 15 % und gleichzeitig eine Reduzierung der Fabric-Bandbreite um 25 % ermöglichen. Diese Effizienz senkt nicht nur den Stromverbrauch, sondern minimiert auch den Softwarebedarf für die Komprimierung, da diese Funktionalität hardwareseitig gesteuert wird.

Übersicht über SOC RDNA 4-Produkt-SKUs, Spezifikationen für GPUs der Serien Radeon RX 9070 und 9060.

AMD betonte die flexible Konfigurierbarkeit seines modularen SoC-Designs, die die Entwicklung vielfältiger WeUs ermöglicht, um den sich entwickelnden Marktanforderungen gerecht zu werden. Die verfügbaren Konfigurationen sind in vier Ausbaustufen unterteilt:

  • SEHarvest
  • WGP-Ernte
  • Asymmetrische Ernte (möglicherweise unter Einbeziehung gewichteter Pixel- und Compute-Shader-Verteilungen)
  • Memory Device Harvest (Einzelgerätegranularität und 64-Bit-Granularität)
AMD Radeon RX 9070 XT GPU-Details mit RDNA 4-Funktionen für Gaming und Kreation.

Derzeit präsentiert AMD vier Navi 48 WeUs und drei Navi 44 WeUs, wobei die skalierbare modulare SoC-Natur von RDNA 4 den Weg für noch mehr Konfigurationen in der Zukunft ebnet.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert