Eksploracja AMD RDNA 4: modułowa konstrukcja SoC i konfigurowalność dla kompaktowych procesorów graficznych, takich jak Navi 44, charakteryzujących się wydajnością pamięci i przepustowości

Eksploracja AMD RDNA 4: modułowa konstrukcja SoC i konfigurowalność dla kompaktowych procesorów graficznych, takich jak Navi 44, charakteryzujących się wydajnością pamięci i przepustowości

Firma AMD rozwinęła architekturę procesora graficznego RDNA 4 i innowacyjną modułową konstrukcję SoC, wprowadzając zaawansowane strategie kompresji pamięci i przepustowości, które zwiększają wydajność.

Ponowne omówienie architektury GPU RDNA 4 i innowacji modułowych SoC firmy AMD na konferencji Hot Chips 2025

Na początku lutego firma AMD opublikowała kompleksowy przegląd architektury RDNA 4. Niedawne prezentacje na konferencji Hot Chips 2025 dostarczają dalszych informacji, zwłaszcza na temat modułowej natury tego układu zaprojektowanego z myślą o wszechstronnych zastosowaniach.

Jednym z istotnych aspektów, którymi zajęła się firma AMD, jest włączenie pamięci LPDDR do układów SoC GPU niższej klasy RDNA 4. Chociaż pamięć LPDDR jest znana ze swojego niższego zużycia energii, AMD wskazuje na brak niezbędnej przepustowości. W rezultacie zwiększa się fizyczna powierzchnia zajmowana przez układ, co sprawia, że ​​pamięć LPDDR nie nadaje się do kart graficznych o wysokiej wydajności.

Premiera karty graficznej AMD RDNA 4 Radeon 9000 na wydarzeniu Hot Chips 2025. Szczegółowy widok układu.
RDNA 4 Vision: Zoptymalizowana pod kątem gier architektura GPU z ulepszoną wydajnością i obsługą ray tracingu.
Diagram przedstawiający szczegółowo funkcje karty graficznej AMD Radeon RX 9070 XT, ze szczególnym uwzględnieniem renderowania, śledzenia promieni i pamięci.
AMD RDNA 4: Ulepszone strumieniowanie gier, wideo o niskim opóźnieniu i optymalizacja FreeSync.
Architektura śledzenia promieni RDNA 4: ulepszone akceleratory i zoptymalizowany wykres pamięci BVH
Głębsze zanurzenie w zorientowanych polach ograniczających i optymalizacji przechodzenia z porównaniem map cieplnych
Kolejki pamięci poza kolejnością poprawiają wydajność procesora graficznego RDNA 4 dzięki wydajnemu przetwarzaniu żądań.
Architektura RDNA 4 zwiększa wydajność przechodzenia promieni dzięki wielu czynnikom optymalizacji.
Wykres porównujący alokację rejestrów statycznych RDNA 3 i dynamicznych RDNA 4 w shaderach.
Możliwości RDNA 4 AI do gier i tworzenia treści, zapewniające zwiększoną wydajność i efektywność.
Porównanie metod Raytracing i Pathtracing z diagramami i wyjaśnieniem kluczowych różnic.
Przytulne warsztaty z robotami i narzędziami technicznymi oświetlonymi kolorowymi lampkami, prezentujące technologię RDNA 4 Path Tracing.

Zapytani o zmniejszoną przepustowość pamięci w porównaniu z RDNA 3, AMD wyjaśniło, że wydajność przepustowości pamięci jest silnie zależna od konkretnych obciążeń. Dostrojenie architektury graficznej RDNA 4 doprowadziło do znacznego zmniejszenia zapotrzebowania na przepustowość bez pogorszenia wydajności.

Podczas prezentacji Hot Chips, AMD podkreśliło elastyczność swojej modułowej architektury SoC. Model RDNA 4 został zaprojektowany jako wszechstronny układ, który umożliwia różnorodne konfiguracje dla różnych produktów Radeon. Laks Pappu, architekt SoC w AMD, podkreślił modułowe możliwości, które mają zostać rozszerzone na przyszłe generacje RDNA 5 i UDNA.

Slajd prezentacji architektury RDNA 4 SoC z abstrakcyjnym wzorem geometrycznym i logo AMD.

Architektura wykorzystuje diagram przepływu danych, który obejmuje wiele silników cieniowania zintegrowanych w układach SoC Navi 4X, przy czym każdy silnik cieniowania obejmuje kilka procesorów grupy roboczej (WGP) wyposażonych w dwie jednostki obliczeniowe.

Sieć komunikacyjną między tymi komponentami ułatwia pamięć podręczna GL2 po stronie GPU, łącząca się z ulepszoną strukturą Infinity Fabric, czyli spójnym mechanizmem połączeń. Ta modułowa konstrukcja obejmuje kilka stacji koherentnych (Coherent Stations) wraz z kontrolerami pamięci LLC i dwukanałowymi kontrolerami pamięci połączonymi bezpośrednio z pamięcią DRAM (GDDR6) na płytce drukowanej. Warto zauważyć, że struktura Infinity Fabric pracuje z szybkością 1 KB na cykl zegara w zakresie częstotliwości od 1, 5 do 2, 5 GHz.

Przepływ danych architektury SOC pokazujący silniki shaderów i połączenia Infinity Fabric.

Koncentrując się na modułowej konstrukcji SoC, AMD przedstawiło jej potencjał w zakresie wydajnego tworzenia mniejszych układów SoC. Zaznaczona czerwona linia na diagramach AMD ilustruje segmentację modułowych układów i ich skalowalność w różnych systemach operacyjnych. Na przykład konfiguracja poniżej czerwonej linii wskazuje na konstrukcję Navi 44 z dwoma silnikami cieniowania i czterema kontrolerami pamięci GDDR6, co pozwala na regulację w obu kierunkach – skalowanie w górę lub w dół w zależności od wymagań.

Omówienie modułowej architektury SoC ze szczególnym uwzględnieniem funkcji bezpieczeństwa i rozmieszczenia komponentów, ze szczególnym uwzględnieniem układu RDNA4.

Modułowa architektura nie tylko umożliwia dodanie większej liczby silników cieniowania, pamięci podręcznych L3, połączeń Infinity Fabric i kontrolerów pamięci GDDR dla zaawansowanych procesorów WeU, takich jak Navi 48 w karcie graficznej RX 9070 XT, ale także podnosi poziom bezpieczeństwa. Zapewnia kontrolowany dostęp i różne poziomy uprawnień do zarządzania bezpieczeństwem, regulacji poboru mocy i funkcji mikrokontrolera. Funkcje RAS (niezawodność, dostępność i łatwość serwisowania) są wbudowane w różne komponenty tej modułowej struktury.

Centralny diagram kompresji/dekompresji do optymalizacji architektury SoC

AMD podkreśliło również swoje zaawansowane algorytmy kompresji i dekompresji RDNA 4 SoC. Te nowe metodologie mają zapewnić 15% wzrost wydajności w niektórych obciążeniach rastrowych, jednocześnie redukując przepustowość sieci o 25%.Taka efektywność nie tylko obniża zużycie energii, ale także minimalizuje konieczność obsługi kompresji przez oprogramowanie, ponieważ ta funkcjonalność jest z natury zarządzana sprzętowo.

Przegląd kodów SKU produktów SOC RDNA 4, specyfikacje kart graficznych Radeon RX serii 9070 i 9060.

AMD podkreśliło elastyczną konfigurowalność, nieodłącznie związaną z modułową konstrukcją SoC, umożliwiającą tworzenie różnorodnych produktów WeU, aby sprostać zmieniającym się wymaganiom rynku. Dostępne konfiguracje są podzielone na cztery poziomy zbiorów:

  • SEHarvest
  • Żniwa WGP
  • Asymetryczne zbiory (potencjalnie obejmujące ważone rozkłady pikseli i shaderów obliczeniowych)
  • Zbiór urządzeń pamięci (ziarnistość pojedynczego urządzenia i ziarnistość 64-bitowa)
Szczegóły karty graficznej AMD Radeon RX 9070 XT z funkcjami RDNA 4 do gier i tworzenia.

Obecnie AMD prezentuje cztery układy Navi 48 WeU oraz trzy Navi 44 WeU, a skalowalna, modułowa konstrukcja SoC RDNA 4 otwiera drogę do jeszcze większej liczby konfiguracji w przyszłości.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *