
Firma AMD rozwinęła architekturę procesora graficznego RDNA 4 i innowacyjną modułową konstrukcję SoC, wprowadzając zaawansowane strategie kompresji pamięci i przepustowości, które zwiększają wydajność.
Ponowne omówienie architektury GPU RDNA 4 i innowacji modułowych SoC firmy AMD na konferencji Hot Chips 2025
Na początku lutego firma AMD opublikowała kompleksowy przegląd architektury RDNA 4. Niedawne prezentacje na konferencji Hot Chips 2025 dostarczają dalszych informacji, zwłaszcza na temat modułowej natury tego układu zaprojektowanego z myślą o wszechstronnych zastosowaniach.
Jednym z istotnych aspektów, którymi zajęła się firma AMD, jest włączenie pamięci LPDDR do układów SoC GPU niższej klasy RDNA 4. Chociaż pamięć LPDDR jest znana ze swojego niższego zużycia energii, AMD wskazuje na brak niezbędnej przepustowości. W rezultacie zwiększa się fizyczna powierzchnia zajmowana przez układ, co sprawia, że pamięć LPDDR nie nadaje się do kart graficznych o wysokiej wydajności.












Zapytani o zmniejszoną przepustowość pamięci w porównaniu z RDNA 3, AMD wyjaśniło, że wydajność przepustowości pamięci jest silnie zależna od konkretnych obciążeń. Dostrojenie architektury graficznej RDNA 4 doprowadziło do znacznego zmniejszenia zapotrzebowania na przepustowość bez pogorszenia wydajności.
Podczas prezentacji Hot Chips, AMD podkreśliło elastyczność swojej modułowej architektury SoC. Model RDNA 4 został zaprojektowany jako wszechstronny układ, który umożliwia różnorodne konfiguracje dla różnych produktów Radeon. Laks Pappu, architekt SoC w AMD, podkreślił modułowe możliwości, które mają zostać rozszerzone na przyszłe generacje RDNA 5 i UDNA.

Architektura wykorzystuje diagram przepływu danych, który obejmuje wiele silników cieniowania zintegrowanych w układach SoC Navi 4X, przy czym każdy silnik cieniowania obejmuje kilka procesorów grupy roboczej (WGP) wyposażonych w dwie jednostki obliczeniowe.
Sieć komunikacyjną między tymi komponentami ułatwia pamięć podręczna GL2 po stronie GPU, łącząca się z ulepszoną strukturą Infinity Fabric, czyli spójnym mechanizmem połączeń. Ta modułowa konstrukcja obejmuje kilka stacji koherentnych (Coherent Stations) wraz z kontrolerami pamięci LLC i dwukanałowymi kontrolerami pamięci połączonymi bezpośrednio z pamięcią DRAM (GDDR6) na płytce drukowanej. Warto zauważyć, że struktura Infinity Fabric pracuje z szybkością 1 KB na cykl zegara w zakresie częstotliwości od 1, 5 do 2, 5 GHz.

Koncentrując się na modułowej konstrukcji SoC, AMD przedstawiło jej potencjał w zakresie wydajnego tworzenia mniejszych układów SoC. Zaznaczona czerwona linia na diagramach AMD ilustruje segmentację modułowych układów i ich skalowalność w różnych systemach operacyjnych. Na przykład konfiguracja poniżej czerwonej linii wskazuje na konstrukcję Navi 44 z dwoma silnikami cieniowania i czterema kontrolerami pamięci GDDR6, co pozwala na regulację w obu kierunkach – skalowanie w górę lub w dół w zależności od wymagań.

Modułowa architektura nie tylko umożliwia dodanie większej liczby silników cieniowania, pamięci podręcznych L3, połączeń Infinity Fabric i kontrolerów pamięci GDDR dla zaawansowanych procesorów WeU, takich jak Navi 48 w karcie graficznej RX 9070 XT, ale także podnosi poziom bezpieczeństwa. Zapewnia kontrolowany dostęp i różne poziomy uprawnień do zarządzania bezpieczeństwem, regulacji poboru mocy i funkcji mikrokontrolera. Funkcje RAS (niezawodność, dostępność i łatwość serwisowania) są wbudowane w różne komponenty tej modułowej struktury.

AMD podkreśliło również swoje zaawansowane algorytmy kompresji i dekompresji RDNA 4 SoC. Te nowe metodologie mają zapewnić 15% wzrost wydajności w niektórych obciążeniach rastrowych, jednocześnie redukując przepustowość sieci o 25%.Taka efektywność nie tylko obniża zużycie energii, ale także minimalizuje konieczność obsługi kompresji przez oprogramowanie, ponieważ ta funkcjonalność jest z natury zarządzana sprzętowo.

AMD podkreśliło elastyczną konfigurowalność, nieodłącznie związaną z modułową konstrukcją SoC, umożliwiającą tworzenie różnorodnych produktów WeU, aby sprostać zmieniającym się wymaganiom rynku. Dostępne konfiguracje są podzielone na cztery poziomy zbiorów:
- SEHarvest
- Żniwa WGP
- Asymetryczne zbiory (potencjalnie obejmujące ważone rozkłady pikseli i shaderów obliczeniowych)
- Zbiór urządzeń pamięci (ziarnistość pojedynczego urządzenia i ziarnistość 64-bitowa)

Obecnie AMD prezentuje cztery układy Navi 48 WeU oraz trzy Navi 44 WeU, a skalowalna, modułowa konstrukcja SoC RDNA 4 otwiera drogę do jeszcze większej liczby konfiguracji w przyszłości.
Dodaj komentarz