探索 AMD RDNA 4:模組化 SoC 設計與可配置性,適用於 Navi 44 等緊湊型 GPU,具有記憶體和頻寬效率

探索 AMD RDNA 4:模組化 SoC 設計與可配置性,適用於 Navi 44 等緊湊型 GPU,具有記憶體和頻寬效率

AMD 對其 RDNA 4 GPU 架構和創新的模組化 SoC 設計進行了詳細說明,引入了可增強效能的先進記憶體和頻寬壓縮策略。

在 2025 年 Hot Chips 大會上回顧 AMD 的 RDNA 4 GPU 架構和模組化 SoC 創新

今年 2 月初,AMD 發布了 RDNA 4 架構的全面概述。最近在 Hot Chips 2025 大會上的演示提供了進一步的見解,尤其是關於這款晶片專為多功能應用而設計的模組化特性。

AMD 解決的一個值得注意的問題,是將 LPDDR 記憶體融入其低階 RDNA 4 GPU SoC。雖然 LPDDR 記憶體因其低功耗而受到認可,但 AMD 表示其缺乏必要的頻寬。因此,晶片的實體佔用空間會增加,使得 LPDDR 不適合用於高效能顯示卡。

AMD RDNA 4 Radeon 9000 GPU 在 Hot Chips 2025 活動上發布,詳細展示該晶片。
RDNA 4 Vision:針對遊戲而優化的 GPU 架構,具有增強的效能和光線追蹤功能。
該圖詳細介紹了 AMD Radeon RX 9070 XT 的功能,強調了渲染、光線追蹤和記憶體。
AMD RDNA 4:增強的遊戲串流、低延遲影片和 FreeSync 優化細節。
RDNA 4 光線追蹤架構:增強型加速器和優化的 BVH 記憶體圖表
透過熱圖比較深入研究定向邊界框和遍歷優化
無序記憶體佇列透過高效處理請求來提高 RDNA 4 GPU 效能。
RDNA 4 架構透過多種最佳化因素增強了光線遍歷效能。
圖表比較了著色器中 RDNA 3 靜態暫存器分配與 RDNA 4 動態暫存器分配。
RDNA 4 適用於遊戲和內容創作的 AI 功能,展現了增強的效率和效能。
光線追蹤和路徑追蹤方法的比較,並附有圖表和主要差異的解釋。
舒適的工作室,配有機器人和技術工具,由彩色燈串照亮,展示 RDNA 4 路徑追蹤。

當被問及與 RDNA 3 相比記憶體頻寬降低的原因時,AMD 解釋說,記憶體頻寬效率高度依賴於特定的工作負載。 RDNA 4 圖形架構的調整使得頻寬需求顯著降低,同時不影響效能。

在 Hot Chips 大會的演示中,AMD 強調了其模組化 SoC 架構的靈活性。 RDNA 4 型號被設計為一款多功能晶片,可為各種 Radeon 產品提供多樣化的配置。 AMD SoC 架構師 Laks Pappu 重點介紹了模組化功能,預計這些功能將擴展到未來的 RDNA 5 和 UDNA 世代。

RDNA 4 SoC 架構簡報投影片,附有抽象幾何設計和 AMD 標誌。

該架構採用資料流程圖,其特點是 Navi 4X SoC 內部整合了多個著色器引擎,其中每個著色器引擎包含多個配備雙重運算單元的工作群組處理器 (WGP)。

這些元件之間的通訊網路由 GPU 側的 GL2 快取提供,並連接到改進的 Infinity Fabric(一種一致性互連機制)。這種模組化設計包含多個一致性工作站以及 LLC 和雙通道記憶體控制器,這些控制器直接連接到 PCB 上的 DRAM(GDDR6)。值得注意的是,Infinity Fabric 的運行速度為每個時脈週期 1KB,頻率範圍為 1.5 至 2.5 GHz。

SOC 架構資料流顯示著色器引擎和 Infinity Fabric 連線。

AMD 專注於模組化 SoC 設計,並闡述了其高效打造更小 SoC 的潛力。 AMD 圖表中一條紅線標示了模組化晶片的細分及其在各個 WeU 之間的可擴展性。例如,紅線下方的配置表示 Navi 44 設計,它配備了兩個著色器引擎和四個 GDDR6 記憶體控制器,從而允許雙向調整——根據需求進行擴展或縮減。

模組化 SoC 架構概述,具有安全功能和組件佈局,突出顯示 RDNA4 晶片。

模組化架構不僅能夠為更高階的WeU(例如RX 9070 XT顯示卡中的Navi 48)增加更多著色器引擎、L3快取、Infinity Fabric互連和GDDR記憶體控制器,還能提升安全等級。它允許對安全管理、電源調節和微控制器功能進行受控存取和不同的權限等級設定。 RAS(可靠性、可用性和可維護性)功能嵌入到此模組化晶片的各個組件中。

用於 SoC 架構優化的中央壓縮/解壓縮圖

AMD 還重點介紹了其先進的 RDNA 4 SoC 壓縮和解壓縮演算法。據稱,這些新方法可在某些光柵工作負載下將效能提升 15%,同時將結構頻寬降低 25%。這種效率不僅降低了功耗,還最大限度地減少了軟體處理壓縮的需求,因為壓縮功能本身就由硬體管理。

SOC RDNA 4 產品 SKU 概覽、Radeon RX 9070 和 9060 系列 GPU 的規格。

AMD 重申了其模組化 SoC 設計固有的靈活配置能力,從而能夠創建多樣化的產品 WeU,以滿足不斷變化的市場需求。可用的配置分為四個等級:

  • SEHarvest
  • WGP 收穫
  • 非對稱收穫(可能包含加權像素和計算著色器分佈)
  • 記憶體設備收穫(單設備粒度和 64 位元粒度)
AMD Radeon RX 9070 XT GPU 詳細信息,具有適用於遊戲和創作的 RDNA 4 功能。

目前,AMD 展示了四款 Navi 48 WeU 和三款 Navi 44 WeU,RDNA 4 可擴展的模組化 SoC 特性為未來更多配置鋪平了道路。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *