
AMD 对其 RDNA 4 GPU 架构和创新的模块化 SoC 设计进行了详细说明,引入了可增强性能的先进内存和带宽压缩策略。
在 2025 年 Hot Chips 大会上回顾 AMD 的 RDNA 4 GPU 架构和模块化 SoC 创新
今年 2 月初,AMD 发布了 RDNA 4 架构的全面概述。最近在 Hot Chips 2025 大会上的演示提供了进一步的见解,尤其是关于这款芯片专为多功能应用而设计的模块化特性。
AMD 解决的一个值得注意的问题,是将 LPDDR 内存融入其低端 RDNA 4 GPU SoC。虽然 LPDDR 内存因其低功耗而受到认可,但 AMD 表示其缺乏必要的带宽。因此,芯片的物理占用空间会增加,使得 LPDDR 不适合用于高性能显卡。












当被问及与 RDNA 3 相比内存带宽降低的原因时,AMD 解释说,内存带宽效率高度依赖于特定的工作负载。RDNA 4 图形架构的调整使得带宽需求显著降低,同时又不影响性能。
在 Hot Chips 大会的演示中,AMD 强调了其模块化 SoC 架构的灵活性。RDNA 4 型号被设计为一款多功能芯片,可为各种 Radeon 产品提供多样化的配置。AMD SoC 架构师 Laks Pappu 重点介绍了模块化功能,预计这些功能将扩展到未来的 RDNA 5 和 UDNA 世代。

该架构采用数据流图,其特点是 Navi 4X SoC 内集成了多个着色器引擎,其中每个着色器引擎包含多个配备双计算单元的工作组处理器 (WGP)。
这些组件之间的通信网络由 GPU 侧的 GL2 缓存提供,并连接到改进的 Infinity Fabric(一种一致性互连机制)。这种模块化设计包含多个一致性工作站以及 LLC 和双通道内存控制器,这些控制器直接连接到 PCB 上的 DRAM(GDDR6)。值得注意的是,Infinity Fabric 的运行速度为每时钟周期 1KB,频率范围为 1.5 至 2.5 GHz。

AMD 专注于模块化 SoC 设计,并阐述了其高效打造更小 SoC 的潜力。AMD 图表中一条红线标明了模块化芯片的细分及其在各个 WeU 之间的可扩展性。例如,红线下方的配置表示采用 Navi 44 设计,该设计具有两个着色器引擎和四个 GDDR6 内存控制器,从而允许双向调整——根据需求进行扩展或缩减。

模块化架构不仅能够为更高端的WeU(例如RX 9070 XT显卡中的Navi 48)添加更多着色器引擎、L3缓存、Infinity Fabric互连和GDDR内存控制器,还能提升安全级别。它允许对安全管理、电源调节和微控制器功能进行受控访问和不同的权限级别设置。RAS(可靠性、可用性和可维护性)功能嵌入到该模块化芯片的各个组件中。

AMD 还重点介绍了其先进的 RDNA 4 SoC 压缩和解压缩算法。据称,这些新方法可在某些光栅工作负载下将性能提升 15%,同时将结构带宽降低 25%。这种效率不仅降低了功耗,还最大限度地减少了软件处理压缩的需求,因为压缩功能本身就由硬件管理。

AMD 重申了其模块化 SoC 设计固有的灵活配置能力,从而能够创建多样化的产品 WeU,以满足不断变化的市场需求。可用的配置分为四个等级:
- SEHarvest
- WGP 收获
- 非对称收获(可能包含加权像素和计算着色器分布)
- 内存设备收获(单设备粒度和 64 位粒度)

目前,AMD 展示了四款 Navi 48 WeU 和三款 Navi 44 WeU,RDNA 4 可扩展的模块化 SoC 特性为未来更多配置铺平了道路。
发表回复