探索 AMD RDNA 4:模块化 SoC 设计与可配置性,适用于 Navi 44 等紧凑型 GPU,具有内存和带宽效率

探索 AMD RDNA 4:模块化 SoC 设计与可配置性,适用于 Navi 44 等紧凑型 GPU,具有内存和带宽效率

AMD 对其 RDNA 4 GPU 架构和创新的模块化 SoC 设计进行了详细说明,引入了可增强性能的先进内存和带宽压缩策略。

在 2025 年 Hot Chips 大会上回顾 AMD 的 RDNA 4 GPU 架构和模块化 SoC 创新

今年 2 月初,AMD 发布了 RDNA 4 架构的全面概述。最近在 Hot Chips 2025 大会上的演示提供了进一步的见解,尤其是关于这款芯片专为多功能应用而设计的模块化特性。

AMD 解决的一个值得注意的问题,是将 LPDDR 内存融入其低端 RDNA 4 GPU SoC。虽然 LPDDR 内存因其低功耗而受到认可,但 AMD 表示其缺乏必要的带宽。因此,芯片的物理占用空间会增加,使得 LPDDR 不适合用于高性能显卡。

AMD RDNA 4 Radeon 9000 GPU 在 Hot Chips 2025 活动上发布,详细展示该芯片。
RDNA 4 Vision:针对游戏而优化的 GPU 架构,具有增强的性能和光线追踪功能。
该图详细介绍了 AMD Radeon RX 9070 XT 的功能,强调了渲染、光线追踪和内存。
AMD RDNA 4:增强的游戏流媒体、低延迟视频和 FreeSync 优化细节。
RDNA 4 光线追踪架构:增强型加速器和优化的 BVH 内存图表
通过热图比较深入研究定向边界框和遍历优化
无序内存队列通过高效处理请求来提高 RDNA 4 GPU 性能。
RDNA 4 架构通过多种优化因素增强了光线遍历性能。
图表比较了着色器中 RDNA 3 静态寄存器分配与 RDNA 4 动态寄存器分配。
RDNA 4 适用于游戏和内容创作的 AI 功能,展现了增强的效率和性能。
光线追踪和路径追踪方法的比较,并附有图表和主要区别的解释。
舒适的工作室,配有机器人和技术工具,由彩色灯串照亮,展示 RDNA 4 路径追踪。

当被问及与 RDNA 3 相比内存带宽降低的原因时,AMD 解释说,内存带宽效率高度依赖于特定的工作负载。RDNA 4 图形架构的调整使得带宽需求显著降低,同时又不影响性能。

在 Hot Chips 大会的演示中,AMD 强调了其模块化 SoC 架构的灵活性。RDNA 4 型号被设计为一款多功能芯片,可为各种 Radeon 产品提供多样化的配置。AMD SoC 架构师 Laks Pappu 重点介绍了模块化功能,预计这些功能将扩展到未来的 RDNA 5 和 UDNA 世代。

RDNA 4 SoC 架构演示幻灯片,带有抽象几何设计和 AMD 标志。

该架构采用数据流图,其特点是 Navi 4X SoC 内集成了多个着色器引擎,其中每个着色器引擎包含多个配备双计算单元的工作组处理器 (WGP)。

这些组件之间的通信网络由 GPU 侧的 GL2 缓存提供,并连接到改进的 Infinity Fabric(一种一致性互连机制)。这种模块化设计包含多个一致性工作站以及 LLC 和双通道内存控制器,这些控制器直接连接到 PCB 上的 DRAM(GDDR6)。值得注意的是,Infinity Fabric 的运行速度为每时钟周期 1KB,频率范围为 1.5 至 2.5 GHz。

SOC 架构数据流显示着色器引擎和 Infinity Fabric 连接。

AMD 专注于模块化 SoC 设计,并阐述了其高效打造更小 SoC 的潜力。AMD 图表中一条红线标明了模块化芯片的细分及其在各个 WeU 之间的可扩展性。例如,红线下方的配置表示采用 Navi 44 设计,该设计具有两个着色器引擎和四个 GDDR6 内存控制器,从而允许双向调整——根据需求进行扩展或缩减。

模块化 SoC 架构概述,具有安全功能和组件布局,突出显示 RDNA4 芯片。

模块化架构不仅能够为更高端的WeU(例如RX 9070 XT显卡中的Navi 48)添加更多着色器引擎、L3缓存、Infinity Fabric互连和GDDR内存控制器,还能提升安全级别。它允许对安全管理、电源调节和微控制器功能进行受控访问和不同的权限级别设置。RAS(可靠性、可用性和可维护性)功能嵌入到该模块化芯片的各个组件中。

用于 SoC 架构优化的中央压缩/解压缩图

AMD 还重点介绍了其先进的 RDNA 4 SoC 压缩和解压缩算法。据称,这些新方法可在某些光栅工作负载下将性能提升 15%,同时将结构带宽降低 25%。这种效率不仅降低了功耗,还最大限度地减少了软件处理压缩的需求,因为压缩功能本身就由硬件管理。

SOC RDNA 4 产品 SKU 概览、Radeon RX 9070 和 9060 系列 GPU 的规格。

AMD 重申了其模块化 SoC 设计固有的灵活配置能力,从而能够创建多样化的产品 WeU,以满足不断变化的市场需求。可用的配置分为四个等级:

  • SEHarvest
  • WGP 收获
  • 非对称收获(可能包含加权像素和计算着色器分布)
  • 内存设备收获(单设备粒度和 64 位粒度)
AMD Radeon RX 9070 XT GPU 详细信息,具有适用于游戏和创作的 RDNA 4 功能。

目前,AMD 展示了四款 Navi 48 WeU 和三款 Navi 44 WeU,RDNA 4 可扩展的模块化 SoC 特性为未来更多配置铺平了道路。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注