
高带宽内存 (HBM) 标准的发展从 HBM4 到 HBM8 取得了显著进步,推动了满足日益增长的人工智能 (AI) 和数据中心性能需求所需的创新。
扩展 HBM 标准旨在满足 AI 和数据中心的需求
韩国科学技术院 (KAIST)和Tera(太字节互连与封装实验室)最近在一次演示中披露了 HBM 技术的宏伟发展路线图。随着 HBM4、HBM5、HBM6、HBM7 和 HBM8 等技术的出现,HBM 技术将迎来实质性的改进,有望将带宽提升至 64 TB/s。

从 HBM4 开始,该标准准备支持即将于 2026 年推出的 AI GPU 计划和数据中心技术。AMD 和 NVIDIA 等知名公司确认将 HBM 集成到 MI400 和 Rubin 系列等产品中,这表明了其重要性。


NVIDIA 即将发布的 GPU 路线图(由相关研究公司详细介绍)提供了至关重要的见解,尤其考虑到 Tera 在互连和 HBM 封装方面的专业知识。HBM4 内存专为 NVIDIA Rubin 和 AMD MI500 GPU 而设计。

NVIDIA 的 Rubin 和 AMD 的 MI500 GPU:深入了解 HBM4
NVIDIA Rubin 系列将采用 HBM4 和 HBM4e 技术,其中 Rubin 配备 8 个 HBM4 显存位点,而 Rubin Ultra 则配备 16 个显存位点。每个版本都展示了不同的芯片横截面积,其中 Ultra 的计算密度是前者的两倍。

据分析,Rubin GPU 的芯片面积为 728 平方毫米,功耗约为 800 瓦。其中介层面积为 2194 平方毫米,支持 288 至 384 GB 的内存容量,提供高达 16 至 32 TB/s 的带宽,总功耗约为 2200 瓦,几乎是上一代 Blackwell B200 GPU 的两倍。
HBM4 标准的主要特点
- 数据速率:约 8 Gbps
- IO 数量:2048(最多 4096)
- 总带宽:2.0 TB/s
- 芯片堆叠:12/16-Hi
- 每个芯片的容量:24 Gb
- 每个 HBM 的容量:高达 36/48 GB
- 每个 HBM 封装的功率:75W
- 封装方法:微凸块(MR-MUF)
- 冷却方式:直接芯片(D2C)液体冷却
- 定制 HBM 基础芯片架构
- 基座芯片中的 NMC 处理器 + LPDDR
- 支持的平台:NVIDIA Rubin 和 Instinct MI400

AMD 还通过其 Instinct MI400 提高了标准,配备了 432 GB 的 HBM4,带宽能力达到 19.6 TB/s,这比 NVIDIA 的产品有了显著的飞跃。
就HBM4的规格而言,该技术将提供8 Gbps的数据速率、2048位IO、每堆栈2.0 TB/s的带宽,以及48 GB的最大内存容量。它采用每堆栈75W的电源封装,并利用液体冷却以实现最佳性能。
HBM5、HBM6、HBM7 和 HBM8 的进步
未来,HBM5 计划于 2029 年左右发布,预计将保持 8 Gbps 的数据速率,同时将 IO 通道扩展到 4096 个。总带宽估计为 4 TB/s,该标准将利用 16-Hi 堆栈提供高达 80 GB 的容量。

HBM5 标准的主要特点
- 数据速率:8 Gbps
- IO 数量:4096
- 总带宽:4.0 TB/s
- 芯片堆叠:16层
- 每个芯片的容量:40 Gb
- 每 HBM 容量:80 GB
- 每个 HBM 封装的功率:100W
- 封装方法:微凸块(MR-MUF)
- 冷却方式:浸入式冷却、热通孔(TTV)
- 特殊功能:带有 3D NMC-HBM 和堆叠缓存的定制 HBM 基片
NVIDIA 的 Feynman 预计将成为第一款使用 HBM5 的 GPU,官方发布价格目标为 2029 年,以便进行充分的生产设置。
据报道,Feynman GPU 将采用 750 mm² 的芯片,功耗为 900W,预计将封装四个 GPU,配备 400 至 500 GB 的 HBM5 内存,总热设计功率 (TDP) 达到 4400W。
HBM6 及更高版本的下一代创新
继 HBM5 之后,下一个飞跃是 HBM6,预计将在 Feynman 架构之后推出。该版本预计将实现 16 Gbps 数据速率的显著升级,并配备 4096 位 IO 通道,从而显著提升带宽和内存容量。

HBM6 标准的主要特点
- 数据速率:16 Gbps
- IO 数量:4096
- 总带宽:8.0 TB/s
- 芯片堆叠:最多 20 层
- 每个芯片的容量:48 Gb
- 每 HBM 容量:96/120 GB
- 每个 HBM 封装的功率:120W
- 封装方法:无凸块Cu-Cu直接键合
- 冷却方式:浸入式冷却
- 高级功能:定制多塔 HBM 架构
借助 HBM6,我们预计带宽和功率效率都会提高,为高达 6014 平方毫米的潜在 GPU 封装铺平道路,提供非凡的内存带宽和容量能力。
HBM7 和 HBM8:高带宽内存的未来
展望未来,HBM7 和 HBM8 预计将重新定义内存技术。HBM7 的数据速率可达 24 Gbps,IO 数量高达 8192,带宽能力将大幅提升至 24 TB/s。

HBM7 标准的主要特点
- 数据速率:24 Gbps
- IO 计数:8192
- 总带宽:24.0 TB/s
- 芯片堆叠:20/24-Hi
- 每个芯片的容量:64 Gb
- 每 HBM 容量:160/192 GB
- 每个 HBM 封装的功率:160W
- 封装方法:无凸块Cu-Cu直接键合
- 冷却方式:嵌入式冷却
- 架构:混合 HBM 架构与缓冲芯片
最后,HBM8 将超越我们目前的理解,有望实现 32 Gbps 的数据速率和增强的容量,预计将于 2038 年左右发布。展望未来,HBM7 和 HBM8 标准将开启一个前所未有的计算能力时代。
创新散热解决方案与 HBM 架构的结合
高带宽闪存 (HBF) 架构等改进旨在优化内存密集型应用,例如大型语言模型生成。这项创新采用先进的 NAND 配置和互连策略,可与 HBM 堆栈无缝集成,从而提升性能。








随着我们步入数据密集型应用时代,创新架构与专业散热解决方案的紧密结合将为下一代计算提供所需的支撑。HBM 的未来前景光明,有望取得实质性进展,未来几年将为内存技术的演进带来激动人心的展望。
发表回复