AMD Instinct MI400 加速器:40 PFLOP 计算能力,432 GB HBM4 内存,19.6 TB/s,将于 2026 年推出

AMD Instinct MI400 加速器:40 PFLOP 计算能力,432 GB HBM4 内存,19.6 TB/s,将于 2026 年推出

除了最近推出的 MI350 系列之外,AMD 还提供了即将推出的下一代 Instinct MI400 系列的激动人心的预览,该系列将于 2026 年首次亮相。

突出 AMD Instinct MI400 的卓越功能

AMD 的 Instinct MI400 加速器似乎显著增强了其硬件功能,其计算性能几乎是 MI350 系列的两倍。官方规格表明,MI400 将为FP4 运算提供令人印象深刻的40 PFLOP ,为 FP8 计算提供20 PFLOP,与当代 MI350 系列相比,计算能力实际上翻了一番。

此外,AMD 正在利用 HBM4 内存技术的优势,打造 MI400 系列。新一代产品内存容量将提升 50%,从288GB HBM3e提升至432GB HBM4。HBM4标准带来了惊人的19.6 TB/s 带宽,是MI350 系列8 TB/s带宽的两倍多。此外,每个 GPU 将支持300 GB/s 的横向扩展带宽,这预示着下一代 Instinct 加速器的性能将大幅提升。

在之前的公告中,Instinct MI400 加速器的细节已披露其集成多达四个加速计算芯片 (XCD),这较 MI300 型号使用的两个 XCD 有了显著提升。值得注意的是,MI400 将包含两个有源中介层芯片 (AID),并将多媒体芯片I/O 芯片分离,从而增强整体功能和效率。

MI400补丁
图片来源:FreeDesktop.org

每个 AID 都将配备专用的MID Tile,确保计算单元和 I/O 接口之间的通信流畅,这较前几代产品有所改进。MI350 系列已采用 Infinity Fabric 进行芯片间通信,因此我们可以预期 MI400 的架构将取得更大的进步。

瞄准大规模人工智能任务

MI400 系列旨在满足日益增长的大规模 AI 训练和推理任务的需求,利用新的 CDNA-Next 架构,该架构可能会更名为 UDNA,以统一 AMD 的 RDNA 和 CDNA 架构。

AMD Instinct AI 加速器比较

加速器名称 AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU架构 CDNA Next/UDNA 互补DNA 4 Aqua Vanjaram(CDNA 3) Aqua Vanjaram(CDNA 3) 毕宿五(CDNA 2)
GPU 处理节点 待定 3纳米 5纳米+6纳米 5纳米+6纳米 6纳米
XCD(小芯片) 8(MCM) 8(MCM) 8(MCM) 8(MCM) 2 (MCM),1 (每个芯片)
GPU核心 待定 待定 19, 456 19, 456 14, 080
GPU 时钟速度 待定 待定 2100兆赫 2100兆赫 1700兆赫
INT8 计算 待定 待定 2614 件 2614 件 383 TOP
FP6/FP4 计算 待定 20 PFLOP 不适用 不适用 不适用
FP8 计算 待定 10 PFLOP 2.6 PFLOPs 2.6 PFLOPs 不适用
FP16 计算 待定 5 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOP
FP32 计算 待定 待定 163.4 TFLOP 163.4 TFLOP 95.7 TFLOP
FP64 计算 待定 79 TFLOP 81.7 TFLOP 81.7 TFLOP 47.9 TFLOP
显存 待定 288 HBM3e 256 GB HBM3e 192GB HBM3 128 GB HBM2e
无限缓存 待定 待定 256 MB 256 MB 不适用
内存时钟 待定 8.0 Gbps 5.9 Gbps 5.2 Gbps 3.2 Gbps
内存总线 待定 8192位 8192位 8192位 8192位
内存带宽 待定 8TB/秒 6.0 TB/秒 5.3 TB/秒 3.2 TB/秒
外形尺寸 待定 运营管理 运营管理 运营管理 运营管理
冷却 待定 被动冷却 被动冷却 被动冷却 被动冷却
TDP(最大) 待定 1400瓦(355X) 1000瓦 750瓦 560瓦

如需了解更多深入信息和见解,请访问有关 AMD 即将推出的创新的完整文章。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注