AMD 即将推出 Instinct MI400 和 MI500 系列显卡,为应对 AI 加速器市场的巨大挑战做好准备,力图与 NVIDIA 目前在该领域的统治地位展开竞争。
揭秘 AMD MI400 系列:2027 年的各种型号和功能特性
在2025年金融分析师日上,AMD展示了即将推出的MI400和MI500系列AI GPU加速器,强调了它们在公司长期AI战略中的作用。这种年度发布周期旨在巩固AMD在AI领域的地位,因为NVIDIA在该领域仍然处于领先地位。

MI400系列预计将于明年首次亮相,并承诺带来多项改进:
- 增强型 HBM4 容量和带宽
- 更广泛的AI格式支持,吞吐量更高
- 标准化机架级网络(UALoE、UAL、UEC)
MI400 系列据称可实现 40 PFLOPS (FP4) 和 20 PFLOPS (FP8),有效地使目前流行的 MI350 系列的计算吞吐量翻了一番。

此外,MI400系列将采用HBM4显存技术,其显存容量从之前的288GB HBM3e提升至432GB,增幅高达50%。此次升级带来了惊人的19.6TB/s显存带宽,远超MI350系列的8TB/s。该系列每款GPU的横向扩展带宽均达到300GB/s,标志着AMD下一代Instinct产品线的重大飞跃。

与NVIDIA的Vera Rubin相比,AMD的Instinct MI400 GPU展现出显著优势:
- 内存容量是竞争对手的1.5倍
- 等效内存带宽和浮点运算次数(FP4 / FP8)
- 横向扩展带宽提升 1.5 倍

MI400 系列由两个主要型号组成:MI455X,面向可扩展的 AI 训练和推理工作负载;MI430X,专为 HPC 和主权 AI 任务而设计,具备基于硬件的 FP64 功能、混合计算(CPU+GPU),并保留了与其同类产品相同的 HBM4 内存。

展望2027年,AMD计划推出Instinct MI500系列显卡,延续其年度产品更新周期。此举旨在快速推进数据中心AI技术的发展,与NVIDIA提供标准版和“Ultra”版显卡的策略相呼应。MI500系列预计将显著提升计算、内存和互连能力,进一步增强AMD在AI领域的竞争优势。
AMD Instinct AI 加速器对比
| 加速器名称 | AMD Instinct MI500 | AMD Instinct MI400 | AMD Instinct MI350X | AMD Instinct MI325X | AMD Instinct MI300X | AMD Instinct MI250X |
|---|---|---|---|---|---|---|
| GPU架构 | CDNA Next / UDNA | CDNA 5 | CDNA 4 | Aqua Vanjaram(CDNA 3) | Aqua Vanjaram(CDNA 3) | Aldebaran(CDNA 2) |
| GPU 处理节点 | 待定 | 待定 | 3纳米 | 5nm+6nm | 5nm+6nm | 6纳米 |
| XCD(芯片) | 待定 | 8(MCM) | 8(MCM) | 8(MCM) | 8(MCM) | 2(MCM;每模1个) |
| GPU核心 | 待定 | 待定 | 16, 384 | 19, 456 | 19, 456 | 14, 080 |
| GPU 时钟频率(最大值) | 待定 | 待定 | 2400 MHz | 2100 MHz | 2100 MHz | 1700 MHz |
| INT8 计算 | 待定 | 待定 | 5200 TOPS | 2614 顶级 | 2614 顶级 | 383 TOPs |
| FP6/FP4矩阵 | 待定 | 40 PFLOPS | 20 PFLOPS | 不适用 | 不适用 | 不适用 |
| FP8矩阵 | 待定 | 20 PFLOPS | 5 PFLOPS | 2.6 浮点运算/秒 | 2.6 浮点运算/秒 | 不适用 |
| FP16矩阵 | 待定 | 10 PFLOPS | 2.5 浮点运算/秒 | 1.3 浮点运算/秒 | 1.3 浮点运算/秒 | 383 万亿次浮点运算 |
| FP32 向量 | 待定 | 待定 | 157.3 万亿次浮点运算 | 163.4 万亿次浮点运算 | 163.4 万亿次浮点运算 | 95.7 万亿次浮点运算 |
| FP64 向量 | 待定 | 待定 | 78.6 万亿次浮点运算 | 81.7 万亿次浮点运算 | 81.7 万亿次浮点运算 | 47.9 万亿次浮点运算 |
| 显存 | 待定 | 432GB HBM4 | 288 GB HBM3e | 256 GB HBM3e | 192GB HBM3 | 128 GB HBM2e |
| 无限缓存 | 待定 | 待定 | 256 MB | 256 MB | 256 MB | 不适用 |
| 内存时钟 | 待定 | 19.6 TB/s | 8.0 Gbps | 5.9 Gbps | 5.2 Gbps | 3.2 Gbps |
| 内存总线 | 待定 | 待定 | 8192 位 | 8192 位 | 8192 位 | 8192 位 |
| 内存带宽 | 待定 | 待定 | 8TB/秒 | 6.0 TB/s | 5.3 TB/s | 3.2 TB/s |
| 外形尺寸 | 待定 | 待定 | OAM | OAM | OAM | OAM |
| 冷却 | 待定 | 待定 | 被动式/液体 | 被动冷却 | 被动冷却 | 被动冷却 |
| TDP(最大值) | 待定 | 待定 | 1400瓦(355倍) | 1000瓦 | 750瓦 | 560瓦 |
发表回复