AMD 即將推出 Instinct MI400 和 MI500 系列顯示卡,為應對 AI 加速器市場的巨大挑戰做好準備,試圖與 NVIDIA 目前在該領域的統治地位展開競爭。
揭露 AMD MI400 系列:2027 年的各種型號和功能特性
在2025年金融分析師日上,AMD展示了即將推出的MI400和MI500系列AI GPU加速器,強調了它們在公司長期AI策略中的作用。這種年度發布週期旨在鞏固AMD在AI領域的地位,因為NVIDIA在該領域仍處於領先地位。

MI400系列預計將於明年首次亮相,並承諾帶來多項改進:
- 增強型 HBM4 容量和頻寬
- 更廣泛的AI格式支持,吞吐量更高
- 標準化機架級網路(UALoE、UAL、UEC)
MI400 系列據稱可實現 40 PFLOPS (FP4) 和 20 PFLOPS (FP8),有效地使目前流行的 MI350 系列的運算吞吐量翻了一番。

此外,MI400系列將採用HBM4顯存技術,其記憶體容量從先前的288GB HBM3e提升至432GB,增幅高達50%。此次升級帶來了驚人的19.6TB/s顯存頻寬,遠超MI350系列的8TB/s。此系列每款GPU的橫向擴展頻寬均達到300GB/s,標誌著AMD下一代Instinct產品線的重大飛躍。

與NVIDIA的Vera Rubin相比,AMD的Instinct MI400 GPU展現出顯著優勢:
- 記憶體容量是競爭對手的1.5倍
- 等效記憶體頻寬和浮點運算次數(FP4 / FP8)
- 橫向擴展頻寬提升 1.5 倍

MI400 系列由兩個主要型號組成:MI455X,可擴展的 AI 訓練和推理工作負載;MI430X,專為 HPC 和主權 AI 任務而設計,具備基於硬體的 FP64 功能、混合運算(CPU+GPU),並保留了與其同類產品相同的 HBM4 記憶體。

展望2027年,AMD計畫推出Instinct MI500系列顯示卡,延續其年度產品更新周期。此舉旨在快速推進資料中心AI技術的發展,與NVIDIA提供標準版和「Ultra」版顯示卡的策略相呼應。 MI500系列預計將顯著提升運算、記憶體和互連能力,進一步增強AMD在AI領域的競爭優勢。
AMD Instinct AI 加速器對比
| 加速器名稱 | AMD Instinct MI500 | AMD Instinct MI400 | AMD Instinct MI350X | AMD Instinct MI325X | AMD Instinct MI300X | AMD Instinct MI250X |
|---|---|---|---|---|---|---|
| GPU架構 | CDNA Next / UDNA | CDNA 5 | CDNA 4 | Aqua Vanjaram(CDNA 3) | Aqua Vanjaram(CDNA 3) | Aldebaran(CDNA 2) |
| GPU 處理節點 | 待定 | 待定 | 3奈米 | 5nm+6nm | 5nm+6nm | 6奈米 |
| XCD(晶片) | 待定 | 8(MCM) | 8(MCM) | 8(MCM) | 8(MCM) | 2(MCM;每模1個) |
| GPU核心 | 待定 | 待定 | 16, 384 | 19, 456 | 19, 456 | 14, 080 |
| GPU 時脈頻率(最大值) | 待定 | 待定 | 2400 MHz | 2100 MHz | 2100 MHz | 1700 MHz |
| INT8 計算 | 待定 | 待定 | 5200 TOPS | 2614 頂級 | 2614 頂級 | 383 TOPs |
| FP6/FP4矩陣 | 待定 | 40 PFLOPS | 20 PFLOPS | 不適用 | 不適用 | 不適用 |
| FP8矩陣 | 待定 | 20 PFLOPS | 5 PFLOPS | 2.6 浮點運算/秒 | 2.6 浮點運算/秒 | 不適用 |
| FP16矩陣 | 待定 | 10 PFLOPS | 2.5 浮點運算/秒 | 1.3 浮點運算/秒 | 1.3 浮點運算/秒 | 383 兆次浮點運算 |
| FP32 向量 | 待定 | 待定 | 157.3 兆次浮點運算 | 163.4 兆次浮點運算 | 163.4 兆次浮點運算 | 95.7 兆次浮點運算 |
| FP64 向量 | 待定 | 待定 | 78.6 兆次浮點運算 | 81.7 兆次浮點運算 | 81.7 兆次浮點運算 | 47.9 兆次浮點運算 |
| 顯存 | 待定 | 432GB HBM4 | 288 GB HBM3e | 256 GB HBM3e | 192GB HBM3 | 128 GB HBM2e |
| 無限緩存 | 待定 | 待定 | 256 MB | 256 MB | 256 MB | 不適用 |
| 記憶體時鐘 | 待定 | 19.6 TB/s | 8.0 Gbps | 5.9 Gbps | 5.2 Gbps | 3.2 Gbps |
| 記憶體總線 | 待定 | 待定 | 8192 位 | 8192 位 | 8192 位 | 8192 位 |
| 記憶體頻寬 | 待定 | 待定 | 8TB/秒 | 6.0 TB/s | 5.3 TB/s | 3.2 TB/s |
| 外形尺寸 | 待定 | 待定 | OAM | OAM | OAM | OAM |
| 冷卻 | 待定 | 待定 | 被動式/液體 | 被動冷卻 | 被動冷卻 | 被動冷卻 |
| TDP(最大值) | 待定 | 待定 | 1400瓦(355倍) | 1000瓦 | 750瓦 | 560瓦 |
發佈留言