AMD 準備在 2026 年推出 MI400 系列加速器“MI455X 和 MI430X”,挑戰 NVIDIA 在 AI 領域的領導地位,並計劃在 2027 年推出 MI500 系列。

AMD 準備在 2026 年推出 MI400 系列加速器“MI455X 和 MI430X”,挑戰 NVIDIA 在 AI 領域的領導地位,並計劃在 2027 年推出 MI500 系列。

AMD 即將推出 Instinct MI400 和 MI500 系列顯示卡,為應對 AI 加速器市場的巨大挑戰做好準備,試圖與 NVIDIA 目前在該領域的統治地位展開競爭。

揭露 AMD MI400 系列:2027 年的各種型號和功能特性

在2025年金融分析師日上,AMD展示了即將推出的MI400和MI500系列AI GPU加速器,強調了它們在公司長期AI策略中的作用。這種年度發布週期旨在鞏固AMD在AI領域的地位,因為NVIDIA在該領域仍處於領先地位。

AMD Instinct:資料中心GPU架構路線圖,包含MI300至MI500系列規格

MI400系列預計將於明年首次亮相,並承諾帶來多項改進:

  • 增強型 HBM4 容量和頻寬
  • 更廣泛的AI格式支持,吞吐量更高
  • 標準化機架級網路(UALoE、UAL、UEC)

MI400 系列據稱可實現 40 PFLOPS (FP4) 和 20 PFLOPS (FP8),有效地使目前流行的 MI350 系列的運算吞吐量翻了一番。

AMD Instinct MI450 系列的主要規格包括「40 PF」、432 GB HBM4 記憶體和「3.6 TB/s」頻寬

此外,MI400系列將採用HBM4顯存技術,其記憶體容量從先前的288GB HBM3e提升至432GB,增幅高達50%。此次升級帶來了驚人的19.6TB/s顯存頻寬,遠超MI350系列的8TB/s。此系列每款GPU的橫向擴展頻寬均達到300GB/s,標誌著AMD下一代Instinct產品線的重大飛躍。

比較圖表:MI450 系列在機架等級效能方面領先英偉達 Vera Rubin

與NVIDIA的Vera Rubin相比,AMD的Instinct MI400 GPU展現出顯著優勢:

  • 記憶體容量是競爭對手的1.5倍
  • 等效記憶體頻寬和浮點運算次數(FP4 / FP8)
  • 橫向擴展頻寬提升 1.5 倍
AMD Instinct MI400 系列產品組合展示了用於 AI 訓練和推理的 MI455X 以及用於高效能運算的 MI430X。

MI400 系列由兩個主要型號組成:MI455X,可擴展的 AI 訓練和推理工作負載;MI430X,專為 HPC 和主權 AI 任務而設計,具備基於硬體的 FP64 功能、混合運算(CPU+GPU),並保留了與其同類產品相同的 HBM4 記憶體。

AMD Instinct:資料中心GPU架構路線圖,從MI300到MI500系列

展望2027年,AMD計畫推出Instinct MI500系列顯示卡,延續其年度產品更新周期。此舉旨在快速推進資料中心AI技術的發展,與NVIDIA提供標準版和「Ultra」版顯示卡的策略相呼應。 MI500系列預計將顯著提升運算、記憶體和互連能力,進一步增強AMD在AI領域的競爭優勢。

AMD Instinct AI 加速器對比

加速器名稱 AMD Instinct MI500 AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU架構 CDNA Next / UDNA CDNA 5 CDNA 4 Aqua Vanjaram(CDNA 3) Aqua Vanjaram(CDNA 3) Aldebaran(CDNA 2)
GPU 處理節點 待定 待定 3奈米 5nm+6nm 5nm+6nm 6奈米
XCD(晶片) 待定 8(MCM) 8(MCM) 8(MCM) 8(MCM) 2(MCM;每模1個)
GPU核心 待定 待定 16, 384 19, 456 19, 456 14, 080
GPU 時脈頻率(最大值) 待定 待定 2400 MHz 2100 MHz 2100 MHz 1700 MHz
INT8 計算 待定 待定 5200 TOPS 2614 頂級 2614 頂級 383 TOPs
FP6/FP4矩陣 待定 40 PFLOPS 20 PFLOPS 不適用 不適用 不適用
FP8矩陣 待定 20 PFLOPS 5 PFLOPS 2.6 浮點運算/秒 2.6 浮點運算/秒 不適用
FP16矩陣 待定 10 PFLOPS 2.5 浮點運算/秒 1.3 浮點運算/秒 1.3 浮點運算/秒 383 兆次浮點運算
FP32 向量 待定 待定 157.3 兆次浮點運算 163.4 兆次浮點運算 163.4 兆次浮點運算 95.7 兆次浮點運算
FP64 向量 待定 待定 78.6 兆次浮點運算 81.7 兆次浮點運算 81.7 兆次浮點運算 47.9 兆次浮點運算
顯存 待定 432GB HBM4 288 GB HBM3e 256 GB HBM3e 192GB HBM3 128 GB HBM2e
無限緩存 待定 待定 256 MB 256 MB 256 MB 不適用
記憶體時鐘 待定 19.6 TB/s 8.0 Gbps 5.9 Gbps 5.2 Gbps 3.2 Gbps
記憶體總線 待定 待定 8192 位 8192 位 8192 位 8192 位
記憶體頻寬 待定 待定 8TB/秒 6.0 TB/s 5.3 TB/s 3.2 TB/s
外形尺寸 待定 待定 OAM OAM OAM OAM
冷卻 待定 待定 被動式/液體 被動冷卻 被動冷卻 被動冷卻
TDP(最大值) 待定 待定 1400瓦(355倍) 1000瓦 750瓦 560瓦

圖片來源及圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *