AMD Instinct MI400 加速器:40 PFLOP 運算能力,432 GB HBM4 內存,19.6 TB/s,將於 2026 年推出

AMD Instinct MI400 加速器:40 PFLOP 運算能力,432 GB HBM4 內存,19.6 TB/s,將於 2026 年推出

除了最近推出的 MI350 系列之外,AMD 還提供了即將推出的下一代 Instinct MI400 系列的令人興奮的預覽,該系列將於 2026 年首次亮相。

突顯 AMD Instinct MI400 的卓越功能

AMD 的 Instinct MI400 加速器似乎顯著增強了其硬體功能,其運算效能幾乎是 MI350 系列的兩倍。官方規格表明,MI400 將為FP4 運算提供令人印象深刻的40 PFLOP ,為 FP8 計算提供20 PFLOP,與當代 MI350 系列相比,計算能力實際上翻了一番。

此外,AMD 正在利用 HBM4 記憶體技術的優勢,打造 MI400 系列。新一代產品記憶體容量將提升 50%,從288GB HBM3e提升至432GB HBM4。 HBM4標準帶來了驚人的19.6 TB/s 頻寬,是MI350 系列8 TB/s頻寬的兩倍多。此外,每個 GPU 將支援300 GB/s 的橫向擴展頻寬,這預示著下一代 Instinct 加速器的效能將大幅提升。

在先前的公告中,Instinct MI400 加速器的細節已揭露其整合多達四個加速運算晶片 (XCD),這比 MI300 型號使用的兩個 XCD 有了顯著提升。值得注意的是,MI400 將包含兩個主動中介層晶片 (AID),並將多媒體晶片I/O 晶片分離,從而增強整體功能和效率。

MI400補丁
圖片來源:FreeDesktop.org

每個 AID 都將配備專用的MID Tile,確保計算單元和 I/O 介面之間的通訊流暢,這比前幾代產品有所改進。 MI350 系列已採用 Infinity Fabric 進行晶片間通信,因此我們可以預期 MI400 的架構將取得更大的進步。

瞄準大規模人工智慧任務

MI400 系列旨在滿足日益增長的大規模 AI 訓練和推理任務的需求,利用新的 CDNA-Next 架構,該架構可能會更名為 UDNA,以統一 AMD 的 RDNA 和 CDNA 架構。

AMD Instinct AI 加速器比較

加速器名稱 AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU架構 CDNA Next/UDNA 互補DNA 4 Aqua Vanjaram(CDNA 3) Aqua Vanjaram(CDNA 3) 畢宿五(CDNA 2)
GPU 處理節點 待定 3奈米 5奈米+6奈米 5奈米+6奈米 6奈米
XCD(小晶片) 8(MCM) 8(MCM) 8(MCM) 8(MCM) 2 (MCM),1 (每個晶片)
GPU核心 待定 待定 19, 456 19, 456 14, 080
GPU 時脈速度 待定 待定 2100兆赫 2100兆赫 1700兆赫
INT8 計算 待定 待定 2614 件 2614 件 383 TOP
FP6/FP4 計算 待定 20 PFLOP 不適用 不適用 不適用
FP8 計算 待定 10 PFLOP 2.6 PFLOPs 2.6 PFLOPs 不適用
FP16 計算 待定 5 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOP
FP32 計算 待定 待定 163.4 TFLOP 163.4 TFLOP 95.7 TFLOP
FP64 計算 待定 79 TFLOP 81.7 TFLOP 81.7 TFLOP 47.9 TFLOP
顯存 待定 288 HBM3e 256 GB HBM3e 192GB HBM3 128 GB HBM2e
無限緩存 待定 待定 256 MB 256 MB 不適用
記憶體時鐘 待定 8.0 Gbps 5.9 Gbps 5.2 Gbps 3.2 Gbps
記憶體總線 待定 8192位 8192位 8192位 8192位
記憶體頻寬 待定 8TB/秒 6.0 TB/秒 5.3 TB/秒 3.2 TB/秒
外形尺寸 待定 營運管理 營運管理 營運管理 營運管理
冷卻 待定 被動冷卻 被動冷卻 被動冷卻 被動冷卻
TDP(最大) 待定 1400瓦(355X) 1000瓦 750瓦 560瓦

如需了解更多深入資訊和見解,請造訪有關 AMD 即將推出的創新的完整文章。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *