AMD 准备在 2026 年推出 MI400 系列加速器“MI455X 和 MI430X”,挑战 NVIDIA 在 AI 领域的领导地位,并计划在 2027 年推出 MI500 系列。

AMD 准备在 2026 年推出 MI400 系列加速器“MI455X 和 MI430X”,挑战 NVIDIA 在 AI 领域的领导地位,并计划在 2027 年推出 MI500 系列。

AMD 即将推出 Instinct MI400 和 MI500 系列显卡,为应对 AI 加速器市场的巨大挑战做好准备,力图与 NVIDIA 目前在该领域的统治地位展开竞争。

揭秘 AMD MI400 系列:2027 年的各种型号和功能特性

在2025年金融分析师日上,AMD展示了即将推出的MI400和MI500系列AI GPU加速器,强调了它们在公司长期AI战略中的作用。这种年度发布周期旨在巩固AMD在AI领域的地位,因为NVIDIA在该领域仍然处于领先地位。

AMD Instinct:数据中心GPU架构路线图,包含MI300至MI500系列规格

MI400系列预计将于明年首次亮相,并承诺带来多项改进:

  • 增强型 HBM4 容量和带宽
  • 更广泛的AI格式支持,吞吐量更高
  • 标准化机架级网络(UALoE、UAL、UEC)

MI400 系列据称可实现 40 PFLOPS (FP4) 和 20 PFLOPS (FP8),有效地使目前流行的 MI350 系列的计算吞吐量翻了一番。

AMD Instinct MI450 系列的主要规格包括“40 PF”、432 GB HBM4 显存和“3.6 TB/s”带宽

此外,MI400系列将采用HBM4显存技术,其显存容量从之前的288GB HBM3e提升至432GB,增幅高达50%。此次升级带来了惊人的19.6TB/s显存带宽,远超MI350系列的8TB/s。该系列每款GPU的横向扩展带宽均达到300GB/s,标志着AMD下一代Instinct产品线的重大飞跃。

对比图表:MI450 系列在机架级性能方面领先于英伟达 Vera Rubin

与NVIDIA的Vera Rubin相比,AMD的Instinct MI400 GPU展现出显著优势:

  • 内存容量是竞争对手的1.5倍
  • 等效内存带宽和浮点运算次数(FP4 / FP8)
  • 横向扩展带宽提升 1.5 倍
AMD Instinct MI400 系列产品组合展示了用于 AI 训练和推理的 MI455X 以及用于高性能计算的 MI430X。

MI400 系列由两个主要型号组成:MI455X,面向可扩展的 AI 训练和推理工作负载;MI430X,专为 HPC 和主权 AI 任务而设计,具备基于硬件的 FP64 功能、混合计算(CPU+GPU),并保留了与其同类产品相同的 HBM4 内存。

AMD Instinct:数据中心GPU架构路线图,从MI300到MI500系列

展望2027年,AMD计划推出Instinct MI500系列显卡,延续其年度产品更新周期。此举旨在快速推进数据中心AI技术的发展,与NVIDIA提供标准版和“Ultra”版显卡的策略相呼应。MI500系列预计将显著提升计算、内存和互连能力,进一步增强AMD在AI领域的竞争优势。

AMD Instinct AI 加速器对比

加速器名称 AMD Instinct MI500 AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU架构 CDNA Next / UDNA CDNA 5 CDNA 4 Aqua Vanjaram(CDNA 3) Aqua Vanjaram(CDNA 3) Aldebaran(CDNA 2)
GPU 处理节点 待定 待定 3纳米 5nm+6nm 5nm+6nm 6纳米
XCD(芯片) 待定 8(MCM) 8(MCM) 8(MCM) 8(MCM) 2(MCM;每模1个)
GPU核心 待定 待定 16, 384 19, 456 19, 456 14, 080
GPU 时钟频率(最大值) 待定 待定 2400 MHz 2100 MHz 2100 MHz 1700 MHz
INT8 计算 待定 待定 5200 TOPS 2614 顶级 2614 顶级 383 TOPs
FP6/FP4矩阵 待定 40 PFLOPS 20 PFLOPS 不适用 不适用 不适用
FP8矩阵 待定 20 PFLOPS 5 PFLOPS 2.6 浮点运算/秒 2.6 浮点运算/秒 不适用
FP16矩阵 待定 10 PFLOPS 2.5 浮点运算/秒 1.3 浮点运算/秒 1.3 浮点运算/秒 383 万亿次浮点运算
FP32 向量 待定 待定 157.3 万亿次浮点运算 163.4 万亿次浮点运算 163.4 万亿次浮点运算 95.7 万亿次浮点运算
FP64 向量 待定 待定 78.6 万亿次浮点运算 81.7 万亿次浮点运算 81.7 万亿次浮点运算 47.9 万亿次浮点运算
显存 待定 432GB HBM4 288 GB HBM3e 256 GB HBM3e 192GB HBM3 128 GB HBM2e
无限缓存 待定 待定 256 MB 256 MB 256 MB 不适用
内存时钟 待定 19.6 TB/s 8.0 Gbps 5.9 Gbps 5.2 Gbps 3.2 Gbps
内存总线 待定 待定 8192 位 8192 位 8192 位 8192 位
内存带宽 待定 待定 8TB/秒 6.0 TB/s 5.3 TB/s 3.2 TB/s
外形尺寸 待定 待定 OAM OAM OAM OAM
冷却 待定 待定 被动式/液体 被动冷却 被动冷却 被动冷却
TDP(最大值) 待定 待定 1400瓦(355倍) 1000瓦 750瓦 560瓦

图片来源及图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注