AMD 即将推出 ROCm 7.0 计算堆栈,与 NVIDIA CUDA 生态系统形成强劲竞争

AMD 即将推出 ROCm 7.0 计算堆栈,与 NVIDIA CUDA 生态系统形成强劲竞争

AMD 正准备推出其 ROCm 7 软件堆栈,旨在打破 NVIDIA 在人工智能领域的主导地位,特别是长期以来将开发人员限制在 NVIDIA 硬件上的紧密结合的 CUDA 生态系统。

AMD ROCm 7 即将在 GitHub 上发布

NVIDIA 在人工智能领域的霸主地位很大程度上归功于其 CUDA 软件堆栈,这是 AI 开发者的一项重要资产,且专属于其专有硬件。这种情况给 AMD 等竞争对手带来了挑战。然而,在最近的 Advancing AI 大会上,AMD 发布了其下一代 ROCm 7.0,该版本承诺提供增强的框架和创新算法,旨在成为 CUDA 的可行替代方案。其发布的准备工作现已正式启动。

据Phoronix报道,AMD 已在 GitHub 上添加 ROCm 7.0 的标签,从而启动了发布流程。此举表明发布即将到来,相关标签(例如ROCm/hip 中的 rocm-7.0.0ROCm/aomp 中的 rocm-7.0.0)已显示。此举标志着 AMD 的一个重要里程碑,因为该公司正准备推出可能成为“红队”关键更新的版本。

在比较 Nvidia B200 和 AMD Instinct MI355X 的演示中,“DeepSeek R1 FP8 吞吐量”。
图片来源:AMD

改进后的 ROCm 堆栈主要侧重于推理工作负载。AMD 宣称,与 ROCm 6 相比,其 AI 任务性能提升高达 3.5 倍。值得注意的是,Instinct MI355X 在 DeepSeek R1 测试中实现了 30% 的 FP8 吞吐量提升,超越了 NVIDIA 的 Blackwell B200。ROCm 7.0 的主要升级包括:

  • 前沿算法与模型
  • AI扩展的增强功能
  • 支持 MI350 系列
  • 集群管理增强功能
  • 先进的企业能力

虽然目前 ROCm 7 尚未确定发布日期,但预计将在未来几周内首次亮相,尤其是当 AMD 将其与新的 AI 硬件公告相结合时。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注