
AMD 正准备推出其 ROCm 7 软件堆栈,旨在打破 NVIDIA 在人工智能领域的主导地位,特别是长期以来将开发人员限制在 NVIDIA 硬件上的紧密结合的 CUDA 生态系统。
AMD ROCm 7 即将在 GitHub 上发布
NVIDIA 在人工智能领域的霸主地位很大程度上归功于其 CUDA 软件堆栈,这是 AI 开发者的一项重要资产,且专属于其专有硬件。这种情况给 AMD 等竞争对手带来了挑战。然而,在最近的 Advancing AI 大会上,AMD 发布了其下一代 ROCm 7.0,该版本承诺提供增强的框架和创新算法,旨在成为 CUDA 的可行替代方案。其发布的准备工作现已正式启动。
据Phoronix报道,AMD 已在 GitHub 上添加 ROCm 7.0 的标签,从而启动了发布流程。此举表明发布即将到来,相关标签(例如ROCm/hip 中的 rocm-7.0.0和ROCm/aomp 中的 rocm-7.0.0)已显示。此举标志着 AMD 的一个重要里程碑,因为该公司正准备推出可能成为“红队”关键更新的版本。

改进后的 ROCm 堆栈主要侧重于推理工作负载。AMD 宣称,与 ROCm 6 相比,其 AI 任务性能提升高达 3.5 倍。值得注意的是,Instinct MI355X 在 DeepSeek R1 测试中实现了 30% 的 FP8 吞吐量提升,超越了 NVIDIA 的 Blackwell B200。ROCm 7.0 的主要升级包括:
- 前沿算法与模型
- AI扩展的增强功能
- 支持 MI350 系列
- 集群管理增强功能
- 先进的企业能力
虽然目前 ROCm 7 尚未确定发布日期,但预计将在未来几周内首次亮相,尤其是当 AMD 将其与新的 AI 硬件公告相结合时。
发表回复