AMD 即將推出 ROCm 7.0 運算堆疊,與 NVIDIA CUDA 生態系統形成強勁競爭

AMD 即將推出 ROCm 7.0 運算堆疊,與 NVIDIA CUDA 生態系統形成強勁競爭

AMD 正準備推出其 ROCm 7 軟體堆棧,旨在打破 NVIDIA 在人工智慧領域的主導地位,特別是長期以來將開發人員限制在 NVIDIA 硬體上的緊密結合的 CUDA 生態系統。

AMD ROCm 7 即將在 GitHub 上發布

NVIDIA 在人工智慧領域的霸主地位很大程度上歸功於其 CUDA 軟體堆疊,這是 AI 開發者的重要資產,且專屬於其專有硬體。這種情況為 AMD 等競爭對手帶來了挑戰。然而,在最近的 Advancing AI 大會上,AMD 發布了其下一代 ROCm 7.0,承諾提供增強的框架和創新演算法,旨在成為 CUDA 的可行替代方案。其發布的準備工作現已正式啟動。

根據Phoronix報導,AMD 已在 GitHub 上新增 ROCm 7.0 的標籤,啟動了發布流程。此舉表明發布即將到來,相關標籤(例如ROCm/hip 中的 rocm-7.0.0ROCm/aomp 中的 rocm-7.0.0)已顯示。此舉標誌著 AMD 的一個重要里程碑,因為該公司正準備推出可能成為「紅隊」關鍵更新的版本。

在比較 Nvidia B200 和 AMD Instinct MI355X 的示範中,「DeepSeek R1 FP8 吞吐量」。
圖片來源:AMD

改進後的 ROCm 堆疊主要專注於推理工作負載。 AMD 宣稱,與 ROCm 6 相比,其 AI 任務效能提升高達 3.5 倍。值得注意的是,Instinct MI355X 在 DeepSeek R1 測試中實現了 30% 的 FP8 吞吐量提升,超越了 NVIDIA 的 Blackwell B200。 ROCm 7.0 的主要升級包括:

  • 前沿演算法與模型
  • AI擴充的增強功能
  • 支援 MI350 系列
  • 叢集管理增強功能
  • 先進的企業能力

雖然目前 ROCm 7 尚未確定發布日期,但預計將在未來幾週內首次亮相,尤其是當 AMD 將其與新的 AI 硬體公告相結合時。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *