NVIDIA 推出配備 128 GB GDDR7 記憶體的「Rubin CPX」AI GPU,適用於高價值推理任務

NVIDIA 推出配備 128 GB GDDR7 記憶體的「Rubin CPX」AI GPU,適用於高價值推理任務

NVIDIA 因推出一系列突破性的 AI GPU(稱為 Rubin CPX AI 晶片)而成為頭條新聞,該晶片旨在在機架規模集群配置中使用時提供卓越的推理能力。

NVIDIA Rubin CPX GPU:機架規模 AI 效能的新基準

NVIDIA 意識到 AI 推理在運算進步中日益重要的地位,攜其「CFX」系列開啟全新旅程。首款產品 Rubin 系列已在AI 基礎設施高峰會上亮相。 Rubin CPX GPU 主要定位於長情境 AI 應用,旨在補充現有的 Rubin GPU 和 Vera CPU,預示著 NVIDIA 所稱的 AI 推理效率的「革命」。

Rubin CPX 擁有令人印象深刻的規格,包括 30 petaFLOP 的 NVFP4 運算能力和 128 GB 的先進 GDDR7 記憶體。它將整合到專門設計的 NVIDIA Vera Rubin NVL144 CPX 機架中,該機架將容納 144 個 Rubin CPX GPU、144 個 Rubin GPU 和 36 個 Vera CPU,共同實現驚人的 8 exaFLOP 的 NVFP4 運算能力。這比 Blackwell Ultra 系統的效能提升了 7.5 倍,旨在透過 Spectrum-X 乙太網路等創新技術,以更高的效能處理一百萬個代幣的上下文 AI 推理工作負載。

Vera Rubin NVL144 CPX 計算托盤,黑色背景上有 Rubin、Vera、Rubin CPX、ConnectX-9 標籤。

該平台預計將帶來“30 倍至 50 倍的顯著投資回報率”,將 Vera Rubin NVL144 CPX 機架定位為克服當前開發下一代生成式 AI 應用所面臨限制的重要工具。雖然 Rubin CPX 預計將推出更多配置,但具體細節尚未披露。然而,它整合了 GDDR7 記憶體而非 HBM,為許多用戶提供了更具成本效益的解決方案。

NVIDIA 正嫻熟地駕馭 AI 領域的複雜局面,有效地將競爭對手獲得優勢的機會降至最低。即將於明年發布的下一代 Rubin AI 產品線,預計將運算能力提升到前所未有的高度。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *