
NVIDIA 因推出一系列突破性的 AI GPU(稱為 Rubin CPX AI 晶片)而成為頭條新聞,該晶片旨在在機架規模集群配置中使用時提供卓越的推理能力。
NVIDIA Rubin CPX GPU:機架規模 AI 效能的新基準
NVIDIA 意識到 AI 推理在運算進步中日益重要的地位,攜其「CFX」系列開啟全新旅程。首款產品 Rubin 系列已在AI 基礎設施高峰會上亮相。 Rubin CPX GPU 主要定位於長情境 AI 應用,旨在補充現有的 Rubin GPU 和 Vera CPU,預示著 NVIDIA 所稱的 AI 推理效率的「革命」。
Rubin CPX 擁有令人印象深刻的規格,包括 30 petaFLOP 的 NVFP4 運算能力和 128 GB 的先進 GDDR7 記憶體。它將整合到專門設計的 NVIDIA Vera Rubin NVL144 CPX 機架中,該機架將容納 144 個 Rubin CPX GPU、144 個 Rubin GPU 和 36 個 Vera CPU,共同實現驚人的 8 exaFLOP 的 NVFP4 運算能力。這比 Blackwell Ultra 系統的效能提升了 7.5 倍,旨在透過 Spectrum-X 乙太網路等創新技術,以更高的效能處理一百萬個代幣的上下文 AI 推理工作負載。

該平台預計將帶來“30 倍至 50 倍的顯著投資回報率”,將 Vera Rubin NVL144 CPX 機架定位為克服當前開發下一代生成式 AI 應用所面臨限制的重要工具。雖然 Rubin CPX 預計將推出更多配置,但具體細節尚未披露。然而,它整合了 GDDR7 記憶體而非 HBM,為許多用戶提供了更具成本效益的解決方案。
NVIDIA 正嫻熟地駕馭 AI 領域的複雜局面,有效地將競爭對手獲得優勢的機會降至最低。即將於明年發布的下一代 Rubin AI 產品線,預計將運算能力提升到前所未有的高度。
發佈留言