
NVIDIA 因推出一系列突破性的 AI GPU(称为 Rubin CPX AI 芯片)而成为头条新闻,该芯片旨在在机架规模集群配置中使用时提供卓越的推理能力。
NVIDIA Rubin CPX GPU:机架规模 AI 性能的新基准
NVIDIA 意识到 AI 推理在计算进步中日益重要的地位,携其“CFX”系列开启全新征程。首款产品 Rubin 系列已在AI 基础设施峰会上亮相。Rubin CPX GPU 主要定位于长上下文 AI 应用,旨在补充现有的 Rubin GPU 和 Vera CPU,预示着 NVIDIA 所称的 AI 推理效率的“革命”。
Rubin CPX 拥有令人印象深刻的规格,包括 30 petaFLOP 的 NVFP4 计算能力和 128 GB 的先进 GDDR7 内存。它将集成到专门设计的 NVIDIA Vera Rubin NVL144 CPX 机架中,该机架将容纳 144 个 Rubin CPX GPU、144 个 Rubin GPU 和 36 个 Vera CPU,共同实现惊人的 8 exaFLOP 的 NVFP4 计算能力。这比 Blackwell Ultra 系统的性能提升了 7.5 倍,旨在通过 Spectrum-X 以太网等创新技术,以更高的性能处理一百万个令牌的上下文 AI 推理工作负载。

该平台预计将带来“30 倍至 50 倍的显著投资回报率”,将 Vera Rubin NVL144 CPX 机架定位为克服当前开发下一代生成式 AI 应用所面临限制的重要工具。虽然 Rubin CPX 预计将推出更多配置,但具体细节尚未披露。然而,它集成了 GDDR7 内存而非 HBM,为许多用户提供了一种更具成本效益的解决方案。
NVIDIA 正娴熟地驾驭 AI 领域的复杂局面,有效地将竞争对手获得优势的机会降至最低。即将于明年发布的下一代 Rubin AI 产品线,有望将计算能力提升到前所未有的高度。
发表回复