NVIDIA 推出配备 128 GB GDDR7 内存的“Rubin CPX”AI GPU,适用于高价值推理任务

NVIDIA 推出配备 128 GB GDDR7 内存的“Rubin CPX”AI GPU,适用于高价值推理任务

NVIDIA 因推出一系列突破性的 AI GPU(称为 Rubin CPX AI 芯片)而成为头条新闻,该芯片旨在在机架规模集群配置中使用时提供卓越的推理能力。

NVIDIA Rubin CPX GPU:机架规模 AI 性能的新基准

NVIDIA 意识到 AI 推理在计算进步中日益重要的地位,携其“CFX”系列开启全新征程。首款产品 Rubin 系列已在AI 基础设施峰会上亮相。Rubin CPX GPU 主要定位于长上下文 AI 应用,旨在补充现有的 Rubin GPU 和 Vera CPU,预示着 NVIDIA 所称的 AI 推理效率的“革命”。

Rubin CPX 拥有令人印象深刻的规格,包括 30 petaFLOP 的 NVFP4 计算能力和 128 GB 的先进 GDDR7 内存。它将集成到专门设计的 NVIDIA Vera Rubin NVL144 CPX 机架中,该机架将容纳 144 个 Rubin CPX GPU、144 个 Rubin GPU 和 36 个 Vera CPU,共同实现惊人的 8 exaFLOP 的 NVFP4 计算能力。这比 Blackwell Ultra 系统的性能提升了 7.5 倍,旨在通过 Spectrum-X 以太网等创新技术,以更高的性能处理一百万个令牌的上下文 AI 推理工作负载。

Vera Rubin NVL144 CPX 计算托盘,黑色背景上带有 Rubin、Vera、Rubin CPX、ConnectX-9 标签。

该平台预计将带来“30 倍至 50 倍的显著投资回报率”,将 Vera Rubin NVL144 CPX 机架定位为克服当前开发下一代生成式 AI 应用所面临限制的重要工具。虽然 Rubin CPX 预计将推出更多配置,但具体细节尚未披露。然而,它集成了 GDDR7 内存而非 HBM,为许多用户提供了一种更具成本效益的解决方案。

NVIDIA 正娴熟地驾驭 AI 领域的复杂局面,有效地将竞争对手获得优势的机会降至最低。即将于明年发布的下一代 Rubin AI 产品线,有望将计算能力提升到前所未有的高度。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注