NVIDIA Rubin CPX GPU：针对超级 AI 应用进行了优化，具有百万令牌编码、GenAI、128 GB GDDR7 内存和 30 PFLOP FP4 性能

NVIDIA 即将发布其最新创新成果 Rubin AI 平台，备受瞩目。该先进系统将搭载 Vera CPU 和尖端的 Rubin CPX 芯片，并配备128 GB 的 GDDR7 显存。

揭开 NVIDIA Rubin AI 平台的面纱：速度与效率的新时代

NVIDIA 持续提升其下一代 Rubin AI 平台的预期，同时也暗示了其Feynman 平台的未来潜力。最近的更新凸显了 Rubin GPU 的创新能力，并强调了 Vera CPU 和全新 ConnectX-9 SuperNIC 等先进技术的集成。

NVIDIA Rubin CPX GPU 适用于大规模环境，具有 128GB GDDR7 内存等功能，将于 2026 年底上市。

NVIDIA 今日宣布推出 NVIDIA Rubin CPX，这是一款专为海量上下文处理打造的全新 GPU。它使 AI 系统能够以突破性的速度和效率处理数百万个令牌的软件编码和生成视频。

Rubin CPX 与全新 NVIDIA Vera Rubin NVL144 CPX 平台中的 NVIDIA Vera CPU 和 Rubin GPU 协同工作。这款集成式 NVIDIA MGX 系统集成了每秒 8 百亿亿次浮点运算的 AI 计算能力，可提供比 NVIDIA GB300 NVL72 系统高出 7.5 倍的 AI 性能，并在单个机架中提供 100TB 的快速内存和每秒 1.7PB 的内存带宽。此外，我们还将为希望重复使用现有 Vera Rubin 144 系统的客户配备专用的 Rubin CPX 计算托盘。

NVIDIA Rubin CPX为长上下文处理提供了最高的性能和代币收益，远远超出了当今系统的设计处理能力。这将使 AI 编码助手从简单的代码生成工具转变为能够理解和优化大型软件项目的复杂系统。

为了处理视频，AI 模型可能需要处理一小时内容中多达 100 万个 token，这突破了传统 GPU 计算的极限。Rubin CPX 将视频解码器和编码器以及长上下文推理处理集成在单个芯片中，为视频搜索和高质量生成视频等长格式应用提供了前所未有的功能。

Rubin CPX GPU 基于 NVIDIA Rubin 架构构建，采用经济高效的单片芯片设计，配备强大的 NVFP4 计算资源，并经过优化，可为 AI 推理任务提供极高的性能和能源效率。

通过 NVIDIA

Rubin系列带来了专为高要求AI应用而设计的全新GPU，包括先进的百万令牌软件编码和新一代人工智能（GenAI）。这些革命性的GPU承诺提供无与伦比的速度和效率。

宣布推出带有 NVIDIA 品牌的 Vera Rubin CPX 双机架解决方案，其突出特点包括 1.7 PB/s 内存和 2026 年上市。

在 Vera Rubin NVL 144 CPX 平台中，NVIDIA 的 Rubin CPX 芯片将与下一代 Vera CPU（继 Grace CPU 之后）协同工作。这款现代化的 MGX 系统旨在提供令人印象深刻的每秒8 百亿亿次浮点运算的 AI 计算能力，比现有的 Grace Blackwell GB300 NVL72 平台提升 7.5 倍。此外，它还将配备 100 TB 的快速内存和高达 1.7 PB 的内存带宽，与之前的系统相比，其注意力性能将有效提升三倍。

NVIDIA Vera Rubin CPX 平台的主要优势

人工智能计算能力提升 7.5 倍（8 Exaflops NVFP4）
带宽提高 3.0 倍（带宽 1.7 PB/s）
内存容量增加 4.0 倍（GDDR7 内存容量为 150 TB）

每个 NVIDIA Rubin CPX GPU 均提供 30 PFLOP 的 NVFP4 AI 计算能力，并可容纳高达 128 GB 的 GDDR7 内存。Rubin CPX 平台选择 GDDR7 而非 HBM 内存，这一点值得关注，体现了 NVIDIA 致力于在不牺牲性能的情况下提供经济高效的解决方案的承诺。此外，这些 GPU 预计将扩展 NVENC 和 NVDNC 功能，从而显著增强 GenAI 任务的视频处理能力。