NVIDIA ConnectX-8:专为 Blackwell Systems 打造的超级网卡,配备 PCIe G6 和 800GbE 速度

NVIDIA ConnectX-8:专为 Blackwell Systems 打造的超级网卡,配备 PCIe G6 和 800GbE 速度

NVIDIA 发布了其革命性的 ConnectX-8 网络接口卡 (NIC),专为 Blackwell 系统设计。这项先进技术堪称尖端,NVIDIA 将其称为“超级网卡 (SuperNIC )” 。

NVIDIA 为 Blackwell Systems 推出 ConnectX-8 SuperNIC

NVIDIA在其最新版本中强调了AI训练和推理工作负载的不同需求。推理任务的特点是其分散性且对延迟敏感,需要与外部系统进行大量交互;而训练工作负载则需要同步、耗时且对尾延迟敏感,但涉及的外部通信较少。

展示了可替代网络策略的人工智能训练和推理效率。

ConnectX-8 NIC 的性能得到了显著增强,兼容 Spectrum-X 以太网和 Quantum-X Infiniband 技术,进一步巩固了其作为 SuperNIC 的能力。

ConnectX-8 800G SuperNIC:用于 AI、RDMA、可靠性、安全性和集成的高级网络。

ConnectX-8 SuperNIC 的主要功能

ConnectX-8 的显著特点包括:

  • 强大的 RDMA 技术充分利用了数百万个 GPU
  • 专为 AI 工作负载量身定制的高达 800G RDMA 硬件管道容量
  • 内置负载平衡、拥塞管理和可靠性协议
  • 先进的数据路径可编程性,可实现人工智能应用的多功能性
  • 与系统架构无缝集成
  • 企业级安全增强
ConnectX-8 SuperNIC 概述突出特点。

规格概述

ConnectX-8 SuperNIC 兼容 Verbs、NCCL、NIXL 和 DOCA API 等行业标准。它提供 800 Gb/s Infiniband XDR 解决方案或双 400G 以太网接口,最多配备八个端口。通过板载 PCIe 交换机,可集成 48 个通道的 PCIe Gen6 接口。

ConnectX-8 RDMA 在 800G 下的扩展性能图表。

NVIDIA 声称,ConnectX-8 的 RDMA 功能能够以突破性的 800G 速度提供无限的可扩展性,支持从 64 KB 到 1 MB 的各种消息大小。这使得 SuperNIC 能够充当 ASIC,将 GPU 与其他集群无缝互连。

传统数据中心组件图。

ConnectX-8 NIC 最初将部署在 NVIDIA 先进的 Blackwell GB300 NVL72 系统中,该系统搭载全新的 Blackwell Ultra GPU。引入的 CX8 PCIe 交换机可优化整个 NVLINK 架构的带宽利用率。

ConnectX-8 PCIe 交换机图。

每个 CX8 PCIe 交换机都包含用于 Grace CPU 的 Gen5 x16 通道和用于 Blackwell Ultra GPU 的 Gen6 x16 通道,并辅以用于 SSD 的 PCIe Gen5 x4 通道。

ConnectX 数据中心图。

跨 GPU 配置的可扩展性

NVIDIA 展示了 ConnectX-8 如何在多达 64 个 GPU 的配置中实现卓越的扩展能力。

NVIDIA ConnectX-8 GPU 规模集成图。

在 AI 可扩展性至关重要的时代,NVIDIA ConnectX-8 集成式 Spectrum-X 以太网交换机应运而生,成为一款强大的解决方案,扩展了现有 Spectrum-X 以太网框架的功能。该系统提供对 AI 工作负载至关重要的高级负载平衡和拥塞控制功能,而 ConnectX-8 数据包处理器则增强了 AI 环境的安全性和路由功能。

ConnectX-8 交换机可用于可扩展的 AI。
ConnectX-8 RDMA 展示 AI 网络解决方案。
ConnectX-8 数据包处理器图。
ConnectX-8 数据路径加速器图。
Spectrum-X 以太网功能适用于 AI 工作负载。
硬件中的 ConnectX-8 拥塞控制。

ConnectX-8 集成了数据路径加速器(Data Path Accelerator),这是一款 16T RISC-V 事件处理器,旨在确保网络以峰值效率运行。NVIDIA 宣称,与传统的 RDMA 网卡和交换机相比,Spectrum-X 以太网技术可将训练步骤时间缩短 60%,并显著降低尾部延迟。

图表比较了 Spectrum-X 以太网训练步骤时间。
图表描绘了 Spectrum-X 以太网的尾部延迟性能。

绩效指标

NVIDIA 近期发布的 Spectrum-X 性能数据包括以下令人印象深刻的指标:

  • 负载平衡使有效带宽增加 1.6 倍
  • 1.3 倍增强集体带宽影响尾部延迟
  • 噪音隔离带宽提升 2.2 倍
  • 整体带宽提升 1.3 倍,确保弹性
  • 满足高频需求的遥测收集速度提高 1000 倍
Spectrum-X 性能指标可视化。

NVIDIA Spectrum-X 和 ConnectX-8 SuperNIC 拥有突破性的 800G 性能,并支持 PCIe Gen6,势必将彻底改变 Blackwell 系统的网络格局。更多细节和进展预计将在未来几个月公布。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注