NVIDIA ConnectX-8:專為 Blackwell Systems 打造的超級網路卡,配備 PCIe G6 和 800GbE 速度

NVIDIA ConnectX-8:專為 Blackwell Systems 打造的超級網路卡,配備 PCIe G6 和 800GbE 速度

NVIDIA 發布了其革命性的 ConnectX-8 網路介面卡 (NIC),專為 Blackwell 系統設計。這項先進技術堪稱尖端,NVIDIA 稱之為「超級網卡 (SuperNIC )」 。

NVIDIA 為 Blackwell Systems 推出 ConnectX-8 SuperNIC

NVIDIA在其最新版本中強調了AI訓練和推理工作負載的不同需求。推理任務的特徵是其分散性且對延遲敏感,需要與外部系統進行大量互動;而訓練工作負載則需要同步、耗時且對尾延遲敏感,但涉及的外部通訊較少。

展示了可替代網路策略的人工智慧訓練和推理效率。

ConnectX-8 NIC 的性能得到了顯著增強,相容於 Spectrum-X 乙太網路和 Quantum-X Infiniband 技術,進一步鞏固了其作為 SuperNIC 的能力。

ConnectX-8 800G SuperNIC:用於 AI、RDMA、可靠性、安全性和整合的進階網路。

ConnectX-8 SuperNIC 的主要功能

ConnectX-8 的顯著特徵包括:

  • 強大的 RDMA 技術充分利用了數百萬個 GPU
  • 專為 AI 工作負載量身定制的高達 800G RDMA 硬體管道容量
  • 內建負載平衡、擁塞管理和可靠性協議
  • 先進的資料路徑可程式性,可實現人工智慧應用的多功能性
  • 與系統架構無縫集成
  • 企業級安全增強
ConnectX-8 SuperNIC 概述突出特點。

規格概述

ConnectX-8 SuperNIC 相容於 Verbs、NCCL、NIXL 和 DOCA API 等業界標準。它提供 800 Gb/s Infiniband XDR 解決方案或雙 400G 乙太網路接口,最多配備八個端口。透過板載 PCIe 交換機,可整合 48 個通道的 PCIe Gen6 介面。

ConnectX-8 RDMA 在 800G 下的擴展效能圖表。

NVIDIA 聲稱,ConnectX-8 的 RDMA 功能能夠以突破性的 800G 速度提供無限的可擴展性,支援從 64 KB 到 1 MB 的各種訊息大小。這使得 SuperNIC 能夠充當 ASIC,將 GPU 與其他叢集無縫互連。

傳統資料中心組件圖。

ConnectX-8 NIC 最初將部署在 NVIDIA 先進的 Blackwell GB300 NVL72 系統中,該系統配備全新的 Blackwell Ultra GPU。引進的 CX8 PCIe 交換器可最佳化整個 NVLINK 架構的頻寬利用率。

ConnectX-8 PCIe 交換器圖。

每個 CX8 PCIe 交換器都包含 Grace CPU 的 Gen5 x16 通道和 Blackwell Ultra GPU 的 Gen6 x16 通道,並輔以 SSD 的 PCIe Gen5 x4 通道。

ConnectX 資料中心圖。

跨 GPU 配置的可擴充性

NVIDIA 展示了 ConnectX-8 如何在多達 64 個 GPU 的配置中實現卓越的擴展能力。

NVIDIA ConnectX-8 GPU 規模整合圖。

在 AI 可擴展性至關重要的時代,NVIDIA ConnectX-8 整合式 Spectrum-X 乙太網路交換器應運而生,成為一款強大的解決方案,擴展了現有 Spectrum-X 乙太網路框架的功能。該系統提供對 AI 工作負載至關重要的進階負載平衡和擁塞控制功能,而 ConnectX-8 封包處理器則增強了 AI 環境的安全性和路由功能。

ConnectX-8 交換器可用於可擴展的 AI。
ConnectX-8 RDMA 展示 AI 網路解決方案。
ConnectX-8 封包處理器圖。
ConnectX-8 資料路徑加速器圖。
Spectrum-X 乙太網路功能適用於 AI 工作負載。
硬體中的 ConnectX-8 擁塞控制。

ConnectX-8 整合了資料路徑加速器(Data Path Accelerator),這是一款 16T RISC-V 事件處理器,旨在確保網路以峰值效率運作。 NVIDIA 宣稱,與傳統的 RDMA 網路卡和交換器相比,Spectrum-X 乙太網路技術可將訓練步驟時間縮短 60%,並顯著降低尾部延遲。

圖表比較了 Spectrum-X 乙太網路訓練步驟時間。
圖表描繪了 Spectrum-X 乙太網路的尾部延遲性能。

績效指標

NVIDIA 近期發布的 Spectrum-X 效能數據包括以下令人印象深刻的指標:

  • 負載平衡使有效頻寬增加 1.6 倍
  • 1.3 倍增強集體頻寬影響尾部延遲
  • 噪音隔離頻寬提升 2.2 倍
  • 整體頻寬提升 1.3 倍,確保彈性
  • 滿足高頻需求的遙測收集速度提高 1000 倍
Spectrum-X 效能指標視覺化。

NVIDIA Spectrum-X 和 ConnectX-8 SuperNIC 擁有突破性的 800G 效能,並支援 PCIe Gen6,勢必將徹底改變 Blackwell 系統的網路格局。更多細節和進展預計將在未來幾個月公佈。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *