NVIDIA ConnectX-8: PCIe G6と800GbEの速度を備えたBlackwellシステム向けSuperNIC

NVIDIA ConnectX-8: PCIe G6と800GbEの速度を備えたBlackwellシステム向けSuperNIC

NVIDIAは、Blackwellシステム専用に設計された革新的なConnectX-8ネットワークインターフェースカード(NIC)を発表しました。この先進的な技術は極めて先進的であるため、NVIDIAはこれを「SuperNIC」と名付けました。

NVIDIA の Blackwell Systems 向け ConnectX-8 SuperNIC を発表

NVIDIAは最新リリースにおいて、AIトレーニングと推論ワークロードの異なるニーズを強調しています。推論タスクは分散型でレイテンシの影響を受けやすく、外部システムとの広範なやり取りを必要とするのに対し、トレーニングワークロードは同期型で長時間を要し、テールレイテンシの影響を受けやすいものの、外部との通信は少なくなります。

代替可能なネットワーク ポリシーを使用した AI トレーニングと推論の効率を示します。

パフォーマンスが大幅に強化された ConnectX-8 NIC は、Spectrum-X Ethernet と Quantum-X Infiniband の両方のテクノロジと互換性があり、SuperNIC としての機能をさらに強化します。

ConnectX-8 800G SuperNIC: AI、RDMA、信頼性、セキュリティ、統合のための高度なネットワーク。

ConnectX-8 SuperNICの主な機能

ConnectX-8 の注目すべき機能は次のとおりです。

  • 数百万のGPUに活用される堅牢なRDMAテクノロジー
  • AIワークロード向けにカスタマイズされた最大800G RDMAハードウェアパイプラインの容量
  • 組み込みの負荷分散、輻輳管理、信頼性プロトコル
  • AIアプリケーションの汎用性を高める高度なデータパスプログラマビリティ
  • システムアーキテクチャとのシームレスな統合
  • エンタープライズグレードのセキュリティ強化
ConnectX-8 SuperNIC の概要と主な機能。

仕様概要

ConnectX-8 SuperNICは、Verbs、NCCL、NIXL、DOCA APIなどの業界標準との互換性を誇ります。800GbpsのInfiniband XDRソリューション、または最大8ポートを備えたデュアル400Gイーサネットインターフェースを提供します。オンボードPCIeスイッチを介して、48レーンのPCIe Gen6インターフェースを統合できます。

800G での ConnectX-8 RDMA スケーリング パフォーマンスのグラフ。

NVIDIAは、ConnectX-8のRDMA機能は、64KBから1MBまでの様々なメッセージサイズにおいて、画期的な800Gの速度で無限のスケーラビリティを提供すると発表しています。これにより、SuperNICはGPUを他のクラスターとシームレスに相互接続するASICとして機能します。

従来のデータセンターのコンポーネント図。

ConnectX-8 NICは、まず、新しいBlackwell Ultra GPUを搭載したNVIDIAの先進的なBlackwell GB300 NVL72システムに導入されます。導入されたCX8 PCIeスイッチは、NVLINKアーキテクチャ全体で帯域幅の利用を最適化します。

ConnectX-8 PCIe スイッチの図。

各 CX8 PCIe スイッチには、Grace CPU 用の Gen5 x16 レーン、Blackwell Ultra GPU 用に構成された Gen6 x16 レーン、および SSD 用の PCIe Gen5 x4 レーンが組み込まれています。

ConnectX データ センターの図。

GPU構成間のスケーラビリティ

NVIDIA は、ConnectX-8 が最大 64 個の GPU 構成にわたって優れたスケーリング機能を実現する方法を示しました。

NVIDIA による ConnectX-8 GPU スケール統合の図。

AIのスケーラビリティが最重要視される時代において、NVIDIAのConnectX-8統合型Spectrum-Xイーサネットスイッチは、既存のSpectrum-Xイーサネットフレームワークの機能を拡張する強力なソリューションとして登場します。このシステムは、AIワークロードに不可欠な高度な負荷分散機能と輻輳制御機能を提供し、ConnectX-8パケットプロセッサはAI環境のセキュリティとルーティング機能を強化します。

スケーラブルな AI のための ConnectX-8 スイッチ。
ConnectX-8 RDMA は AI ネットワーキング ソリューションを紹介します。
ConnectX-8 パケット プロセッサの図。
ConnectX-8 データ パス アクセラレータの図。
AI ワークロード向けの Spectrum-X Ethernet 機能。
ハードウェアでの ConnectX-8 輻輳制御。

ConnectX-8には、ネットワークが最高効率で動作するように設計された16T RISC-Vイベントプロセッサであるデータパスアクセラレータが搭載されています。NVIDIAは、Spectrum-X Ethernetテクノロジーが従来のRDMA NICおよびスイッチと比較して、トレーニングステップ時間を60%短縮し、テールレイテンシを大幅に削減できると自負しています。

Spectrum-X Ethernet トレーニング ステップ時間を比較したグラフ。
Spectrum-X Ethernet のテール レイテンシ パフォーマンスを示すグラフ。

パフォーマンスメトリック

NVIDIA の Spectrum-X パフォーマンスに関する最新データには、次のような印象的な指標が含まれています。

  • 負荷分散により実効帯域幅が1.6倍に増加
  • 1.3倍の帯域幅拡張によりテールレイテンシが低下
  • ノイズアイソレーションの全帯域を2.2倍に拡大
  • 全帯域を1.3倍に向上し、回復力を確保
  • 高頻度のニーズに応えるテレメトリ収集の1000倍高速化
Spectrum-X パフォーマンス メトリックの視覚化。

画期的な800GパフォーマンスとPCIe Gen6のサポートを備えたNVIDIAのSpectrum-XとConnectX-8 SuperNICは、Blackwellシステムのネットワーク環境に革命をもたらすでしょう。今後数ヶ月以内に、さらなる詳細と開発の進捗状況をお知らせいたします。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です