AMD、初の「UEC対応」Pensando Pollara 400 AI NICを発表、400GbEの速度を実現

AMD は最近、Hot Chips 2025 で革新的なPensando Pollara 400 AI NIC を発表し、業界初の Ultra Ethernet Consortium (UEC) 対応 AI ネットワークインターフェイスカード (NIC) を導入しました。

AMD、400GbE Pensando Pollara 400 AI NICでパフォーマンスを25%向上

AMDは昨年、これまでの開発成果を基にPensando Pollara 400を発表しました。AIシステム向けに特別に設計されたこの最先端のNICは、驚異的な400Gbpsの帯域幅を誇り、NVIDIAのConnectX-7と直接競合します。しかし、NVIDIAはより高度なConnectX-8もリリースしており、最新のBlackwell Ultraシステムで800GbEという驚異的な速度を実現しています。

AMD Pensando Pollara 400 AI NIC。業界初の Ultra Ethernet AI NIC、速度 400 Gbps。

Pensando Pollara 400 には、次のような最先端機能が搭載されています。

プログラム可能なハードウェアパイプライン
最大1.25倍のパフォーマンス向上
400 Gbpsのスループット
オープンエコシステムの互換性
UEC対応RDMA機能
作業完了時間の短縮
優れた可用性

Infinity Fabric と PCIe スイッチ接続を備えた AMD Instinct システムアーキテクチャの図。

Pensando Networking ソリューションのアーキテクチャは、AMD の既存のデータセンターアーキテクチャ、特に PCIe スイッチを使用して NIC と CPU を効率的に接続する EPYC および Instinct ファミリと密接に連携しています。

AMD は、CPU、GPU、ネットワークハードウェアを使用してデータセンターソリューションを推進しています。

重要なのは、Pensando NICはPCIeスイッチなしで動作し、Gen5 x16接続と直接インターフェースすることです。基盤となるアーキテクチャの概要は次の図に示されています。

NOC 相互接続と P4DMA コンポーネントを備えた AMD Pensando NIC アーキテクチャを示すブロック図。

P4 アーキテクチャの活用により、Pensando Pollara 400 AI NIC は優れた効率を実現します。

パケット処理とメモリフローパスを示す AMD Pensando P4 アーキテクチャ図。

アーキテクチャの重要なコンポーネントには、パッケージヘッダーベクトルからテーブルキーを生成する役割と、データ型に基づいて特定のメモリ読み取りを実行する役割を持つテーブルエンジン (TE) が含まれます。

テーブルエンジンキー生成とメモリアクセスを強調した P4 パイプラインコンポーネントの図。

この設計には、フィールド操作用に最適化されたオペコードを使用して個別のメモリ、テーブル、および PHV インターフェイスを容易にする専用プロセッサである Match Processing Unit (MPU) も搭載されています。

マッチ処理ユニットとインターフェースを示す P4 パイプラインコンポーネントの図。

さらに、仮想アドレスから物理アドレス (va2pa) への変換機能などの革新的な技術により、システムパフォーマンスがさらに向上します。

コンピューティングアーキテクチャにおける仮想アドレスから物理アドレスへの変換プロセスのフローチャート。

アトミックメモリ操作に関しては、AMD は効率性を高めるために SRAM システムに隣接して実装しました。

SRAM メモリの利点を備えたアトミック操作の概要における AMD の機能強化。

パイプラインキャッシュコヒーレンシは無効化/更新ロジックを採用し、P4 コヒーレンシがアドレス範囲ベースで効果的に動作することを保証します。

AMDは、スケールアウトネットワーク全体におけるAIシステムのパフォーマンスに影響を与えるいくつかの課題を特定しています。ECMPロードバランシングに関連する非効率的なリンク利用、ネットワーク輻輳、パケットロスといった問題は、全体的な効率性を阻害します。

AI スケールアウトネットワーク: システムパフォーマンスの課題と、輻輳やパケット損失などのネットワークの問題。

同社はまた、AI ネットワークでは汎用ネットワークに比べて利用率が大幅に高く、ネットワーク帯域幅の可用性の限界に達することが多いと指摘しています。

高いネットワーク使用率: AI バックエンドネットワークは 95% の使用率でデータ転送を実現します。

AMDは、これらの障害を克服するための重要なソリューションとして、Ultra Ethernet Consortium（UEC）を提案しています。UECは、大規模なAIおよびハイパフォーマンスコンピューティング（HPC）アプリケーションに不可欠なネットワーク要件に対応するために設計された、オープンで相互運用性のある高性能フレームワークを推進しています。

Ultra Ethernet Consortium: AI および HPC の需要に応える、オープンでスケーラブル、コスト効率に優れたイーサネット。

UEC は効率性と経済性を重視して設計されており、現代のデータネットワークにますます求められる大きな需要を満たすことを目指しています。

RDMA、UEC AI トランスポート、輻輳制御、高速回復機能を備えた AMD Pensando Pollara 400 AI NIC。

UEC のその他の利点としては、輻輳やパケット損失に関連する問題に対処するために設計された強化されたルーティング技術とネットワーク管理ソリューションなどがあります。

Pollara RDMA と RoCEv2 RPC のパフォーマンスチャート。ネットワーク効率の向上を強調表示しています。

要約すると、AMD の Pensando Pollara 400 AI UEC 対応 RDMA NIC は、4 Qpair の RoCEv2 と比較して 25% のパフォーマンス向上を示し、1 Qpair の RoCEv2 と比較して 40% の顕著な増加を示し、ネットワークテクノロジーのリーダーとしての役割を確固たるものにしています。

出典と画像