AMD 推出首款「UEC-Ready」 Pensando Pollara 400 AI NIC，實現 400GbE 速度

AMD 推出首款「UEC-Ready」 Pensando Pollara 400 AI NIC，實現 400GbE 速度

AMD 最近在 Hot Chips 2025 上發布了其創新的Pensando Pollara 400 AI NIC，標誌著業界推出了首款支援超級乙太網路聯盟 (UEC) 的 AI 網路介面卡 (NIC)。

AMD 推出 400GbE Pensando Pollara 400 AI NIC，效能提升 25%

在先前研發的基礎上，AMD 去年展示了Pensando Pollara 400。這款專為 AI 系統設計的先進網卡 (NIC) 擁有高達 400 Gbps 的驚人頻寬，與 NVIDIA 的 ConnectX-7 形成直接競爭。此外，NVIDIA 還推出了更先進的 ConnectX-8，其最新的 Blackwell Ultra 系統可提供令人印象深刻的 800GbE 速度。

AMD Pensando Pollara 400 AI NIC；業界首款超級乙太網路 AI NIC，速度達 400 Gbps。

Pensando Pollara 400 配備了多項尖端功能：

可程式硬體管線
效能提升高達 1.25 倍
400 Gbps 吞吐量
開放生態系相容性
UEC Ready RDMA 功能
縮短作業完成時間
卓越的可用性

具有 Infinity Fabric 和 PCIe 交換器連接的 AMD Instinct 系統架構圖。

Pensando 網路解決方案的架構與 AMD 現有的資料中心架構緊密結合，特別是 EPYC 和 Instinct 系列，它們利用 PCIe 交換器有效連接 NIC 和 CPU。

AMD 透過 CPU、GPU 和網路硬體推進資料中心解決方案。

重要的是，Pensando NIC 無需 PCIe 交換器即可運行，並直接與 Gen5 x16 連接。底層架構如下圖所示：

框圖顯示了帶有 NOC 互連和 P4DMA 組件的 AMD Pensando NIC 架構。

透過利用 P4 架構，Pensando Pollara 400 AI NIC 實現了卓越的效率。

AMD Pensando P4 架構圖顯示了封包處理和記憶體流路徑。

此架構的重要元件包括表引擎（TE），負責從包頭向量產生表鍵，以及根據資料類型執行特定的記憶體讀取。

P4 管道組件圖表突顯了表格引擎金鑰產生和記憶體存取。

該設計還具有匹配處理單元 (MPU)，這是一種利用優化的操作碼進行現場操作的專用處理器，可實現不同的記憶體、表格和 PHV 介面。

P4 管道組件圖顯示了匹配處理單元和介面。

此外，虛擬位址到實體位址 (va2pa) 轉換功能等創新進一步提高了系統效能。

計算架構中虛擬到實體位址轉換過程的流程圖。

在原子記憶體操作方面，AMD 已將其實現在 SRAM 系統相鄰的位置，以提高效率。

AMD 在原子操作方面的增強概述，為 SRAM 記憶體帶來了好處。

管道快取一致性採用無效/更新邏輯，確保 P4 一致性在位址範圍基礎上有效運作。

帶有無效/更新邏輯解釋的管道快取一致性增強圖。

AMD 發現了一些影響 AI 系統在橫向擴展網路中效能的挑戰。諸如與 ECMP 負載平衡相關的鏈路利用率低、網路擁塞和資料包遺失等問題阻礙了整體效率。

AI 橫向擴展網路：系統效能挑戰以及擁塞和資料包遺失等網路問題。

該公司也強調，與通用網路相比，人工智慧網路的使用率明顯更高，通常會突破網路頻寬可用性的極限。

高網路利用率：AI後端網路以95%的使用率驅動資料傳輸。

AMD 提出的超級乙太網路聯盟 (UEC) 是克服這些障礙的重要解決方案。 UEC 建構了一個開放、可互通的高效能框架，旨在滿足大規模 AI 和高效能運算 (HPC) 應用所需的網路需求。

超級乙太網路聯盟：滿足 AI 和 HPC 需求的開放、可擴展、經濟高效的乙太網路。

UEC 的設計注重效率和經濟性，旨在滿足現代數據網路日益增長的巨大需求。

AMD Pensando Pollara 400 AI NIC 具有 RDMA、UEC AI 傳輸、擁塞控制、快速恢復功能。

UEC 的其他優點包括增強的路由技術和網路管理解決方案，旨在解決與擁塞和封包遺失相關的問題。

Pollara RDMA 與 RoCEv2 RPC 效能圖表，突顯網路效率的提升。

綜上所述，AMD 的 Pensando Pollara 400 AI UEC-ready RDMA NIC 與具有 4 個 Qpair 的 RoCEv2 相比性能提升了 25%，與具有 1 個 Qpair 的 RoCEv2 相比性能顯著提升了 40%，鞏固了其在網路技術領域的領先地位。

來源和圖片

相關文章:

AMD Instinct MI350 GPU：以 3nm 3D 小晶片、CDNA 4 架構、1850 億個電晶體、1400W TBP 和 288GB 記憶體釋放 AI 威力，支援超過 4000B LLM

AMD 與 IBM 合作開發以量子為中心的超級運算：開創運算新時代

發佈留言取消回覆