
AMD 最近在 Hot Chips 2025 上發布了其創新的Pensando Pollara 400 AI NIC,標誌著業界推出了首款支援超級乙太網路聯盟 (UEC) 的 AI 網路介面卡 (NIC)。
AMD 推出 400GbE Pensando Pollara 400 AI NIC,效能提升 25%
在先前研發的基礎上,AMD 去年展示了Pensando Pollara 400。這款專為 AI 系統設計的先進網卡 (NIC) 擁有高達 400 Gbps 的驚人頻寬,與 NVIDIA 的 ConnectX-7 形成直接競爭。此外,NVIDIA 還推出了更先進的 ConnectX-8,其最新的 Blackwell Ultra 系統可提供令人印象深刻的 800GbE 速度。

Pensando Pollara 400 配備了多項尖端功能:
- 可程式硬體管線
- 效能提升高達 1.25 倍
- 400 Gbps 吞吐量
- 開放生態系相容性
- UEC Ready RDMA 功能
- 縮短作業完成時間
- 卓越的可用性

Pensando 網路解決方案的架構與 AMD 現有的資料中心架構緊密結合,特別是 EPYC 和 Instinct 系列,它們利用 PCIe 交換器有效連接 NIC 和 CPU。

重要的是,Pensando NIC 無需 PCIe 交換器即可運行,並直接與 Gen5 x16 連接。底層架構如下圖所示:

透過利用 P4 架構,Pensando Pollara 400 AI NIC 實現了卓越的效率。

此架構的重要元件包括表引擎(TE),負責從包頭向量產生表鍵,以及根據資料類型執行特定的記憶體讀取。

該設計還具有匹配處理單元 (MPU),這是一種利用優化的操作碼進行現場操作的專用處理器,可實現不同的記憶體、表格和 PHV 介面。

此外,虛擬位址到實體位址 (va2pa) 轉換功能等創新進一步提高了系統效能。

在原子記憶體操作方面,AMD 已將其實現在 SRAM 系統相鄰的位置,以提高效率。

管道快取一致性採用無效/更新邏輯,確保 P4 一致性在位址範圍基礎上有效運作。

AMD 發現了一些影響 AI 系統在橫向擴展網路中效能的挑戰。諸如與 ECMP 負載平衡相關的鏈路利用率低、網路擁塞和資料包遺失等問題阻礙了整體效率。

該公司也強調,與通用網路相比,人工智慧網路的使用率明顯更高,通常會突破網路頻寬可用性的極限。

AMD 提出的超級乙太網路聯盟 (UEC) 是克服這些障礙的重要解決方案。 UEC 建構了一個開放、可互通的高效能框架,旨在滿足大規模 AI 和高效能運算 (HPC) 應用所需的網路需求。

UEC 的設計注重效率和經濟性,旨在滿足現代數據網路日益增長的巨大需求。

UEC 的其他優點包括增強的路由技術和網路管理解決方案,旨在解決與擁塞和封包遺失相關的問題。

綜上所述,AMD 的 Pensando Pollara 400 AI UEC-ready RDMA NIC 與具有 4 個 Qpair 的 RoCEv2 相比性能提升了 25%,與具有 1 個 Qpair 的 RoCEv2 相比性能顯著提升了 40%,鞏固了其在網路技術領域的領先地位。
發佈留言