AMD 推出首款“UEC-Ready” Pensando Pollara 400 AI NIC，实现 400GbE 速度

AMD 推出首款“UEC-Ready” Pensando Pollara 400 AI NIC，实现 400GbE 速度

AMD 最近在 Hot Chips 2025 上发布了其创新的Pensando Pollara 400 AI NIC，标志着业界推出了首款支持超级以太网联盟 (UEC) 的 AI 网络接口卡 (NIC)。

AMD 推出 400GbE Pensando Pollara 400 AI NIC，性能提升 25%

在先前研发的基础上，AMD 去年展示了Pensando Pollara 400。这款专为 AI 系统设计的先进网卡 (NIC) 拥有高达 400 Gbps 的惊人带宽，与 NVIDIA 的 ConnectX-7 形成直接竞争。此外，NVIDIA 还推出了更先进的 ConnectX-8，其最新的 Blackwell Ultra 系统可提供令人印象深刻的 800GbE 速度。

AMD Pensando Pollara 400 AI NIC；业界首款超级以太网 AI NIC，速度达 400 Gbps。

Pensando Pollara 400 配备了多项尖端功能：

可编程硬件流水线
性能提升高达 1.25 倍
400 Gbps 吞吐量
开放生态系统兼容性
UEC Ready RDMA 功能
缩短作业完成时间
卓越的可用性

带有 Infinity Fabric 和 PCIe 交换机连接的 AMD Instinct 系统架构图。

Pensando 网络解决方案的架构与 AMD 现有的数据中心架构紧密结合，特别是 EPYC 和 Instinct 系列，它们利用 PCIe 交换机有效连接 NIC 和 CPU。

AMD 通过 CPU、GPU 和网络硬件推进数据中心解决方案。

重要的是，Pensando NIC 无需 PCIe 交换机即可运行，并直接与 Gen5 x16 连接。底层架构如下图所示：

框图显示了带有 NOC 互连和 P4DMA 组件的 AMD Pensando NIC 架构。

通过利用 P4 架构，Pensando Pollara 400 AI NIC 实现了卓越的效率。

AMD Pensando P4 架构图显示了数据包处理和内存流路径。

该架构的重要组件包括表引擎（TE），负责从包头向量生成表键，以及根据数据类型执行特定的内存读取。

P4 管道组件图表突出显示了表引擎密钥生成和内存访问。

该设计还具有匹配处理单元 (MPU)，这是一种利用优化的操作码进行现场操作的专用处理器，可实现不同的内存、表格和 PHV 接口。

P4 管道组件图显示了匹配处理单元和接口。

此外，虚拟地址到物理地址 (va2pa) 转换功能等创新进一步提高了系统性能。

计算架构中虚拟到物理地址转换过程的流程图。

在原子内存操作方面，AMD 已将其实现在 SRAM 系统相邻的位置，以提高效率。

AMD 在原子操作方面的增强概述，为 SRAM 内存带来了好处。

管道缓存一致性采用无效/更新逻辑，确保 P4 一致性在地址范围基础上有效运行。

带有无效/更新逻辑解释的管道缓存一致性增强图。

AMD 发现了一些影响 AI 系统在横向扩展网络中性能的挑战。诸如与 ECMP 负载平衡相关的链路利用率低下、网络拥塞和数据包丢失等问题阻碍了整体效率。

AI 横向扩展网络：系统性能挑战以及拥塞和数据包丢失等网络问题。

该公司还强调，与通用网络相比，人工智能网络的利用率明显更高，通常会突破网络带宽可用性的极限。

高网络利用率：AI后端网络以95%的利用率驱动数据传输。

AMD 提出的超级以太网联盟 (UEC) 是克服这些障碍的重要解决方案。UEC 构建了一个开放、可互操作的高性能框架，旨在满足大规模 AI 和高性能计算 (HPC) 应用所必需的网络需求。

超级以太网联盟：满足 AI 和 HPC 需求的开放、可扩展、经济高效的以太网。

UEC 的设计注重效率和经济性，旨在满足现代数据网络日益增长的巨大需求。

AMD Pensando Pollara 400 AI NIC 具有 RDMA、UEC AI 传输、拥塞控制、快速恢复功能。

UEC 的其他优势包括增强的路由技术和网络管理解决方案，旨在解决与拥塞和数据包丢失相关的问题。

Pollara RDMA 与 RoCEv2 RPC 性能图表，突出显示网络效率的提升。

综上所述，AMD 的 Pensando Pollara 400 AI UEC-ready RDMA NIC 与具有 4 个 Qpair 的 RoCEv2 相比性能提升了 25%，与具有 1 个 Qpair 的 RoCEv2 相比性能显著提升了 40%，巩固了其在网络技术领域的领先地位。

来源和图片

相关文章:

AMD Instinct MI350 GPU：凭借 3nm 3D 小芯片、CDNA 4 架构、1850 亿个晶体管、1400W TBP 和 288GB 内存释放 AI 威力，支持超过 4000B LLM

AMD 与 IBM 合作开发以量子为中心的超级计算：开创计算新时代

发表回复取消回复