
AMD 最近在 Hot Chips 2025 上发布了其创新的Pensando Pollara 400 AI NIC,标志着业界推出了首款支持超级以太网联盟 (UEC) 的 AI 网络接口卡 (NIC)。
AMD 推出 400GbE Pensando Pollara 400 AI NIC,性能提升 25%
在先前研发的基础上,AMD 去年展示了Pensando Pollara 400。这款专为 AI 系统设计的先进网卡 (NIC) 拥有高达 400 Gbps 的惊人带宽,与 NVIDIA 的 ConnectX-7 形成直接竞争。此外,NVIDIA 还推出了更先进的 ConnectX-8,其最新的 Blackwell Ultra 系统可提供令人印象深刻的 800GbE 速度。

Pensando Pollara 400 配备了多项尖端功能:
- 可编程硬件流水线
- 性能提升高达 1.25 倍
- 400 Gbps 吞吐量
- 开放生态系统兼容性
- UEC Ready RDMA 功能
- 缩短作业完成时间
- 卓越的可用性

Pensando 网络解决方案的架构与 AMD 现有的数据中心架构紧密结合,特别是 EPYC 和 Instinct 系列,它们利用 PCIe 交换机有效连接 NIC 和 CPU。

重要的是,Pensando NIC 无需 PCIe 交换机即可运行,并直接与 Gen5 x16 连接。底层架构如下图所示:

通过利用 P4 架构,Pensando Pollara 400 AI NIC 实现了卓越的效率。

该架构的重要组件包括表引擎(TE),负责从包头向量生成表键,以及根据数据类型执行特定的内存读取。

该设计还具有匹配处理单元 (MPU),这是一种利用优化的操作码进行现场操作的专用处理器,可实现不同的内存、表格和 PHV 接口。

此外,虚拟地址到物理地址 (va2pa) 转换功能等创新进一步提高了系统性能。

在原子内存操作方面,AMD 已将其实现在 SRAM 系统相邻的位置,以提高效率。

管道缓存一致性采用无效/更新逻辑,确保 P4 一致性在地址范围基础上有效运行。

AMD 发现了一些影响 AI 系统在横向扩展网络中性能的挑战。诸如与 ECMP 负载平衡相关的链路利用率低下、网络拥塞和数据包丢失等问题阻碍了整体效率。

该公司还强调,与通用网络相比,人工智能网络的利用率明显更高,通常会突破网络带宽可用性的极限。

AMD 提出的超级以太网联盟 (UEC) 是克服这些障碍的重要解决方案。UEC 构建了一个开放、可互操作的高性能框架,旨在满足大规模 AI 和高性能计算 (HPC) 应用所必需的网络需求。

UEC 的设计注重效率和经济性,旨在满足现代数据网络日益增长的巨大需求。

UEC 的其他优势包括增强的路由技术和网络管理解决方案,旨在解决与拥塞和数据包丢失相关的问题。

综上所述,AMD 的 Pensando Pollara 400 AI UEC-ready RDMA NIC 与具有 4 个 Qpair 的 RoCEv2 相比性能提升了 25%,与具有 1 个 Qpair 的 RoCEv2 相比性能显著提升了 40%,巩固了其在网络技术领域的领先地位。
发表回复