
NVIDIA 迈出了重要一步,推出了一项突破性的解决方案,旨在互连多个数据中心,为人工智能 (AI) 应用提供强大的计算能力。
NVIDIA Spectrum-XGS 以太网简介:AI 集群的颠覆者
随着企业努力提升 AI 计算能力,传统的单纯扩展资源的方法存在局限性,尤其是在运营约束和资源管理方面。为此,NVIDIA 推出了一个全新的互连平台,使企业能够将分布式数据中心统一到他们所谓的“千兆级 AI 超级工厂”。这一创新解决方案旨在克服在尝试扩展单个数据中心容量时经常面临的地理和物流挑战。通过连接多个 AI 集群,企业可以显著提升 AI 性能,而无需承受单一设施带来的种种弊端。
借助 NVIDIA Spectrum-XGS 以太网,我们在纵向扩展和横向扩展功能的基础上添加了横向扩展功能,将跨城市、国家和大陆的数据中心连接成庞大的千兆级 AI 超级工厂。—— NVIDIA 首席执行官黄仁勋
Spectrum-XGS 由 NVIDIA 成熟的 Spectrum 技术发展而来,旨在成为未来 AI 计算的基石。正如公司博客文章所述,这项新技术的性能比 NCCL(一种先前用于连接多个 GPU 节点的方法)提高了一倍。Spectrum-XGS 的显著特性包括自动调整拥塞控制和延迟管理。这些创新对于缓解互连数据中心之间长距离传输导致的性能下降至关重要。

在此次重要的合作中,Coreweave 将率先在其超大规模服务中采用 Spectrum-XGS 以太网。此次合作有望“加速各行各业的突破”,释放前所未有的计算能力,这在以前是无法实现的。随着 NVIDIA 不断利用硅光子网络交换机等技术进步,我们可以预期互连技术将快速发展,进一步改变 AI 和数据管理的格局。
发表回复