
NVIDIA 最近在 OCP 全球峰会上公布了其 AI 计算产品组合中的几项关键进展,特别关注其 Kyber 机架规模一代的演变——这是技术的一次重大飞跃。
NVIDIA Kyber Rack-Scale 一代:提升 GPU 密度和能效
在对增强计算能力的需求不断增长的背景下,NVIDIA 正日益引领创新步伐。在 OCP 全球峰会上,公司展示了激动人心的“AI 工厂”未来愿景,重点介绍了 AI 计算解决方案的变革性发展。其中,新一代 Kyber 机架级技术的推出尤为引人注目,该技术有望接替 Oberon 设计,并有望实现卓越的 NVL576 配置。
OCP 生态系统也在为 NVIDIA Kyber 做准备,其特色在于 800 VDC 供电、液冷和机械设计方面的创新。这些创新将支持 NVIDIA Kyber 向机架服务器的转型——NVIDIA Oberon 的继任者——到 2027 年,该服务器将搭载 576 个 NVIDIA Rubin Ultra GPU 的高密度平台。——NVIDIA
对于不太熟悉的人来说,Kyber 和 Oberon 指的是不同代机架架构,侧重于芯片配置、电源容量和冷却方法。从历史上看,Oberon 一直是 NVIDIA Blackwell 系列(GB200/GB300)的主要影响因素,但随着即将推出的 Rubin Ultra,向 Kyber 的过渡标志着一次重大的进化,并带来了多项关键的增强。

其中最显著的改进之一包括改进的机架架构,其特点是计算托盘垂直堆叠,类似于书架上的书籍,称为垂直刀片。这种设计不仅最大限度地提高了 GPU 密度,还提升了网络效率。
另一项重大升级涉及将 NVLink 交换机刀片直接集成到机架机箱内,这有望提高可扩展性并简化维护。在电源性能方面,Kyber 的突出特点之一是过渡到 800 VDC 设施到机架供电模式,这与之前的 415 或 480 VAC 三相系统相比有了显著升级。
这种新的供电模式预计将显著提升能源效率,使现有铜线的电力传输量提升150%。这项创新预计将显著节省成本——通过最大限度地减少大规模集群部署所需的铜线用量,节省“数百万美元”。
最终,Kyber 一代带来的进步将为 NVIDIA 雄心勃勃的 Rubin Ultra NVL576 系统奠定基础,释放前所未有的计算能力,并巩固 NVIDIA 在复杂 AI 基础设施竞赛中的领导地位。
发表回复