
NVIDIA 最近在 OCP 全球高峰會上公佈了其 AI 運算產品組合中的幾項關鍵進展,特別關注其 Kyber 機架規模一代的演變——這是技術的重大飛躍。
NVIDIA Kyber Rack-Scale 世代:提升 GPU 密度與能源效率
在對增強運算能力的需求不斷增長的背景下,NVIDIA 正日益引領創新步伐。在 OCP 全球高峰會上,該公司展示了令人興奮的「AI 工廠」未來願景,重點介紹了 AI 運算解決方案的變革性發展。其中,新一代 Kyber 機架級技術的推出尤其引人注目,該技術預計將接替 Oberon 設計,並有望實現卓越的 NVL576 配置。
OCP 生態系統也正在為 NVIDIA Kyber 做準備,其特色在於 800 VDC 供電、液冷和機械設計方面的創新。這些創新將支援 NVIDIA Kyber 向機架伺服器的轉型——NVIDIA Oberon 的繼任者——到 2027 年,該伺服器將搭載 576 個 NVIDIA Rubin Ultra GPU 的高密度平台。 ——NVIDIA
對於不太熟悉的人來說,Kyber 和 Oberon 指的是不同代機架架構,專注於晶片配置、電源容量和冷卻方法。從歷史上看,Oberon 一直是 NVIDIA Blackwell 系列(GB200/GB300)的主要影響因素,但隨著即將推出的 Rubin Ultra,向 Kyber 的過渡標誌著重大的進化,並帶來了多項關鍵的增強。

其中最顯著的改進之一包括改進的機架架構,其特點是計算托盤垂直堆疊,類似於書架上的書籍,稱為垂直刀片。這種設計不僅最大限度地提高了 GPU 密度,還提升了網路效率。
另一項重大升級涉及將 NVLink 交換器刀片直接整合到機架機箱內,預計將提高可擴展性並簡化維護。在電源性能方面,Kyber 的突出特點之一是過渡到 800 VDC 設施到機架供電模式,這與先前的 415 或 480 VAC 三相繫統相比有了顯著升級。
這種新的供電模式預計將顯著提升能源效率,使現有銅線的電力傳輸量提升150%。這項創新預計將顯著節省成本——透過最大限度地減少大規模集群部署所需的銅線用量,節省「數百萬美元」。
最終,Kyber 世代帶來的進步將為 NVIDIA 雄心勃勃的 Rubin Ultra NVL576 系統奠定基礎,釋放前所未有的運算能力,並鞏固 NVIDIA 在複雜 AI 基礎設施競賽中的領導地位。
發佈留言