NVIDIA 推出「Kyber」機架級架構:到 2027 年可擴充至 576 個 Rubin Ultra GPU,以增強 AI 效能

NVIDIA 推出「Kyber」機架級架構:到 2027 年可擴充至 576 個 Rubin Ultra GPU,以增強 AI 效能

NVIDIA 最近在 OCP 全球高峰會上公佈了其 AI 運算產品組合中的幾項關鍵進展,特別關注其 Kyber 機架規模一代的演變——這是技術的重大飛躍。

NVIDIA Kyber Rack-Scale 世代:提升 GPU 密度與能源效率

在對增強運算能力的需求不斷增長的背景下,NVIDIA 正日益引領創新步伐。在 OCP 全球高峰會上,該公司展示了令人興奮的「AI 工廠」未來願景,重點介紹了 AI 運算解決方案的變革性發展。其中,新一代 Kyber 機架級技術的推出尤其引人注目,該技術預計將接替 Oberon 設計,並有望實現卓越的 NVL576 配置。

OCP 生態系統也正在為 NVIDIA Kyber 做準備,其特色在於 800 VDC 供電、液冷和機械設計​​方面的創新。這些創新將支援 NVIDIA Kyber 向機架伺服器的轉型——NVIDIA Oberon 的繼任者——到 2027 年,該伺服器將搭載 576 個 NVIDIA Rubin Ultra GPU 的高密度平台。 ——NVIDIA

對於不太熟悉的人來說,Kyber 和 Oberon 指的是不同代機架架構,專注於晶片配置、電源容量和冷卻方法。從歷史上看,Oberon 一直是 NVIDIA Blackwell 系列(GB200/GB300)的主要影響因素,但隨著即將推出的 Rubin Ultra,向 Kyber 的過渡標誌著重大的進化,並帶來了多項關鍵的增強。

NVIDIA 電腦伺服器,伺服器機架中可見多個單元插槽。
NVIDIA 的 Kyber 運算節點 | 圖片來源:ServeTheHome

其中最顯著的改進之一包括改進的機架架構,其特點是計算托盤垂直堆疊,類似於書架上的書籍,稱為垂直刀片。這種設計不僅最大限度地提高了 GPU 密度,還提升了網路效率。

另一項重大升級涉及將 NVLink 交換器刀片直接整合到機架機箱內,預計將提高可擴展性並簡化維護。在電源性能方面,Kyber 的突出特點之一是過渡到 800 VDC 設施到機架供電模式,這與先前的 415 或 480 VAC 三相繫統相比有了顯著升級。

這種新的供電模式預計將顯著提升能源效率,使現有銅線的電力傳輸量提升150%。這項創新預計將顯著節省成本——透過最大限度地減少大規模集群部署所需的銅線用量,節省「數百萬美元」。

最終,Kyber 世代帶來的進步將為 NVIDIA 雄心勃勃的 Rubin Ultra NVL576 系統奠定基礎,釋放前所未有的運算能力,並鞏固 NVIDIA 在複雜 AI 基礎設施競賽中的領導地位。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *