NVIDIA は、次世代 Vera Rubin アーキテクチャの本格的な生産を開始し、その複雑なラック システム設計と主要コンポーネントの詳細な分析を提供しています。
NVIDIAのVera Rubinを探る:アップグレードされたチップ、高度な液体冷却、ハイエンドNVLink 6
Vera Rubinの導入は、NVIDIAにとってラック技術における大きな飛躍を意味します。CNBCの最近の動画では、メインのコンピューティングノードや重要なネットワークシステム、冷却システムといったコンポーネントを含む、そのアーキテクチャの詳細な分析が紹介されています。特に、NVIDIAのインフラストラクチャ担当シニアディレクターであるディオン・ハリス氏は、Vera Rubinシステムを「世界で最も複雑なAIシステム」の一つと評し、その実装の難しさを強調しています。
Vera Rubinシステムの顧客コミットメントが間もなく開始される見込みであるため、NVL72ラックの構造を理解することは非常に重要です。このアーキテクチャの要となるのがVera Rubin SuperChipです。以前、その技術仕様について解説し、HBM4とGPUの統合、そして専用のSOCAMMモジュールによって実現された大幅な進歩について強調しました。この革新により、1.2TB/sという驚異的なメモリ帯域幅が実現しました。

Vera Rubinは、冷却技術にも大幅なアップグレードを導入しています。Rubin GPUやVera CPUなどのSuperChipコンポーネントを専用のコールドプレートで冷却するモジュール式液冷設計を採用しています。NVIDIAの経営陣は、この革新的な冷却アプローチが、ハイパースケール事業者によるより高度な液冷システムの導入を促すと確信しています。さらに、現在の設計は水の消費量を削減し、環境へのメリットをさらに高めています。


NVLinkテクノロジーは、Vera Rubin NVL72セットアップのもう一つの重要なコンポーネントです。NVIDIAは、一般的に「NVLinkスパイン」と呼ばれる第6世代の相互接続技術により、ラックあたり260TB/秒という驚異的な総帯域幅の実現を目指しています。ハリス氏は、この最新のNVLinkがモジュール設計をさらに進化させ、ラックレベルのRASサービスを通じてゼロダウンタイムのメンテナンスと信頼性の向上を実現すると強調しています。

初期の予測では、Vera Rubinシステムは価格が高くなる可能性があるとされていますが、NVIDIAはこのアーキテクチャにより、Blackwell GB200と比較して、推論トークンコストを10分の1に削減し、Mixture of Experts(MoE)モデルのトレーニングに必要なGPU数を4分の1に削減できることを保証しています。これは、より大きな投資がより大きな節約をもたらすというNVIDIA CEOの哲学と一致しています。
コメントを残す