NVIDIA Blackwell Ultra がエージェント AI のパフォーマンスを向上: 50 倍のトークン/ワットと強化されたロングコンテキストワークロードを実現

NVIDIAは、ハイパースケーラー向けの最新コンピューティングソリューション「Blackwell Ultra」を発表しました。GB300 NVL72の最新のベンチマークテストでは、特に低レイテンシかつ広範なコンテキストを必要とするアプリケーションにおいて、その卓越したパフォーマンスが明らかになりました。

NVIDIA の Blackwell Ultra AI ラック: NVLink の進化により強化されたエージェントパフォーマンス

AI環境は2022年の急成長以来、変革的な変化を遂げており、特に高度なアプリケーションとフレームワークを活用したエージェントコンピューティングが重視されています。NVIDIAのようなインフラプロバイダーにとって、これらの高度なシステムの厳しいレイテンシ要件を満たすには、高いメモリ帯域幅とパフォーマンスが不可欠です。NVIDIAのBlackwell Ultraシリーズは、この課題に効果的に対応しています。NVIDIAがブログ投稿で最近公開した評価によると、Blackwell UltraはSemiAnalysisのInferenceMAXベンチマークで優れた結果を示しました。

「DeepSeekR1 スループット/MW」というタイトルの折れ線グラフは、GB300 NVL72 NVFP4 が大幅に高いトークンスループットを達成していることを示しています。

NVIDIAは、「トークン/ワット」と呼ばれる、今日のハイパースケーラー開発において極めて重要な指標を強調しています。GB300 NVL72は、前世代のHopper GPUと比較して、メガワットあたりのスループットが50倍という驚異的な向上を達成しており、純粋なパフォーマンスとスループットの両方の向上に重点を置いていることは明らかです。図解比較により、各アーキテクチャの最適な「展開状態」が示されています。

NVIDIAはどのようにしてこれほど驚異的なスループット向上を実現したのでしょうか？その答えは、最先端のNVLinkテクノロジーにあります。Blackwell Ultraは72基のGPUを単一のNVLinkファブリックに統合し、130TB/sという驚異的な接続速度を実現しています。一方、Hopperシリーズは8チップのNVLink設計を採用していますが、これは効果的ではあるものの、Blackwell Ultraの革新的なアーキテクチャとレイアウトには及びません。さらに、NVFP4高精度フォーマットの導入は極めて重要であり、スループットにおけるGB300の優位性を確固たるものにしています。

部分的に開いたサーバーラックには、内部の NVIDIA ハードウェアコンポーネントとケーブルが表示されます。 — 画像クレジット: NVIDIA

「エージェントAI」の台頭に伴い、NVIDIAのGB300 NVL72の評価では、前述のアップグレードに加え、トークンコストも重視されています。Team Greenは、100万トークンあたりのコストが35分の1に大幅に削減されたと報告しており、このシステムは最先端の研究機関やハイパースケーラーにとって推論タスクの第一選択肢として位置付けられています。スケーリングの法則がかつてない速さで進化し続ける中、NVIDIAはこれらのパフォーマンス向上を、現在広く認識されているHuangの法則に加え、「エクストリーム・コデザイン」戦略によるものとしています。

「GB300 NVL72 がロングコンテキスト AI に大きな飛躍をもたらす」というタイトルの折れ線グラフは、GB300 NVL72 がトークンあたりのコストを 1.5 倍削減したことを示しています。

GB300 NVL72とHopperシリーズを比較する際には、コンピューティングノードとアーキテクチャ設計の微妙な違いを認識することが不可欠です。NVIDIAは、ロングコンテキストワークロードのパフォーマンスを評価するため、GB200とGB300 NVL72も比較しました。エージェントにとって、コンテキスト制限は依然として重要な考慮事項です。大規模なコードベースを管理すると、トークン使用量が飛躍的に増加する可能性があるためです。Blackwell Ultraでは、NVIDIAはトークンあたりのコストが最大1.5倍、アテンション処理が2倍高速化されると報告しており、エージェント中心のタスクに非常に適しています。

Blackwell Ultraがハイパースケーラー環境への統合を開始する中、これらのベンチマークは、このアーキテクチャの最も初期の評価結果の一部となります。初期の結果は、NVIDIAが現代のAIアプリケーションに適合した堅牢なパフォーマンススケーリングを維持していることを示唆しています。さらに、Vera Rubinに期待されるような今後の進歩により、Blackwell世代は競争の激しいインフラストラクチャ市場においてNVIDIAをさらにリードする可能性があります。

出典と画像