Microsoft AzureのUltraアップグレードにNVIDIA GB300「Blackwell Ultra」GPUを搭載:4600個のGPUで1兆以上のパラメータを持つAIモデルを駆動

Microsoft AzureのUltraアップグレードにNVIDIA GB300「Blackwell Ultra」GPUを搭載:4600個のGPUで1兆以上のパラメータを持つAIモデルを駆動

MicrosoftはAzureプラットフォームに関する重要な発表を行い、NVIDIAの最先端GPU「GB300 Blackwell Ultra」を搭載した初の大規模本番環境クラスターを発表しました。この先進的なクラスターは、極めて大規模なAIモデルの処理に特化して設計されています。

NVIDIA GB300「Blackwell Ultra」:Microsoft Azure プラットフォームでの AI トレーニングを強化

Azureフレームワークは、NVIDIAの先進的なGB300 NVL72アーキテクチャを基盤とする4, 600基以上のGPUを堅牢に搭載したBlackwell Ultraを組み込むようにアップグレードされました。この構成は最先端のInfiniBand相互接続技術を活用しており、マイクロソフトのグローバルデータセンター全体に数十万基ものBlackwell Ultra GPUを展開する能力を大幅に強化し、AIワークロード専用化を実現します。

Microsoftによると、NVIDIA GB300 NVL72「Blackwell Ultra」GPUを搭載したAzureクラスターを導入することで、モデルのトレーニング時間を数か月から数週間へと劇的に短縮できます。この進歩により、数百兆個のパラメータで構成されるモデルのトレーニングが可能になります。NVIDIAは、数々のMLPerfベンチマークや最近のInferenceMAX AIテストで実証されているように、推論メトリクスにおいても優れたパフォーマンスを発揮しています。

新たにリリースされたAzure ND GB300 v6仮想マシン(VM)は、推論モデル、エージェント型AIシステム、マルチモーダル生成AIタスクなど、様々な高度なアプリケーション向けに最適化されています。このインフラストラクチャの各ラックには18台のVMが収容可能で、各VMには72基のGPUが搭載されています。以下の仕様は、パフォーマンス能力の概要を示しています。

  • 72 個の NVIDIA Blackwell Ultra GPU と 36 個の NVIDIA Grace CPU を組み合わせます。
  • 最先端の NVIDIA Quantum-X800 InfiniBand による 800 ギガビット/秒 (Gbps) のラック間スケールアウト帯域幅。
  • ラックあたり 1 秒あたり 130 テラバイト (TB) の NVIDIA NVLink 帯域幅。
  • 37TBの高速メモリ。
  • FP4 Tensor Core のパフォーマンスは最大 1, 440 ペタフロップス (PFLOPS) です。
Microsoft Azure、NVIDIAのGB300で大幅なアップグレード

ラックレベルでは、NVLinkとNVSwitchによってメモリ割り当てと帯域幅が向上し、37TBの高速メモリを接続しながら、ラック内データ転送速度は驚異的な130TB/秒を実現しています。このアーキテクチャ革新により、各ラックが統合ユニットとなり、大規模なモデルや拡張されたコンテキストウィンドウにおいて、推論スループットの向上と低レイテンシを実現します。この機能強化により、エージェント型およびマルチモーダル型のAIシステムがサポートされ、これまで以上に俊敏性と拡張性が向上します。

Azure は、個々のラックを超えて機能を拡張するために、NVIDIA Quantum-X800 Gbps InfiniBand を活用した高性能ファットツリー ネットワーク アーキテクチャを採用しています。この設計により、通信オーバーヘッドを最小限に抑えながら、超大規模モデルのトレーニングを数万基の GPU に効率的にスケーリングできます。同期オーバーヘッドの削減により GPU の利用が最適化され、AI トレーニングに伴う膨大な計算負荷にもかかわらず、研究サイクルの加速とコスト効率の向上が実現します。カスタム プロトコルとネットワーク内コンピューティング機能を含む Azure の特別に設計されたスタックは、高い信頼性とリソースの効率的な利用を保証します。NVIDIA SHARP などのテクノロジは、オンスイッチ コンピューティングを通じて全体的な操作速度を向上させ、実効帯域幅を 2 ​​倍にすることで、より効率的な大規模トレーニングと推論を促進します。

さらに、Azure の革新的な冷却技術には、スタンドアロンの熱交換ユニットと高度な施設冷却システムが組み込まれており、GB300 NVL72 のような高密度で高性能なクラスター内の熱安定性を確保しながら、水消費量を削減することを目指しています。また、電力分配モデルの継続的な開発と適応により、ND GB300 v6 VM クラスの GPU クラスターに固有の高いエネルギー要件と動的な負荷分散の要求にも対応しています。

マイクロソフト経由

NVIDIAが強調しているように、Microsoft Azure と NVIDIA のこのコラボレーションは、AI 分野における米国のリーダーシップにとって極めて重要な瞬間となります。お客様は、これらの画期的な Azure VM にアクセスし、プロジェクトに活用できるようになります。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です