マイクロソフト、Azure AIスーパーファクトリーの新アーキテクチャを発表

マイクロソフト、Azure AIスーパーファクトリーの新アーキテクチャを発表

マイクロソフト、アトランタに新たな Azure AI データセンター サイトを発表

この日、マイクロソフトはジョージア州アトランタに新たなAzure AIデータセンターを建設する計画を正式に発表しました。この最先端の施設は、ウィスコンシン州フェアウォーターにある既存のデータセンターと相互接続され、複数のAzure AIスーパーコンピューターも備えています。その目的は、多様なAIタスクを効率的に管理できる、地球規模の包括的なAIデータセンターを構築することです。

革新的な設計がAIデータセンターに革命を起こす

Microsoftは、OpenAIのトレーニングニーズやその他のAIアプリケーション向けにカスタマイズされたデータセンターの構築から得られた知見を活用し、AIデータセンターのアーキテクチャを変革したと主張しています。新しいAIデータセンター設計は、多数のNVIDIA GB200およびGB300 GPUの計算能力を活用するフラットなネットワーク構造を特徴としており、かつてないパフォーマンスを実現します。

新データセンターの主な特徴

今後開設されるアトランタ データセンターでは、従来のデータセンターとは異なるいくつかの画期的な機能が導入されます。

  • 高い GPU 密度: GPU 配置を最大限にするために最適に配置されたカスタム設計のラックにより、レイテンシが最小限に抑えられ、GPU の相互通信が強化されます。
  • 閉ループ液体冷却:革新的な密閉型冷却エコシステムにより水を節約し、蒸発を最小限に抑えながら 6 年以上同じ供給量を使用し、持続可能性を促進しながら高密度コンピューティングをサポートします。
  • 強力な電力供給:ラックあたり約 140 kW、列あたり約 1.36 MW という驚異的な電力供給能力を備えたこのセットアップは、従来の電力制限に遭遇することなく次世代アクセラレータに対応できるように設計されています。
  • フラットな高帯域幅ネットワーク:この設計では、SONiC ベースのネットワークとともに 800 Gbps の GPU 接続を提供する 2 層イーサネット フレームワークを組み込むことで、コスト、複雑さ、および特定のベンダーへの依存を最小限に抑えることを目指しています。
  • アプリケーション対応のネットワーク最適化:リアルタイムのパケット管理や高度な負荷分散などの機能により、広大な GPU クラスターが常に高い利用率を維持されます。
  • 地球規模の AI WAN:アトランタやウィスコンシンを含む複数のサイトを専用の低遅延光バックボーン経由で接続することで、地域をまたがる統合された「スーパーコンピュータ」を構築します。
  • 回復力のある電力モデル:このアプローチでは、強力なローカル ユーティリティ グリッドを活用して信頼性を高め、エネルギー貯蔵ソリューションを組み込んでワークロードの電力要件の変化に適応します。
  • 多用途の AI ワークロード サポート:このインフラストラクチャは、事前トレーニングや微調整から強化学習、推論、合成データ生成に至るまで、さまざまな AI タスクを統合プラットフォーム上で効果的に実行できるように設計されています。

AIワークロードの将来の需要に向けたポジショニング

統合されたマルチリージョン スーパーコンピューターを構築することにより、Microsoft は、今後数年間に予想される大規模な AI ワークフローに関連する需要の急増に対応するための戦略的な体制を整えています。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です