ソフトバンクはAMD GPUが「分割統治」コンピューティング戦略を通じてAI能力を強化すると予測

ソフトバンクは、AMDのInstinct AIチップの性能をAIアプリケーション向けに強化することを目的とした野心的なプロジェクトを開始しました。この取り組みでは、最先端の「GPUパーティショニング」技術が採用されており、テクノロジーコミュニティで大きな関心を集めています。

ソフトバンク、AMDのInstinct GPU向けカスタムオーケストレーターを実装

AMDのAIインフラは、特にNVIDIAの優位性とBlackwellシリーズの発表により、近年ハイパースケーラーの注目を集めていませんが、ソフトバンクのような企業は依然としてAMDの技術活用に熱心です。最近のブログ投稿で発表されたように、ソフトバンクの技術部門は、AMDのInstinct AIチップとシームレスに統合するOrchestratorを導入しました。このシステムは、ワークロードの需要とリソースの可用性に応じて、計算リソースを動的に割り当てます。

ソフトバンクはAMDと共同で、AMD Instinct™ GPUのGPUパーティショニング機能を活用した強化されたOrchestrator機能を開発しました。この機能は、単一のGPUを複数の論理デバイスとして使用できます。この機能により、AIアプリケーションの要件（モデルサイズや同時実行性など）に応じて、GPUリソースを柔軟かつ最適に割り当てることができます。

– ソフトバンク

技術的に言えば、ソフトバンクのOrchestratorは、AMD Instinct GPU内での効率的なワークロード分散に重点を置いています。個々のアクセラレータ・コンプレックス・ダイ（XCD）上に構成された複数のGPUインスタンスを活用することで、シングルインスタンスモデル（SPX）や最大8インスタンスをサポートする構成（CPX）など、複数のモードで動作可能です。この汎用性により、さまざまなワークロードに対して高い粒度を実現します。さらに、OrchestratorはAMDの拡張メモリ機能を最大限に活用し、高帯域幅メモリ（HBM）を各GPUインスタンスごとに個別の領域に分割します。

「SoftBank Orchestrator: AMD GPUリソースの最適化」というタイトルの図は、「Before:モノリシック割り当て」と「After:」を比較しています。 — 画像クレジット: ソフトバンク

ソフトバンクはこのオーケストレーターによって、計算リソースのきめ細かな制御を実現し、ハードウェアレベルでの厳格な分離を実現することで、予測不可能なレイテンシの問題を軽減することを目指しています。具体的なパフォーマンス指標はまだ公表されていませんが、ソフトバンクは、このアプローチによって「最適なリソース割り当て」が実現し、特にSLM（Scalable Logical Management）およびMLM（Multi-Language Management）ワークロードにメリットをもたらすと主張しています。今後、同社はこのようなオーケストレーターを他のAIアクセラレーターにも適用する計画がありますが、現時点ではAMDのテクノロジーに注力しています。

出典と画像