
NVIDIA は最近、Blackwell GPU アーキテクチャを活用し、最新の DGX AI Mini スーパーコンピューターに搭載される最先端の GB10 スーパーチップを発表しました。
NVIDIA GB10 スーパーチップ: 革新的な SoC と GPU アーキテクチャ
現在、注目を集めているのは、GB10スーパーチップを搭載した先駆的なシステムであるNVIDIAのDGX Sparkです。これは「AI PC」市場への大きな参入となります。発表後、多くの企業がGB10テクノロジーを活用した独自のAI PCプラットフォームの構築に着手しました。Hot Chips 2025カンファレンスにおいて、NVIDIAはGB10スーパーチップの詳細な解説を行い、Blackwellアーキテクチャをミニ開発者ステーションやワークステーション向けに効果的に拡張する方法を実演しました。

DGX Spark は、高度な Blackwell アーキテクチャに基づいて構築されたミニ AI スーパーコンピュータとして機能するように構想されました。

DGX Sparkワークステーションの主な機能
DGX Spark ワークステーションには、次のような優れた機能がいくつか組み込まれています。
- GB10 Grace Blackwell スーパーチップ: AI、データ サイエンス、コンピューティング、レンダリング、視覚化のタスク向けに最適化されています。
- 128GB コヒーレント統合システム メモリ:最大 2, 000 億のパラメータを持つ大規模な AI モデルと、最大 700 億のパラメータを持つ微調整モデルを処理できます。
- ConnectX-7 ネットワーキング: 2 つの DGX Spark システム間の相互接続を容易にし、最大 4050 億のパラメータを持つモデルでのコラボレーションを可能にします。
- DGX ベース OS と NVIDIA AI ソフトウェア スタック:これにより、DGX Spark と DGX Cloud、または任意の高速クラウド インフラストラクチャ間でのワークロードのスムーズな転送が保証されます。
- 多様な展開オプション: AI ワークステーションまたはネットワーク接続されたパーソナル AI クラウドとして構成できます。
- 強化されたユーザー エクスペリエンス:マルチヘッド ディスプレイとさまざまな接続オプションのサポートを提供します。
- コンパクトでエネルギー効率に優れた設計:どのデスクにも快適にフィットし、標準の壁コンセントで動作します。

GB10スーパーチップの仕様を詳しく見る
GB10スーパーチップをさらに詳しく調べてみると、そのシステムオンチップ(SoC)は2つのダイレットで設計されていることがわかります。CPUとメモリサブシステムを収容するSダイレットと、GPUコア専用のGダイレットです。どちらのダイレットも、高度な2.5Dパッケージング技術を採用し、TSMCの最先端3nmプロセスで製造されています。

CPUアーキテクチャはARM v9.2設計に基づいており、合計20個のコアが2つのクラスターに構成されています。各コアには専用のL2キャッシュが搭載され、クラスター間で共有される32MBのL3キャッシュも利用できます。

GB100 Blackwellアーキテクチャを採用したチップのGPU部分は、同一チップパッケージ内に搭載されているため、統合GPU(iGPU)として機能します。DLSS 4対応の第5世代TensorコアやRTXレイトレーシングコアなどの高度な機能を備え、AIアプリケーション向けに最適化されたFP32演算で最大31TFLOPS、NVFP4(FP4)演算で最大1000TOPSという驚異的な演算能力を実現します。さらに、GPUにはパフォーマンス向上のため、24MBのL2キャッシュが搭載されています。
メモリ性能に関しては、NVIDIA GB10スーパーチップは256b LPDDR5x(統合メモリアーキテクチャ)をサポートし、アクセス速度は9400 MT/sに達し、最大301 GB/sという驚異的な帯域幅を実現します。この構成により、最大128 GBのメモリ容量が実現します。高性能コヒーレントファブリックはCHI-Eコヒーレンシプロトコル向けに最適化されており、C2Xインターフェースを介してGPUに600 GB/sという広範なシステム帯域幅を提供します。

さらに、GB10はCPUのL4として設計された16MBのシステムレベルキャッシュを搭載しており、複数のSoCエンジン間で電力効率の高いデータ共有を促進します。高帯域幅で低消費電力のC2Cインターフェースは、NVIDIAのNVLINKテクノロジーを活用しています。
接続オプションは充実しており、PCIe、USB、PCIe経由のEthernetをサポートしています。DP Altモードを使用すれば、最大4台のディスプレイ(DisplayPort 3台 + HDMI 1台)を同時に接続でき、最大4K/120Hzの解像度に対応します。HDMI 2.1aでは、8K/120Hzにも対応しています。セキュリティも重視されており、デュアルセキュアルート、SROOTプロセッサ、OSROOTプロセッサを搭載し、fTPMとディスクリートTPMの両方に対応しています。チップの総設計消費電力(TDP)は140Wです。

GB10スーパーチップのスケーラビリティ
GB10スーパーチップのもう一つの注目すべき特徴は、そのスケーラビリティです。複数のGB10チップはNVIDIAのConnectXテクノロジーを介して相互接続でき、より大規模なAIモデルのサポートに不可欠なスループット、帯域幅、そしてDRAM容量の向上を実現します。各ConnectXネットワーク・インターフェース・カード(NIC)は、PCIe Gen5 x8インターフェースを介してGB10 SoCに接続し、ユニット間の通信はイーサネット・フレームワークを介して行われます。

NVIDIAは、GB10 Superchip SoCをMediatekとのパートナーシップの成果として、MediatekのCPU IPを活用したものだと説明しています。このチップは、MediatekのメモリインフラストラクチャにおけるGPUメモリの相互作用を詳細にモデル化しました。

GB10スーパーチップの将来展望
GB10スーパーチップの最も魅力的な点は、最終的にはノートパソコンやミニPCなどのコンシューマー市場に到達する可能性があることです。報道によると、近日発売予定のN1XおよびN1 SoCは、コンシューマー向けに特化した最初のNVIDIA SoCとなる可能性があり、GB10はこれらのチップが提供できる可能性を垣間見せてくれるでしょう。
コメントを残す