NVIDIAのRTX Pro 6000 Blackwellは、特に大規模なAIモデルを実行する場合において、単一のGPUが従来のマルチGPU構成を凌駕できることを実証している。驚くべきことに、4枚のRTX 5090の性能を上回ることが実証されている。
単一のRTX PRO 6000 Blackwell GPUは、4つのRTX 5090と比較して4分の1の電力で2300億のAIモデルを実行します。
Steveibe氏がXで行った調査では、家庭環境で大規模なAIモデルを運用することの実現可能性が示されています。2300億個のパラメータを持つAI推論モデルであるMiniMax M2.7を使用し、コンテキストサイズ32k、最大トークン長4096で、4つのNVIDIA GPU搭載構成でテストを実施しました。
MiniMax M2.7は230Bパラメータです。実際に自宅で動作させることができますか?UnslothのUD-IQ3_XXS(80GB)を4つの異なるリグでテストしました:🟠 4x RTX 4090(96GB):71.52 tok/s、TTFT 1045ms 🟢 4x RTX 5090(128GB):120.54 tok/s、TTFT 725ms 🟡 1x RTX PRO 6000(96GB):118.74 tok/s、TTFT 765ms 🟣 DGX… pic.twitter.com/yK8bGg6RtX
— stevibe (@stevibe) 2026年4月18日
ベンチマークテストでは、VRAM容量の少ない構成にも対応できるGGUF量子化方式であるIQ3_XXSを採用しました。この量子化方式は、RTX PRO 6000 GPUの96GB VRAMを最大限に活用できるため選択されました。以下に、各構成におけるパフォーマンス結果を示します。
- 4x RTX 4090 (96GB): 71.52トークン/秒、TTFT 1045ms
- 4x RTX 5090 (128GB): 120.54トークン/秒、TTFT 725ms
- 1x RTX PRO 6000 (96GB): 118.74トークン/秒、TTFT 765ms
- DGX Spark (128GB): 24.41トークン/秒、TTFT 741ms
単一のNVIDIA RTX PRO 6000 Blackwell GPUは、1秒あたり118.74トークンという驚異的な速度を達成し、1秒あたり120.54トークンという4つのRTX 5090のパフォーマンスにほぼ匹敵しました。4つのGPUで構成される旧型のRTX 4090構成では、71.52トークン/秒と大幅に低い出力となりました。対照的に、128GBのメモリを搭載したDGX Spark Mini AI PCは、24.41トークン/秒と大きく遅れをとりました。

トークン生成速度はRTX PRO 6000 BlackwellとRTX 5090sに有利ですが、消費電力やコストなどの追加要素を考慮することが重要です。
消費電力比較
これらの構成における電力使用量を比較すると、明確な違いが浮かび上がってくる。
- RTX 4090 4基:最大消費電力1, 800W(GPUあたり450W)
- RTX 5090 4基:最大消費電力2, 300W(GPUあたり575W)
- RTX PRO 6000 x 1:最大消費電力はわずか600W
- DGX Spark:システム総電力240W
これは、RTX PRO 6000 1枚構成の場合、RTX 5090 4枚構成のわずか4分の1、RTX 4090 4枚構成の約3分の1の電力しか消費しないことを示しています。DGX Sparkは、消費電力は低いものの、フルシステムソリューションとして効率的に機能します。
価格概要
価格面では、これらのGPUの価格がすべてを物語っています。RTX PRO 6000 Blackwellの価格は約9, 500ドル、RTX 5090は1枚約3, 500ドルなので、4枚で合計14, 000ドルになります。DGX Sparkは価格調整後、現在4, 699ドルで販売されています。
- RTX 4090の平均小売価格: 3, 000ドル(GPU1枚あたり)
- RTX 5090の平均小売価格: 3, 500ドル(GPU1枚あたり)
- RTX PRO 6000の平均小売価格: 9, 500ドル(GPU1枚あたり)
- DGX Spark AI PCの平均小売価格: 4, 699ドル
複数のGPUを使用することで、AIモデルのパフォーマンスを向上させ、より多くのメモリを活用できる一方で、システム全体の効率に影響を与えるオーバーヘッドが発生する可能性もあります。これに対し、96GB構成のRTX PRO 6000 Blackwellは、優れたパフォーマンスを実現し、要求の厳しいAIワークロードに対して、より効率的でコスト効率の高いソリューションを提供します。
コメントを残す