NVIDIAは、人工知能(AI)ワークロード向けに特化して設計されたコンパクトなシステム「DGX Spark」のリリースで、テクノロジー業界に大きな衝撃を与えました。同時に、AMDはAPUシリーズ、特にStrix Halo APUで大きな進歩を遂げており、様々なAI性能指標においてNVIDIAのGB10チップセットを凌駕するとの報道もあります。この新たな競合製品は、高性能コンピューティング分野における効率性と価値について疑問を投げかけています。
NVIDIAのDGX SparkとAMDのStrix Halo:価格性能比の考察
DGX Sparkは、最先端のGB10カスタムチップを搭載した、AIアプリケーション向けコンパクトシステム分野におけるNVIDIA初の製品として際立っています。最先端の機能を備えているにもかかわらず、多くの潜在顧客は推定4, 000ドル前後という高額な価格を懸念しており、その魅力は限定的となっています。一方、ミニPCの有名メーカーであるGMKtecは、魅力的な代替製品として、AMDのStrix Halo APUを搭載したEVO-X2をほぼ半額で提供しています。

GMKtecは最近のブログ記事で、DGX Sparkを自社のEVO-X2ミニPCと比較テストしました。この比較では、トークン生成速度や応答時間など、いくつかの重要な領域でStrix Halo APUがNVIDIAソリューションを上回る性能を発揮することが強調されました。テストでは、Llama 3.3 70B、Qwen3 Coder、GPT-OSS 20B、Qwen3 0.6Bなど、様々なオープンソースモデルが使用され、印象的な結果が得られました。
| テストモデル | メトリック | エボ – X2 | NVIDIA GB10 | 勝者 |
|---|---|---|---|---|
| 3.3 70Bをコール | 生成速度(tok/秒) | 4.9 | 4.67 | AMD |
| 最初のトークン応答時間(秒) | 0.86 | 0.53 | NVIDIA | |
| Qwen3 コーダー | 生成速度(tok/秒) | 35.13 | 38.03 | NVIDIA |
| 最初のトークン応答時間(秒) | 0.13 | 0.42 | AMD | |
| GPT-OSS 20B | 生成速度(tok/秒) | 64.69 | 60.33 | AMD |
| 最初のトークン応答時間(秒) | 0.19 | 0.44 | AMD | |
| Qwen3 0.6B モデル | 生成速度(tok/秒) | 163.78 | 174.29 | NVIDIA |
| 最初のトークン応答時間(秒) | 0.02 | 0.03 | AMD |
GMKtecの評価によると、Strix Halo APUに搭載されているRyzen Al Max+ 395プロセッサは、CPU、GPU、NPUアーキテクチャの効率的な統合により、より広範なパラメータモデルにおいて優れた性能を示し、最初のトークン応答時間において明確な優位性を示しています。XDNA 2エンジンはAI処理を強化し、出力のレイテンシを低減します。
逆に、NVIDIAの強みは、メモリレイテンシよりもスループットが重視されるシナリオで発揮されます。DGX Sparkは、大規模モデルを扱う高スループット構成に特に適しており、FP4でPFLOPSを達成できるGB10スーパーチップの能力により、優れたパフォーマンスを提供します。しかし、リアルタイム推論ワークロードにとって重要な要素である低レイテンシ応答を重視するアプリケーションの場合、AMDプラットフォームは大幅に低コストで同等の選択肢となります。

この見方をさらに強固なものにしているのは、GMKtecのEVO-X2ミニPCが、最上位構成(128GB RAM、2TBストレージ)で2, 199ドルという価格設定であることです。これは、DGX Sparkの4, 000ドルという価格設定とは対照的です。Strix HaloとGB10のコストパフォーマンスは、この価格設定を際立たせています。予算を圧迫することなくローカライズされたAIモデルを導入したい企業にとって、EVO-X2は現実的で予算に優しいワークステーションの選択肢となります。
コメントを残す