NVIDIA憑藉其專為人工智慧(AI)工作負載打造的緊湊型系統DGX Spark,在科技業引起了轟動。同時,AMD的APU系列也取得了顯著進展,尤其是Strix Halo APU,據報道其在多項AI效能指標上超越了NVIDIA的GB10晶片組。這種新興的競爭引發了人們對高效能運算領域效率和價值的思考。
NVIDIA DGX Spark 與 AMD Strix Halo:性價比對比
DGX Spark 是 NVIDIA 首款針對 AI 應用的緊湊型系統產品,搭載了尖端的 GB10 客製化晶片。儘管它擁有頂尖的性能,但其高達 4000 美元左右的售價卻令許多潛在消費者望而卻步,大大降低了它的吸引力。相較之下,知名迷你電腦製造商 GMKtec 推出了一款極具吸引力的替代產品:EVO-X2,它配備了 AMD 的 Strix Halo APU,價格幾乎只有 DGX Spark 的一半。

在最近的一篇部落格文章中,GMKtec 將 DGX Spark 與他們的 EVO-X2 迷你電腦進行了比較測試。此次對比突顯了 Strix Halo APU 在令牌生成速度和回應時間等幾個關鍵領域超越 NVIDIA 解決方案的能力。測試採用了多種開源模型,包括 Llama 3.3 70B、Qwen3 Coder、GPT-OSS 20B 和 Qwen3 0.6B,並取得了令人印象深刻的結果:
| 測試模型 | 指標 | EVO – X2 | NVIDIA GB10 | 優勝者 |
|---|---|---|---|---|
| 調用 3.3 70B | 生成速度(tok/秒) | 4.9 | 4.67 | AMD |
| 首次令牌回應時間(秒) | 0.86 | 0.53 | 英偉達 | |
| Qwen3 程式設計師 | 生成速度(tok/秒) | 35.13 | 38.03 | 英偉達 |
| 首次令牌回應時間(秒) | 0.13 | 0.42 | AMD | |
| GPT-OSS 20B | 生成速度(tok/秒) | 64.69 | 60.33 | AMD |
| 首次令牌回應時間(秒) | 0.19 | 0.44 | AMD | |
| Qwen3 0.6B 型號 | 生成速度(tok/秒) | 163.78 | 174.29 | 英偉達 |
| 首次令牌回應時間(秒) | 0.02 | 0.03 | AMD |
根據 GMKtec 的評測,Strix Halo APU 中搭載的 Ryzen AI Max+ 395 處理器在更廣泛的參數模型下表現出色,由於 CPU、GPU 和 NPU 架構的有效集成,其首幀響應時間優勢顯著。 XDNA 2 引擎增強了 AI 處理能力,從而降低了輸出延遲。
相反,NVIDIA 的優勢體現在更注重吞吐量而非記憶體延遲的場景中。 DGX Spark 尤其適合涉及大型車型的高吞吐量配置,憑藉 GB10 超級晶片在 FP4 下實現 PFLOPS 的出色性能,它能夠提供令人印象深刻的運算能力。然而,對於強調低延遲反應的應用(這是即時推理工作負載的關鍵因素),AMD 平台以更低的成本提供了與之相當的替代方案。

為了進一步佐證這一觀點,GMKtec 的 EVO-X2 迷你電腦頂配版(128 GB 內存和 2 TB 存儲)售價為 2, 199 美元,而 DGX Spark 的售價則高達 4, 000 美元——這使得 Strix Halo 和 GB10 之間的性價比優勢顯而易見。對於希望在預算範圍內部署本地化 AI 模型的企業而言,EVO-X2 無疑是一款經濟實惠且可行的工作站選擇。
發佈留言