NVIDIA a fait sensation dans le secteur technologique avec la sortie du DGX Spark, un système compact conçu spécifiquement pour les charges de travail d’intelligence artificielle (IA).Parallèlement, AMD a réalisé des progrès significatifs avec sa gamme d’APU, notamment le Strix Halo, qui surpasserait le chipset GB10 de NVIDIA sur plusieurs indicateurs de performance en IA. Cette concurrence émergente soulève des questions d’efficacité et de rapport qualité-prix dans le domaine du calcul haute performance.
Comparaison des performances et du rapport prix : NVIDIA DGX Spark contre AMD Strix Halo
Le DGX Spark se distingue comme la première offre de NVIDIA dans le domaine des systèmes compacts dédiés aux applications d’IA, grâce à sa puce GB10 personnalisée de pointe. Malgré ses performances exceptionnelles, son prix élevé, estimé à environ 4 000 $, freine considérablement son adoption.À l’inverse, GMKtec, fabricant renommé de mini-PC, propose une alternative intéressante : l’EVO-X2, équipé de l’APU Strix Halo d’AMD, disponible à un prix presque deux fois inférieur.

Dans un récent article de blog, GMKtec a comparé le DGX Spark à son mini-PC EVO-X2. Cette comparaison a mis en évidence la capacité de l’APU Strix Halo à surpasser la solution NVIDIA dans plusieurs domaines clés, tels que la vitesse de génération de jetons et les temps de réponse. Les tests ont utilisé divers modèles open source, notamment Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B et Qwen3 0.6B, et ont donné des résultats impressionnants.
| Modèle d’essai | Métrique | EVO – X2 | NVIDIA GB10 | Gagnant |
|---|---|---|---|---|
| Appel 3.3 70B | Vitesse de génération (tok/sec) | 4.9 | 4, 67 | AMD |
| Délai de réponse du premier jeton (s) | 0, 86 | 0, 53 | NVIDIA | |
| Codeur Qwen3 | Vitesse de génération (tok/sec) | 35.13 | 38, 03 | NVIDIA |
| Délai de réponse du premier jeton (s) | 0, 13 | 0, 42 | AMD | |
| GPT-OSS 20B | Vitesse de génération (tok/sec) | 64, 69 | 60, 33 | AMD |
| Délai de réponse du premier jeton (s) | 0, 19 | 0, 44 | AMD | |
| Modèle Qwen3 0.6B | Vitesse de génération (tok/sec) | 163, 78 | 174, 29 | NVIDIA |
| Délai de réponse du premier jeton (s) | 0, 02 | 0, 03 | AMD |
D’après les évaluations de GMKtec, le processeur Ryzen 3 Max+ 395, intégré à l’APU Strix Halo, excelle avec des modèles paramétriques plus étendus, affichant un net avantage en termes de temps de réponse au premier jeton grâce à l’intégration efficace des architectures CPU, GPU et NPU. Le moteur XDNA 2 améliore le traitement de l’IA, ce qui se traduit par une latence de sortie réduite.
À l’inverse, les atouts de NVIDIA se révèlent dans les scénarios privilégiant le débit à la latence mémoire. La DGX Spark est particulièrement adaptée aux configurations à haut débit impliquant des modèles volumineux, offrant des performances impressionnantes grâce à la capacité du superprocesseur GB10 à atteindre des PFLOPS en FP4. Cependant, pour les applications privilégiant une faible latence de réponse – un aspect crucial pour les charges de travail d’inférence en temps réel – la plateforme AMD constitue une alternative comparable à un coût nettement inférieur.

Pour conforter cette perspective, le mini-PC EVO-X2 de GMKtec est proposé à 2 199 $ pour une configuration haut de gamme (128 Go de RAM et 2 To de stockage), contre 4 000 $ pour le DGX Spark. Le rapport coût-performance du Strix Halo et du GB10 s’avère ainsi particulièrement attractif. Pour les entreprises souhaitant déployer des modèles d’IA localisés sans grever leur budget, l’EVO-X2 se présente comme une station de travail viable et économique.
Laisser un commentaire