NVIDIA ha fatto scalpore nel settore tecnologico con il lancio di DGX Spark, un sistema compatto progettato specificamente per carichi di lavoro di intelligenza artificiale (IA).Contemporaneamente, AMD ha compiuto passi da gigante con la sua serie di APU, in particolare con l’APU Strix Halo, che a quanto pare supera il chipset GB10 di NVIDIA in diversi parametri prestazionali di IA. Questa concorrenza emergente solleva interrogativi sull’efficienza e sul valore nel settore dell’elaborazione ad alte prestazioni.
DGX Spark di NVIDIA contro Strix Halo di AMD: analisi del rapporto prezzo/prestazioni
Il DGX Spark si distingue come la proposta inaugurale di NVIDIA nel campo dei sistemi compatti destinati ad applicazioni di intelligenza artificiale, con l’innovativo chip personalizzato GB10. Nonostante le sue capacità all’avanguardia, molti potenziali consumatori hanno espresso preoccupazione per il suo prezzo elevato, stimato intorno ai 4.000 dollari, che ne limita significativamente l’attrattiva. Al contrario, GMKtec, un noto produttore di mini-PC, presenta un’alternativa interessante: l’EVO-X2, dotato di APU Strix Halo di AMD, disponibile a quasi la metà del prezzo.

In un recente post sul blog, GMKtec ha messo alla prova il DGX Spark con il suo mini-PC EVO-X2. Questo confronto ha evidenziato la capacità dell’APU Strix Halo di superare la soluzione NVIDIA in diverse aree chiave, come la velocità di generazione dei token e i tempi di risposta. I test hanno utilizzato una varietà di modelli open source, tra cui Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B e Qwen3 0.6B, ottenendo risultati impressionanti:
| Modello di prova | Metrico | EVO – X2 | NVIDIA GB10 | Vincitore |
|---|---|---|---|---|
| Chiama 3.3 70B | Velocità di generazione (tok/sec) | 4.9 | 4.67 | AMD |
| Tempo di risposta del primo token (s) | 0, 86 | 0, 53 | NVIDIA | |
| Programmatore Qwen3 | Velocità di generazione (tok/sec) | 35.13 | 38.03 | NVIDIA |
| Tempo di risposta del primo token (s) | 0, 13 | 0, 42 | AMD | |
| GPT-OSS 20B | Velocità di generazione (tok/sec) | 64, 69 | 60.33 | AMD |
| Tempo di risposta del primo token (s) | 0, 19 | 0, 44 | AMD | |
| Modello Qwen3 0.6B | Velocità di generazione (tok/sec) | 163, 78 | 174, 29 | NVIDIA |
| Tempo di risposta del primo token (s) | 0, 02 | 0, 03 | AMD |
Secondo le valutazioni di GMKtec, il processore Ryzen Al Max+ 395 presente nell’APU Strix Halo eccelle con modelli di parametri più ampi, mostrando un netto vantaggio nei tempi di risposta del primo token grazie all’efficace integrazione delle architetture CPU, GPU e NPU. Il motore XDNA 2 migliora l’elaborazione AI, garantendo una minore latenza negli output.
Al contrario, i punti di forza di NVIDIA emergono in scenari che favoriscono il throughput piuttosto che la latenza di memoria. DGX Spark è particolarmente adatto per configurazioni ad alto throughput che coinvolgono modelli di grandi dimensioni, offrendo prestazioni impressionanti grazie alla capacità del Superchip GB10 di raggiungere PFLOPS a FP4. Tuttavia, per le applicazioni che enfatizzano la risposta a bassa latenza, un aspetto cruciale per i carichi di lavoro di inferenza in tempo reale, la piattaforma AMD rappresenta un’alternativa comparabile a un costo significativamente inferiore.

A ulteriore conferma di questa prospettiva, il mini-PC EVO-X2 di GMKtec ha un prezzo di 2.199 dollari per la configurazione top di gamma (128 GB di RAM e 2 TB di storage), in netto contrasto con i 4.000 dollari del DGX Spark, rendendo il rapporto costo-prestazioni tra Strix Halo e GB10 decisamente interessante. Per le aziende che desiderano implementare modelli di intelligenza artificiale localizzata senza gravare sul budget, EVO-X2 si presenta come una workstation valida ed economica.
Lascia un commento