NVIDIA sorgte mit der Veröffentlichung des DGX Spark, einem kompakten System speziell für KI-Anwendungen, für Furore in der Technologiebranche. Gleichzeitig erzielte AMD mit seiner APU-Serie, insbesondere der Strix Halo APU, bedeutende Fortschritte. Berichten zufolge übertrifft diese den GB10-Chipsatz von NVIDIA in verschiedenen KI-Leistungskennzahlen. Dieser aufkommende Wettbewerb wirft Fragen nach Effizienz und Wert im Bereich des Hochleistungsrechnens auf.
NVIDIAs DGX Spark im Vergleich zu AMDs Strix Halo: Einblicke ins Preis-Leistungs-Verhältnis
Der DGX Spark ist NVIDIAs erstes kompaktes System für KI-Anwendungen und ist mit dem hochmodernen GB10-Chip ausgestattet. Trotz seiner fortschrittlichen Leistungsfähigkeit schreckt der hohe Preis von schätzungsweise 4.000 US-Dollar viele potenzielle Kunden ab und schränkt seine Attraktivität deutlich ein. GMKtec, ein namhafter Hersteller von Mini-PCs, bietet mit dem EVO-X2, ausgestattet mit AMDs Strix Halo APU, eine überzeugende Alternative – und das zu fast dem halben Preis.

In einem kürzlich erschienenen Blogbeitrag unterzog GMKtec den DGX Spark einem Test gegen ihren EVO-X2 Mini-PC. Dieser Vergleich verdeutlichte die Überlegenheit der Strix Halo APU gegenüber der NVIDIA-Lösung in mehreren Schlüsselbereichen, wie etwa der Token-Generierungsgeschwindigkeit und den Reaktionszeiten. Die Tests wurden mit verschiedenen Open-Source-Modellen durchgeführt, darunter Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B und Qwen3 0.6B, und lieferten beeindruckende Ergebnisse.
| Testmodell | Metrisch | EVO – X2 | NVIDIA GB10 | Gewinner |
|---|---|---|---|---|
| Rufen Sie 3.3 70B an. | Generierungsgeschwindigkeit (tok/Sek.) | 4.9 | 4, 67 | AMD |
| Antwortzeit des ersten Tokens (s) | 0, 86 | 0, 53 | NVIDIA | |
| Qwen3-Programmierer | Generierungsgeschwindigkeit (tok/Sek.) | 35.13 | 38, 03 | NVIDIA |
| Antwortzeit des ersten Tokens (s) | 0, 13 | 0, 42 | AMD | |
| GPT-OSS 20B | Generierungsgeschwindigkeit (tok/Sek.) | 64, 69 | 60, 33 | AMD |
| Antwortzeit des ersten Tokens (s) | 0, 19 | 0, 44 | AMD | |
| Qwen3 0.6B Modell | Generierungsgeschwindigkeit (tok/Sek.) | 163, 78 | 174, 29 | NVIDIA |
| Antwortzeit des ersten Tokens (s) | 0, 02 | 0, 03 | AMD |
Laut GMKtec-Bewertungen zeichnet sich der im Strix Halo APU verbaute Ryzen AI Max+ 395 Prozessor durch seine hervorragenden Ergebnisse in breiteren Parametermodellen aus und bietet dank der effektiven Integration von CPU-, GPU- und NPU-Architektur einen deutlichen Vorteil bei den Reaktionszeiten des ersten Tokens. Die XDNA 2-Engine optimiert die KI-Verarbeitung und führt zu geringeren Latenzzeiten bei den Ausgaben.
Umgekehrt spielen NVIDIAs Stärken ihre Stärken in Szenarien aus, in denen der Durchsatz wichtiger ist als die Speicherlatenz. Der DGX Spark eignet sich besonders gut für Konfigurationen mit hohem Durchsatz und großen Modellen und bietet dank des GB10-Superchips, der PFLOPS auf FP4-Ebene erreicht, eine beeindruckende Leistung. Für Anwendungen, die auf geringe Latenzzeiten setzen – ein entscheidender Aspekt für Echtzeit-Inferenz-Workloads – stellt die AMD-Plattform jedoch eine vergleichbare Alternative zu deutlich geringeren Kosten dar.

Um diese Einschätzung zu untermauern, ist der EVO-X2 Mini-PC von GMKtec in der Top-Konfiguration (128 GB RAM und 2 TB Speicher) für 2.199 US-Dollar erhältlich, im Gegensatz zum DGX Spark mit einem Preis von 4.000 US-Dollar. Das Preis-Leistungs-Verhältnis des Strix Halo und des GB10 ist daher ausgesprochen attraktiv. Für Unternehmen, die lokalisierte KI-Modelle implementieren möchten, ohne ihr Budget zu sprengen, erweist sich der EVO-X2 als praktikable und kostengünstige Workstation-Option.
Schreibe einen Kommentar