Firma NVIDIA wywołała poruszenie w branży technologicznej, wprowadzając na rynek DGX Spark, kompaktowy system stworzony specjalnie do zadań związanych ze sztuczną inteligencją (AI).Jednocześnie AMD poczyniło znaczące postępy w swojej serii procesorów APU, a w szczególności w modelu Strix Halo APU, który podobno przewyższa chipset GB10 firmy NVIDIA pod względem różnych wskaźników wydajności AI. Ta rosnąca konkurencja rodzi pytania o wydajność i wartość w obszarze obliczeń o wysokiej wydajności.
NVIDIA DGX Spark kontra AMD Strix Halo: analiza stosunku ceny do wydajności
DGX Spark wyróżnia się jako pierwsza oferta firmy NVIDIA w segmencie kompaktowych systemów dedykowanych do zastosowań AI, wyposażona w najnowocześniejszy, autorski układ GB10. Pomimo najnowocześniejszych możliwości, wielu potencjalnych konsumentów wyraziło obawy dotyczące jego wysokiej ceny, szacowanej na około 4000 dolarów, co znacznie ogranicza jego atrakcyjność. Z kolei GMKtec, znany producent minikomputerów, prezentuje atrakcyjną alternatywę: EVO-X2, wyposażony w procesor APU Strix Halo firmy AMD, dostępny za prawie połowę tej ceny.

W niedawnym wpisie na blogu firma GMKtec przetestowała procesor DGX Spark w zestawieniu z minikomputerem EVO-X2. Porównanie to wykazało, że APU Strix Halo przewyższa rozwiązanie firmy NVIDIA w kilku kluczowych obszarach, takich jak szybkość generowania tokenów i czas reakcji. W testach wykorzystano różnorodne modele open-source, w tym Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B i Qwen3 0.6B, uzyskując imponujące wyniki:
| Model testowy | Metryczny | EVO – X2 | NVIDIA GB10 | Zwycięzca |
|---|---|---|---|---|
| Zadzwoń 3.3 70B | Prędkość generacji (tok/sek) | 4.9 | 4, 67 | AMD |
| Czas reakcji pierwszego tokena (s) | 0, 86 | 0, 53 | NVIDIA | |
| Programista Qwen3 | Prędkość generacji (tok/sek) | 35.13 | 38.03 | NVIDIA |
| Czas reakcji pierwszego tokena (s) | 0, 13 | 0, 42 | AMD | |
| GPT-OSS 20B | Prędkość generacji (tok/sek) | 64, 69 | 60, 33 | AMD |
| Czas reakcji pierwszego tokena (s) | 0, 19 | 0, 44 | AMD | |
| Model Qwen3 0.6B | Prędkość generacji (tok/sek) | 163, 78 | 174, 29 | NVIDIA |
| Czas reakcji pierwszego tokena (s) | 0, 02 | 0, 03 | AMD |
Według ocen GMKtec, procesor Ryzen Al Max+ 395 zastosowany w APU Strix Halo wyróżnia się w modelach o szerszych parametrach, wykazując wyraźną przewagę w czasie reakcji pierwszego tokena dzięki efektywnej integracji architektur CPU, GPU i NPU. Silnik XDNA 2 usprawnia przetwarzanie AI, zapewniając niższe opóźnienia w wynikach.
Z drugiej strony, mocne strony NVIDIA ujawniają się w scenariuszach, w których priorytetem jest przepustowość, a nie opóźnienie pamięci. DGX Spark jest szczególnie dobrze przystosowany do konfiguracji o wysokiej przepustowości, obejmujących duże modele, oferując imponującą wydajność dzięki możliwościom GB10 Superchip, który osiąga PFLOPS w FP4. Jednak w przypadku aplikacji wymagających niskiego opóźnienia reakcji – kluczowego aspektu w przypadku obciążeń wnioskowania w czasie rzeczywistym – platforma AMD stanowi porównywalną alternatywę przy znacznie niższych kosztach.

Dodatkowo, umacniając tę perspektywę, minikomputer EVO-X2 firmy GMKtec kosztuje 2199 dolarów za konfigurację z najwyższej półki (128 GB RAM i 2 TB pamięci masowej), w porównaniu z ceną 4000 dolarów za DGX Spark – co sprawia, że stosunek ceny do wydajności między Strix Halo a GB10 jest wyjątkowo atrakcyjny. Dla firm, które chcą wdrożyć zlokalizowane modele AI bez nadwyrężania budżetu, EVO-X2 okazuje się realną, przystępną cenowo opcją stacji roboczej.
Dodaj komentarz