A NVIDIA causou grande impacto na indústria de tecnologia com o lançamento do DGX Spark, um sistema compacto desenvolvido especificamente para cargas de trabalho de inteligência artificial (IA).Simultaneamente, a AMD vem fazendo progressos significativos com sua série de APUs, particularmente a Strix Halo APU, que, segundo relatos, supera o chipset GB10 da NVIDIA em diversas métricas de desempenho de IA. Essa competição emergente levanta questões sobre eficiência e custo-benefício no segmento de computação de alto desempenho.
NVIDIA DGX Spark vs. AMD Strix Halo: Análise de custo-benefício
O DGX Spark se destaca como a oferta inaugural da NVIDIA no segmento de sistemas compactos voltados para aplicações de IA, apresentando o chip personalizado GB10 de última geração. Apesar de seus recursos avançados, muitos consumidores em potencial expressaram preocupação com seu preço elevado, estimado em cerca de US$ 4.000, o que limita significativamente seu apelo. Em contrapartida, a GMKtec, uma fabricante renomada de mini-PCs, apresenta uma alternativa atraente: o EVO-X2, equipado com a APU Strix Halo da AMD, disponível por quase metade desse preço.

Em uma publicação recente no blog, a GMKtec colocou o DGX Spark à prova contra o seu mini-PC EVO-X2. Essa comparação destacou a capacidade da APU Strix Halo de superar a solução da NVIDIA em diversas áreas importantes, como velocidade de geração de tokens e tempo de resposta. Os testes utilizaram uma variedade de modelos de código aberto, incluindo Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B e Qwen3 0.6B, apresentando resultados impressionantes.
| Modelo de teste | Métrica | EVO – X2 | NVIDIA GB10 | Ganhador |
|---|---|---|---|---|
| Ligue para 3.3 70B | Velocidade de geração (tok/seg) | 4, 9 | 4, 67 | AMD |
| Tempo de resposta do primeiro token (s) | 0, 86 | 0, 53 | NVIDIA | |
| Qwen3 Coder | Velocidade de geração (tok/seg) | 35.13 | 38.03 | NVIDIA |
| Tempo de resposta do primeiro token (s) | 0, 13 | 0, 42 | AMD | |
| GPT-OSS 20B | Velocidade de geração (tok/seg) | 64, 69 | 60, 33 | AMD |
| Tempo de resposta do primeiro token (s) | 0, 19 | 0, 44 | AMD | |
| Modelo Qwen3 0.6B | Velocidade de geração (tok/seg) | 163, 78 | 174, 29 | NVIDIA |
| Tempo de resposta do primeiro token (s) | 0, 02 | 0, 03 | AMD |
De acordo com as avaliações da GMKtec, o processador Ryzen AI Max+ 395 presente na APU Strix Halo se destaca com modelos de parâmetros mais abrangentes, apresentando uma clara vantagem nos tempos de resposta do primeiro token devido à integração eficaz das arquiteturas de CPU, GPU e NPU. O mecanismo XDNA 2 aprimora o processamento de IA, resultando em menor latência nas saídas.
Por outro lado, os pontos fortes da NVIDIA se destacam em cenários que priorizam a taxa de transferência em vez da latência de memória. O DGX Spark é particularmente adequado para configurações de alta taxa de transferência envolvendo modelos grandes, oferecendo desempenho impressionante graças à capacidade do Superchip GB10 de atingir PFLOPS em FP4. No entanto, para aplicações que enfatizam a baixa latência de resposta — um aspecto crucial para cargas de trabalho de inferência em tempo real — a plataforma AMD apresenta uma alternativa comparável a um custo significativamente menor.

Para reforçar ainda mais essa perspectiva, o mini-PC EVO-X2 da GMKtec tem preço de US$ 2.199 para a configuração mais completa (128 GB de RAM e 2 TB de armazenamento), em contraste com o preço de US$ 4.000 do DGX Spark — tornando a relação custo-benefício entre o Strix Halo e o GB10 notavelmente atraente. Para empresas que buscam implementar modelos de IA localizados sem comprometer seus orçamentos, o EVO-X2 surge como uma opção viável e acessível de estação de trabalho.
Deixe um comentário