Mini PC Strix Halo da AMD: a alternativa acessível ao supercomputador DGX Spark da NVIDIA, que custa US$ 4.000.

Mini PC Strix Halo da AMD: a alternativa acessível ao supercomputador DGX Spark da NVIDIA, que custa US$ 4.000.

A NVIDIA causou grande impacto na indústria de tecnologia com o lançamento do DGX Spark, um sistema compacto desenvolvido especificamente para cargas de trabalho de inteligência artificial (IA).Simultaneamente, a AMD vem fazendo progressos significativos com sua série de APUs, particularmente a Strix Halo APU, que, segundo relatos, supera o chipset GB10 da NVIDIA em diversas métricas de desempenho de IA. Essa competição emergente levanta questões sobre eficiência e custo-benefício no segmento de computação de alto desempenho.

NVIDIA DGX Spark vs. AMD Strix Halo: Análise de custo-benefício

O DGX Spark se destaca como a oferta inaugural da NVIDIA no segmento de sistemas compactos voltados para aplicações de IA, apresentando o chip personalizado GB10 de última geração. Apesar de seus recursos avançados, muitos consumidores em potencial expressaram preocupação com seu preço elevado, estimado em cerca de US$ 4.000, o que limita significativamente seu apelo. Em contrapartida, a GMKtec, uma fabricante renomada de mini-PCs, apresenta uma alternativa atraente: o EVO-X2, equipado com a APU Strix Halo da AMD, disponível por quase metade desse preço.

Uma vista explodida detalhada do Superchip GB10 da NVIDIA, mostrando componentes como a GPU Blackwell com '1 PFLOP FP4 AI Compute', a CPU Grace com '20 núcleos Arm', memória unificada de alta largura de banda com '128 GB Low-Power DDR5X' e interfaces de conectividade, incluindo Wi-Fi, Bluetooth e USB.
DGX Spark | Créditos da imagem: NVIDIA

Em uma publicação recente no blog, a GMKtec colocou o DGX Spark à prova contra o seu mini-PC EVO-X2. Essa comparação destacou a capacidade da APU Strix Halo de superar a solução da NVIDIA em diversas áreas importantes, como velocidade de geração de tokens e tempo de resposta. Os testes utilizaram uma variedade de modelos de código aberto, incluindo Llama 3.3 70B, Qwen3 Coder, GPT-OSS 20B e Qwen3 0.6B, apresentando resultados impressionantes.

Modelo de teste Métrica EVO – X2 NVIDIA GB10 Ganhador
Ligue para 3.3 70B Velocidade de geração (tok/seg) 4, 9 4, 67 AMD
Tempo de resposta do primeiro token (s) 0, 86 0, 53 NVIDIA
Qwen3 Coder Velocidade de geração (tok/seg) 35.13 38.03 NVIDIA
Tempo de resposta do primeiro token (s) 0, 13 0, 42 AMD
GPT-OSS 20B Velocidade de geração (tok/seg) 64, 69 60, 33 AMD
Tempo de resposta do primeiro token (s) 0, 19 0, 44 AMD
Modelo Qwen3 0.6B Velocidade de geração (tok/seg) 163, 78 174, 29 NVIDIA
Tempo de resposta do primeiro token (s) 0, 02 0, 03 AMD

De acordo com as avaliações da GMKtec, o processador Ryzen AI Max+ 395 presente na APU Strix Halo se destaca com modelos de parâmetros mais abrangentes, apresentando uma clara vantagem nos tempos de resposta do primeiro token devido à integração eficaz das arquiteturas de CPU, GPU e NPU. O mecanismo XDNA 2 aprimora o processamento de IA, resultando em menor latência nas saídas.

Por outro lado, os pontos fortes da NVIDIA se destacam em cenários que priorizam a taxa de transferência em vez da latência de memória. O DGX Spark é particularmente adequado para configurações de alta taxa de transferência envolvendo modelos grandes, oferecendo desempenho impressionante graças à capacidade do Superchip GB10 de atingir PFLOPS em FP4. No entanto, para aplicações que enfatizam a baixa latência de resposta — um aspecto crucial para cargas de trabalho de inferência em tempo real — a plataforma AMD apresenta uma alternativa comparável a um custo significativamente menor.

Um chip AMD Ryzen AI MAX Series com a marca visível é exibido em frente a um fundo geométrico e luminoso.
Créditos da imagem: AMD

Para reforçar ainda mais essa perspectiva, o mini-PC EVO-X2 da GMKtec tem preço de US$ 2.199 para a configuração mais completa (128 GB de RAM e 2 TB de armazenamento), em contraste com o preço de US$ 4.000 do DGX Spark — tornando a relação custo-benefício entre o Strix Halo e o GB10 notavelmente atraente. Para empresas que buscam implementar modelos de IA localizados sem comprometer seus orçamentos, o EVO-X2 surge como uma opção viável e acessível de estação de trabalho.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *