
A AMD revelou informações detalhadas sobre sua nova GPU Radeon AI PRO R9700, destacando suas capacidades em tarefas de inteligência artificial em comparação com o modelo Radeon PRO W7800 existente.
Radeon AI PRO R9700 da AMD: um salto na capacidade de IA
Em um movimento significativo, a AMD atualizou seu ecossistema de software para incluir o ROCm 7, posicionando sua abordagem de acelerador de IA em três categorias estratégicas. Entre elas:
- **APUs Ryzen AI MAX:** Destinados a modelos de linguagem (LLMs) de pequeno a médio porte.
- **GPUs Radeon AI PRO:** otimizadas para inferência de borda multi-GPU e LLMs pequenos a médios.
- **Aceleradores de IA Instinct:** Projetados para grandes LLMs focados em inferência e treinamento em escala de rack.
Embora a série MI350 tenha sido detalhada, os holofotes estão voltados para a série Radeon AI PRO da AMD, onde o R9700 promete avanços substanciais no desempenho da IA.
Especificações e métricas de desempenho
A Radeon AI PRO R9700 é construída na arquitetura Navi 48 e equipada com 64 unidades de computação, o que equivale a 4.096 processadores de fluxo. Esta GPU apresenta:
- **Aceleradores de IA:** 128 unidades para computação aprimorada.
- **Potência do projeto térmico:** Máximo de 300 W.
- **Memória:** 32 GB de GDDR6 em um barramento de 256 bits, efetivamente dobrando a VRAM da Radeon 9070 XT.
Em termos de poder computacional bruto, a AMD relatou:
- **Cálculo do FP16:** 96 TFLOPs.
- **INT4 (Esparso):** 1531 TOPS.
A R9700 visa facilitar a conclusão eficiente de modelos sofisticados de IA, tornando-se uma opção atraente para cargas de trabalho avançadas de IA local. Modelos notáveis prontos para utilizar esta GPU incluem:
- DeepSeek R1 Destilador Qwen 32B Q6
- Mistral Pequeno 3.1 24B Instrução 2503 Q8
- Fluxo 1 Rápido
- SD 3.5 Médio
Vantagens Competitivas e Comparações
As avaliações de desempenho indicam que a R9700 opera com o dobro da velocidade da Radeon PRO W7800 no cenário DeepSeek R1. Além disso, comparações com a RTX 5080, que possui um buffer de VRAM de 16 GB, revelam que a R9700 pode ter um desempenho até cinco vezes mais rápido, graças à sua substancial capacidade de memória.
Capacidades de computação impressionantes
Métricas de computação detalhadas para a Radeon AI PRO R9700 ilustram seu formidável poder de processamento de IA:
- **FP32:** 47, 8 TFLOPs.
- **FP16/BF16:** 191, 4 TFLOPs.
- **FP8:** 382, 7 TFLOPs.
- **INT8:** 382, 7 TOPS.
- **INT4:** 765, 5 TOPS.
As principais tecnologias de suporte, como instruções Wave Matrix Multiply Accumulate (WMMA) e escassez estruturada, aumentam significativamente suas métricas de desempenho.
Suporte e escalabilidade do modelo
Em particular, a AMD enfatiza que o suporte a modelos maiores é fundamental para resultados superiores em tarefas de IA. Por exemplo, um modelo de texto para imagem classificado como 8B operando em FP16 pode produzir resultados muito superiores em comparação com um modelo 1B. Da mesma forma, o uso de modelos de maior capacidade, como um 32B de 6 bits, pode aumentar a precisão em relação a uma configuração de 8B de 6 bits.
Além disso, o R9700 pode ser integrado a uma configuração multi-GPU de 4 vias em uma plataforma PCIe 5.0 contemporânea, permitindo um pool de memória impressionante de 128 GB. Essa capacidade pode acomodar modelos exigentes como o Mistral 123B e o DeepSeek R1 70B, que exigem de 112 a 116 GB de VRAM durante a operação.
Lançamento e disponibilidade
A expectativa está aumentando, já que a AMD Radeon AI PRO R9700 deve ser lançada em julho, com disponibilidade por meio de parceiros confiáveis, incluindo:
- ASUS
- ASRock
- Gigabyte
- PowerColor
- Safira
- XFX
- Yeston
Esta GPU contará com um design de slot duplo completo com um cooler, visando melhorar seu desempenho e gerenciamento térmico.

Comparação com gráficos Radeon Pro Workstation
Nome da placa gráfica | Radeon R9700 | Radeon Pro W7900 | Radeon Pro W7800 | Radeon Pro W6900X | Radeon Pro W6800 | Radeon Pro VII | Radeon Pro W5700X | Radeon Pro W5700 | Radeon Pro WX 9100 | Radeon Pro WX 8200 | Radeon Pro WX 7100 |
---|---|---|---|---|---|---|---|---|---|---|---|
GPU | Navi 48 | Navi 31 | Navi 31 | Navi 21 | Navi 21 | Vega 20 | Navi 10 | Navi 10 | Vega 10 | Vega 10 | Polaris 10 |
Nó de Processo | 4 nm | 5 nm + 6 nm | 5 nm + 6 nm | 7 nm | 7 nm | 7 nm | 7 nm | 7 nm | 14 nm | 14 nm | 14 nm |
Unidades de Computação | 64 CU | 96 CU | 70 CU | 80 | 60 | 60 | 40 | 36 | 64 | 56 | 36 |
Processadores de fluxo | 4096 | 6144 | 4480 | 5120 | 3840 | 3840 | 2560 | 2304 | 4096 | 3584 | 2304 |
Velocidade do relógio (pico) | A definir | ~2, 5 GHz | ~2, 5 GHz | 2171 MHz | 2320 MHz | 1700 MHz | 2040 MHz | 1930 MHz | 1500 MHz | 1500 MHz | 1243 MHz |
VRAM | 32 GB GDDR6 | 48 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 16 GB HBM2 | 16 GB GDDR6 | 8 GB GDDR6 | 16 GB HBM2 | 8 GB HBM2 | 8 GB GDDR5 |
Largura de banda de memória | 640 GB/s | 864 GB/s | 576 GB/s | 512 GB/s | 512 GB/s | 1024 GB/s | 448 GB/s | 448 GB/s | 512 GB/s | 484 GB/s | 224 GB/s |
Barramento de memória | 256 bits | 384 bits | 256 bits | 256 bits | 256 bits | 4096 bits | 256 bits | 256 bits | 2048 bits | 2048 bits | 256 bits |
Taxa de computação (FP32) | 48 TFLOPs | 61, 3 TFLOPs | 45, 2 TFLOPs | 22.23 TFLOPs | 17, 82 TFLOPs | 13.1 TFLOPs | 9, 5 TFLOPs | 8, 89 TFLOPs | 12.3 TFLOPs | 10, 8 TFLOPs | 5.7 TFLOPs |
TDP | 300 W | 295 W | 260 W | 300 W | 250 W | 250 W | 240 W | 205 W | 250 W | 230 W | 150 W |
Preço | A definir | US$ 3.999 | US$ 2.499 | US$ 5.999 | US$ 2.249 | US$ 1.899 | US$ 999 | US$ 799 | US$ 2.199 | US$ 999 | US$ 799 |
Lançar | 2025 | 2023 | 2023 | 2021 | 2021 | 2020 | 2019 | 2019 | 2017 | 2018 | 2016 |
Deixe um comentário