A GPU AMD Radeon AI PRO R9700 oferece 4x mais TOPS e 2x mais desempenho de IA em comparação com a Radeon PRO W7800

A AMD revelou informações detalhadas sobre sua nova GPU Radeon AI PRO R9700, destacando suas capacidades em tarefas de inteligência artificial em comparação com o modelo Radeon PRO W7800 existente.

Radeon AI PRO R9700 da AMD: um salto na capacidade de IA

Em um movimento significativo, a AMD atualizou seu ecossistema de software para incluir o ROCm 7, posicionando sua abordagem de acelerador de IA em três categorias estratégicas. Entre elas:

**APUs Ryzen AI MAX:** Destinados a modelos de linguagem (LLMs) de pequeno a médio porte.
**GPUs Radeon AI PRO:** otimizadas para inferência de borda multi-GPU e LLMs pequenos a médios.
**Aceleradores de IA Instinct:** Projetados para grandes LLMs focados em inferência e treinamento em escala de rack.

Embora a série MI350 tenha sido detalhada, os holofotes estão voltados para a série Radeon AI PRO da AMD, onde o R9700 promete avanços substanciais no desempenho da IA.

Especificações e métricas de desempenho

A Radeon AI PRO R9700 é construída na arquitetura Navi 48 e equipada com 64 unidades de computação, o que equivale a 4.096 processadores de fluxo. Esta GPU apresenta:

**Aceleradores de IA:** 128 unidades para computação aprimorada.
**Potência do projeto térmico:** Máximo de 300 W.
**Memória:** 32 GB de GDDR6 em um barramento de 256 bits, efetivamente dobrando a VRAM da Radeon 9070 XT.

Em termos de poder computacional bruto, a AMD relatou:

**Cálculo do FP16:** 96 TFLOPs.
**INT4 (Esparso):** 1531 TOPS.

A R9700 visa facilitar a conclusão eficiente de modelos sofisticados de IA, tornando-se uma opção atraente para cargas de trabalho avançadas de IA local. Modelos notáveis prontos para utilizar esta GPU incluem:

DeepSeek R1 Destilador Qwen 32B Q6
Mistral Pequeno 3.1 24B Instrução 2503 Q8
Fluxo 1 Rápido
SD 3.5 Médio

Vantagens Competitivas e Comparações

As avaliações de desempenho indicam que a R9700 opera com o dobro da velocidade da Radeon PRO W7800 no cenário DeepSeek R1. Além disso, comparações com a RTX 5080, que possui um buffer de VRAM de 16 GB, revelam que a R9700 pode ter um desempenho até cinco vezes mais rápido, graças à sua substancial capacidade de memória.

Capacidades de computação impressionantes

Métricas de computação detalhadas para a Radeon AI PRO R9700 ilustram seu formidável poder de processamento de IA:

**FP32:** 47, 8 TFLOPs.
**FP16/BF16:** 191, 4 TFLOPs.
**FP8:** 382, 7 TFLOPs.
**INT8:** 382, 7 TOPS.
**INT4:** 765, 5 TOPS.

As principais tecnologias de suporte, como instruções Wave Matrix Multiply Accumulate (WMMA) e escassez estruturada, aumentam significativamente suas métricas de desempenho.

Suporte e escalabilidade do modelo

Em particular, a AMD enfatiza que o suporte a modelos maiores é fundamental para resultados superiores em tarefas de IA. Por exemplo, um modelo de texto para imagem classificado como 8B operando em FP16 pode produzir resultados muito superiores em comparação com um modelo 1B. Da mesma forma, o uso de modelos de maior capacidade, como um 32B de 6 bits, pode aumentar a precisão em relação a uma configuração de 8B de 6 bits.

Além disso, o R9700 pode ser integrado a uma configuração multi-GPU de 4 vias em uma plataforma PCIe 5.0 contemporânea, permitindo um pool de memória impressionante de 128 GB. Essa capacidade pode acomodar modelos exigentes como o Mistral 123B e o DeepSeek R1 70B, que exigem de 112 a 116 GB de VRAM durante a operação.

Lançamento e disponibilidade

A expectativa está aumentando, já que a AMD Radeon AI PRO R9700 deve ser lançada em julho, com disponibilidade por meio de parceiros confiáveis, incluindo:

ASUS
ASRock
Gigabyte
PowerColor
Safira
XFX
Yeston

Esta GPU contará com um design de slot duplo completo com um cooler, visando melhorar seu desempenho e gerenciamento térmico.

Comparação com gráficos Radeon Pro Workstation

Nome da placa gráfica	Radeon R9700	Radeon Pro W7900	Radeon Pro W7800	Radeon Pro W6900X	Radeon Pro W6800	Radeon Pro VII	Radeon Pro W5700X	Radeon Pro W5700	Radeon Pro WX 9100	Radeon Pro WX 8200	Radeon Pro WX 7100
GPU	Navi 48	Navi 31	Navi 31	Navi 21	Navi 21	Vega 20	Navi 10	Navi 10	Vega 10	Vega 10	Polaris 10
Nó de Processo	4 nm	5 nm + 6 nm	5 nm + 6 nm	7 nm	7 nm	7 nm	7 nm	7 nm	14 nm	14 nm	14 nm
Unidades de Computação	64 CU	96 CU	70 CU	80	60	60	40	36	64	56	36
Processadores de fluxo	4096	6144	4480	5120	3840	3840	2560	2304	4096	3584	2304
Velocidade do relógio (pico)	A definir	~2, 5 GHz	~2, 5 GHz	2171 MHz	2320 MHz	1700 MHz	2040 MHz	1930 MHz	1500 MHz	1500 MHz	1243 MHz
VRAM	32 GB GDDR6	48 GB GDDR6	32 GB GDDR6	32 GB GDDR6	32 GB GDDR6	16 GB HBM2	16 GB GDDR6	8 GB GDDR6	16 GB HBM2	8 GB HBM2	8 GB GDDR5
Largura de banda de memória	640 GB/s	864 GB/s	576 GB/s	512 GB/s	512 GB/s	1024 GB/s	448 GB/s	448 GB/s	512 GB/s	484 GB/s	224 GB/s
Barramento de memória	256 bits	384 bits	256 bits	256 bits	256 bits	4096 bits	256 bits	256 bits	2048 bits	2048 bits	256 bits
Taxa de computação (FP32)	48 TFLOPs	61, 3 TFLOPs	45, 2 TFLOPs	22.23 TFLOPs	17, 82 TFLOPs	13.1 TFLOPs	9, 5 TFLOPs	8, 89 TFLOPs	12.3 TFLOPs	10, 8 TFLOPs	5.7 TFLOPs
TDP	300 W	295 W	260 W	300 W	250 W	250 W	240 W	205 W	250 W	230 W	150 W
Preço	A definir	US$ 3.999	US$ 2.499	US$ 5.999	US$ 2.249	US$ 1.899	US$ 999	US$ 799	US$ 2.199	US$ 999	US$ 799
Lançar	2025	2023	2023	2021	2021	2020	2019	2019	2017	2018	2016