A AMD se prepara para desafiar a liderança da NVIDIA em IA com os aceleradores MI400 “MI455X e MI430X” em 2026, além do futuro MI500 para 2027.

A AMD está se preparando para um desafio significativo no mercado de aceleradores de IA com suas próximas séries Instinct MI400 e MI500, posicionando-se para competir com o atual domínio da NVIDIA.

Apresentando a série AMD MI400: variantes e recursos para 2027

No Financial Analyst Day 2025, a AMD apresentou suas próximas GPUs aceleradoras de IA das séries MI400 e MI500, enfatizando seu papel na estratégia de IA de longo prazo da empresa. Este ciclo de lançamento anual visa fortalecer a presença da AMD em IA, enquanto a NVIDIA continua a liderar o setor.

AMD Instinct: Roteiro da arquitetura de GPUs para data centers com especificações para as séries MI300 a MI500

Com estreia prevista para o próximo ano, a série MI400 promete diversos avanços:

Capacidade e largura de banda HBM4 aprimoradas
Suporte mais amplo a formatos de IA com maior capacidade de processamento.
Redes padronizadas em escala de rack (UALoE, UAL, UEC)

A série MI400 promete atingir 40 PFLOPS (FP4) e 20 PFLOPS (FP8), efetivamente dobrando a capacidade computacional da popular série MI350.

Principais especificações da série AMD Instinct MI450, incluindo '40 PF', '432 GB' de memória HBM4 e largura de banda de '3, 6 TB/s'.

Além disso, a série MI400 utilizará a tecnologia de memória HBM4, apresentando um aumento de 50% na capacidade de memória, passando dos 288 GB de HBM3e anteriores para expressivos 432 GB de HBM4. Essa atualização resulta em uma impressionante largura de banda de memória de 19, 6 TB/s, superando significativamente os 8 TB/s da série MI350. Cada GPU desta série possui uma largura de banda de expansão de 300 GB/s, indicando um grande avanço para a linha Instinct de próxima geração da AMD.

Tabela comparativa: Liderança em desempenho em escala de rack com a série MI450 contra a Nvidia Vera Rubin

Quando comparadas com a Vera Rubin da NVIDIA, as GPUs Instinct MI400 da AMD apresentam vantagens notáveis:

Capacidade de memória 1, 5 vezes maior em comparação com a concorrência.
Largura de banda de memória equivalente e FLOPs (FP4 / FP8)
Largura de banda de expansão 1, 5 vezes maior

Portfólio da série AMD Instinct MI400, apresentando o MI455X para treinamento e inferência de IA e o MI430X para HPC.

A série MI400 consiste em dois modelos principais: o MI455X, voltado para cargas de trabalho escaláveis de treinamento e inferência de IA, e o MI430X, projetado para tarefas de HPC e IA soberana, com recursos FP64 baseados em hardware, computação híbrida (CPU+GPU) e mantendo a mesma memória HBM4 que seu equivalente.

AMD Instinct: Roteiro da arquitetura de GPUs para data centers, da série MI300 à MI500

Olhando para o futuro, em 2027, a AMD planeja lançar a série Instinct MI500, dando continuidade ao seu ciclo anual de atualização de produtos. Essa estratégia visa proporcionar avanços rápidos na tecnologia de IA para data centers, alinhando-se à abordagem da NVIDIA de oferecer versões padrão e “Ultra”.Espera-se que a série MI500 aprimore significativamente os recursos de computação, memória e interconexão, aumentando ainda mais a vantagem competitiva da AMD no cenário de IA.

Comparação dos aceleradores de IA AMD Instinct

Nome da aceleradora	AMD Instinct MI500	AMD Instinct MI400	AMD Instinct MI350X	AMD Instinct MI325X	AMD Instinct MI300X	AMD Instinct MI250X
Arquitetura de GPU	CDNA Next / UDNA	CDNA 5	CDNA 4	Água Vanjaram (CDNA 3)	Água Vanjaram (CDNA 3)	Aldebaran (CDNA 2)
Nó de processamento da GPU	A definir	A definir	3nm	5nm+6nm	5nm+6nm	6 nm
XCDs (Chiplets)	A definir	8 (MCM)	8 (MCM)	8 (MCM)	8 (MCM)	2 (MCM; 1 por dado)
Núcleos da GPU	A definir	A definir	16.384	19.456	19.456	14.080
Velocidade do clock da GPU (máxima)	A definir	A definir	2400 MHz	2100 MHz	2100 MHz	1700 MHz
INT8 Calcular	A definir	A definir	5200 TOPS	2614 TOPS	2614 TOPS	383 TOPs
Matriz FP6/FP4	A definir	40 PFLOPs	20 PFLOPs	N / D	N / D	N / D
Matriz FP8	A definir	20 PFLOPs	5 PFLOPs	2, 6 PFLOPs	2, 6 PFLOPs	N / D
Matriz FP16	A definir	10 PFLOPs	2, 5 PFLOPs	1, 3 PFLOPs	1, 3 PFLOPs	383 TFLOPs
Vetor FP32	A definir	A definir	157, 3 TFLOPs	163, 4 TFLOPs	163, 4 TFLOPs	95, 7 TFLOPs
Vetor FP64	A definir	A definir	78, 6 TFLOPs	81, 7 TFLOPs	81, 7 TFLOPs	47, 9 TFLOPs
VRAM	A definir	432 GB HBM4	288 GB HBM3e	256 GB HBM3e	192 GB HBM3	128 GB HBM2e
Cache infinito	A definir	A definir	256 MB	256 MB	256 MB	N / D
Relógio de memória	A definir	19, 6 TB/s	8, 0 Gbps	5, 9 Gbps	5, 2 Gbps	3, 2 Gbps
Ônibus da Memória	A definir	A definir	8192 bits	8192 bits	8192 bits	8192 bits
Largura de banda da memória	A definir	A definir	8 TB/s	6, 0 TB/s	5, 3 TB/s	3, 2 TB/s
Fator de forma	A definir	A definir	OAM	OAM	OAM	OAM
Resfriamento	A definir	A definir	Passivo / Líquido	Resfriamento passivo	Resfriamento passivo	Resfriamento passivo
TDP (máx.)	A definir	A definir	1400W (355X)	1000W	750W	560W