A AMD está se preparando para um desafio significativo no mercado de aceleradores de IA com suas próximas séries Instinct MI400 e MI500, posicionando-se para competir com o atual domínio da NVIDIA.
Apresentando a série AMD MI400: variantes e recursos para 2027
No Financial Analyst Day 2025, a AMD apresentou suas próximas GPUs aceleradoras de IA das séries MI400 e MI500, enfatizando seu papel na estratégia de IA de longo prazo da empresa. Este ciclo de lançamento anual visa fortalecer a presença da AMD em IA, enquanto a NVIDIA continua a liderar o setor.

Com estreia prevista para o próximo ano, a série MI400 promete diversos avanços:
- Capacidade e largura de banda HBM4 aprimoradas
- Suporte mais amplo a formatos de IA com maior capacidade de processamento.
- Redes padronizadas em escala de rack (UALoE, UAL, UEC)
A série MI400 promete atingir 40 PFLOPS (FP4) e 20 PFLOPS (FP8), efetivamente dobrando a capacidade computacional da popular série MI350.

Além disso, a série MI400 utilizará a tecnologia de memória HBM4, apresentando um aumento de 50% na capacidade de memória, passando dos 288 GB de HBM3e anteriores para expressivos 432 GB de HBM4. Essa atualização resulta em uma impressionante largura de banda de memória de 19, 6 TB/s, superando significativamente os 8 TB/s da série MI350. Cada GPU desta série possui uma largura de banda de expansão de 300 GB/s, indicando um grande avanço para a linha Instinct de próxima geração da AMD.

Quando comparadas com a Vera Rubin da NVIDIA, as GPUs Instinct MI400 da AMD apresentam vantagens notáveis:
- Capacidade de memória 1, 5 vezes maior em comparação com a concorrência.
- Largura de banda de memória equivalente e FLOPs (FP4 / FP8)
- Largura de banda de expansão 1, 5 vezes maior

A série MI400 consiste em dois modelos principais: o MI455X, voltado para cargas de trabalho escaláveis de treinamento e inferência de IA, e o MI430X, projetado para tarefas de HPC e IA soberana, com recursos FP64 baseados em hardware, computação híbrida (CPU+GPU) e mantendo a mesma memória HBM4 que seu equivalente.

Olhando para o futuro, em 2027, a AMD planeja lançar a série Instinct MI500, dando continuidade ao seu ciclo anual de atualização de produtos. Essa estratégia visa proporcionar avanços rápidos na tecnologia de IA para data centers, alinhando-se à abordagem da NVIDIA de oferecer versões padrão e “Ultra”.Espera-se que a série MI500 aprimore significativamente os recursos de computação, memória e interconexão, aumentando ainda mais a vantagem competitiva da AMD no cenário de IA.
Comparação dos aceleradores de IA AMD Instinct
| Nome da aceleradora | AMD Instinct MI500 | AMD Instinct MI400 | AMD Instinct MI350X | AMD Instinct MI325X | AMD Instinct MI300X | AMD Instinct MI250X |
|---|---|---|---|---|---|---|
| Arquitetura de GPU | CDNA Next / UDNA | CDNA 5 | CDNA 4 | Água Vanjaram (CDNA 3) | Água Vanjaram (CDNA 3) | Aldebaran (CDNA 2) |
| Nó de processamento da GPU | A definir | A definir | 3nm | 5nm+6nm | 5nm+6nm | 6 nm |
| XCDs (Chiplets) | A definir | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM; 1 por dado) |
| Núcleos da GPU | A definir | A definir | 16.384 | 19.456 | 19.456 | 14.080 |
| Velocidade do clock da GPU (máxima) | A definir | A definir | 2400 MHz | 2100 MHz | 2100 MHz | 1700 MHz |
| INT8 Calcular | A definir | A definir | 5200 TOPS | 2614 TOPS | 2614 TOPS | 383 TOPs |
| Matriz FP6/FP4 | A definir | 40 PFLOPs | 20 PFLOPs | N / D | N / D | N / D |
| Matriz FP8 | A definir | 20 PFLOPs | 5 PFLOPs | 2, 6 PFLOPs | 2, 6 PFLOPs | N / D |
| Matriz FP16 | A definir | 10 PFLOPs | 2, 5 PFLOPs | 1, 3 PFLOPs | 1, 3 PFLOPs | 383 TFLOPs |
| Vetor FP32 | A definir | A definir | 157, 3 TFLOPs | 163, 4 TFLOPs | 163, 4 TFLOPs | 95, 7 TFLOPs |
| Vetor FP64 | A definir | A definir | 78, 6 TFLOPs | 81, 7 TFLOPs | 81, 7 TFLOPs | 47, 9 TFLOPs |
| VRAM | A definir | 432 GB HBM4 | 288 GB HBM3e | 256 GB HBM3e | 192 GB HBM3 | 128 GB HBM2e |
| Cache infinito | A definir | A definir | 256 MB | 256 MB | 256 MB | N / D |
| Relógio de memória | A definir | 19, 6 TB/s | 8, 0 Gbps | 5, 9 Gbps | 5, 2 Gbps | 3, 2 Gbps |
| Ônibus da Memória | A definir | A definir | 8192 bits | 8192 bits | 8192 bits | 8192 bits |
| Largura de banda da memória | A definir | A definir | 8 TB/s | 6, 0 TB/s | 5, 3 TB/s | 3, 2 TB/s |
| Fator de forma | A definir | A definir | OAM | OAM | OAM | OAM |
| Resfriamento | A definir | A definir | Passivo / Líquido | Resfriamento passivo | Resfriamento passivo | Resfriamento passivo |
| TDP (máx.) | A definir | A definir | 1400W (355X) | 1000W | 750W | 560W |
Deixe um comentário