Avec ses prochaines séries Instinct MI400 et MI500, AMD se prépare à relever un défi de taille sur le marché des accélérateurs d’IA, se positionnant ainsi pour concurrencer la domination actuelle de NVIDIA.
Présentation de la série AMD MI400 : variantes et fonctionnalités pour 2027
Lors de la Journée des analystes financiers 2025, AMD a présenté ses futurs accélérateurs GPU IA des séries MI400 et MI500, soulignant leur rôle dans la stratégie IA à long terme de l’entreprise. Ce cycle de lancement annuel vise à consolider la présence d’AMD dans le domaine de l’IA, tandis que NVIDIA reste leader sur ce marché.

La série MI400, dont le lancement est prévu l’année prochaine, promet plusieurs avancées :
- Capacité et bande passante HBM4 améliorées
- Prise en charge étendue des formats d’IA avec un débit accru
- Réseaux standardisés à l’échelle du rack (UALoE, UAL, UEC)
La série MI400 est présentée comme atteignant 40 PFLOPS (FP4) et 20 PFLOPS (FP8), doublant ainsi le débit de calcul de la série MI350 actuellement populaire.

De plus, la série MI400 exploitera la technologie de mémoire HBM4, offrant une capacité mémoire 50 % supérieure aux 288 Go HBM3e précédents, pour atteindre 432 Go HBM4. Cette mise à niveau se traduit par une bande passante mémoire impressionnante de 19, 6 To/s, surpassant largement les 8 To/s de la série MI350. Chaque GPU de cette série bénéficie d’une bande passante horizontale de 300 Go/s, ce qui représente un bond en avant majeur pour la nouvelle génération de la gamme Instinct d’AMD.

Comparées aux cartes graphiques Vera Rubin de NVIDIA, les cartes graphiques Instinct MI400 d’AMD présentent des avantages notables :
- Capacité de mémoire 1, 5 fois supérieure à celle de la concurrence
- Bande passante mémoire équivalente et FLOPs (FP4 / FP8)
- Bande passante d’extension 1, 5 fois supérieure

La série MI400 se compose de deux modèles principaux : le MI455X, destiné aux charges de travail d’entraînement et d’inférence d’IA évolutives, et le MI430X, conçu pour les tâches HPC et d’IA souveraine, doté de capacités FP64 matérielles, d’un calcul hybride (CPU+GPU) et conservant la même mémoire HBM4 que son homologue.

D’ici 2027, AMD prévoit de lancer la série Instinct MI500, poursuivant ainsi son cycle annuel de renouvellement de produits. Cette stratégie vise à accélérer les progrès en matière de technologie d’IA pour centres de données, à l’instar de l’approche de NVIDIA qui propose des versions standard et « Ultra ».La série MI500 devrait considérablement améliorer les capacités de calcul, de mémoire et d’interconnexion, renforçant ainsi l’avantage concurrentiel d’AMD dans le domaine de l’IA.
Comparaison des accélérateurs d’IA AMD Instinct
| Nom de l’accélérateur | AMD Instinct MI500 | AMD Instinct MI400 | AMD Instinct MI350X | AMD Instinct MI325X | AMD Instinct MI300X | AMD Instinct MI250X |
|---|---|---|---|---|---|---|
| Architecture GPU | CDNA Next / UDNA | CDNA 5 | CDNA 4 | Aqua Vanjaram (CDNA 3) | Aqua Vanjaram (CDNA 3) | Aldébaran (ADNc 2) |
| Nœud de traitement GPU | À déterminer | À déterminer | 3 nm | 5 nm + 6 nm | 5 nm + 6 nm | 6 nm |
| XCD (Chiplets) | À déterminer | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM ; 1 par matrice) |
| Cœurs GPU | À déterminer | À déterminer | 16 384 | 19 456 | 19 456 | 14 080 |
| Fréquence d’horloge du GPU (Max) | À déterminer | À déterminer | 2400 MHz | 2100 MHz | 2100 MHz | 1700 MHz |
| INT8 Calculer | À déterminer | À déterminer | 5200 TOPS | 2614 TOPS | 2614 TOPS | 383 TOPs |
| Matrice FP6/FP4 | À déterminer | 40 PFLOPS | 20 PFLOPS | N / A | N / A | N / A |
| Matrice FP8 | À déterminer | 20 PFLOPS | 5 PFLOPS | 2, 6 PFLOPS | 2, 6 PFLOPS | N / A |
| Matrice FP16 | À déterminer | 10 PFLOPS | 2, 5 PFLOPS | 1, 3 PFLOPS | 1, 3 PFLOPS | 383 TFLOPS |
| Vecteur FP32 | À déterminer | À déterminer | 157, 3 TFLOPS | 163, 4 TFLOPS | 163, 4 TFLOPS | 95, 7 TFLOPS |
| Vecteur FP64 | À déterminer | À déterminer | 78, 6 TFLOPS | 81, 7 TFLOPS | 81, 7 TFLOPS | 47, 9 TFLOPS |
| VRAM | À déterminer | 432 Go HBM4 | 288 Go HBM3e | 256 Go HBM3e | 192 Go HBM3 | 128 Go HBM2e |
| Cache infini | À déterminer | À déterminer | 256 Mo | 256 Mo | 256 Mo | N / A |
| Horloge à mémoire | À déterminer | 19, 6 To/s | 8, 0 Gbit/s | 5, 9 Gbit/s | 5, 2 Gbit/s | 3, 2 Gbit/s |
| Bus mémoire | À déterminer | À déterminer | 8192 bits | 8192 bits | 8192 bits | 8192 bits |
| Bande passante de la mémoire | À déterminer | À déterminer | 8 To/s | 6, 0 To/s | 5, 3 To/s | 3, 2 To/s |
| Facteur de forme | À déterminer | À déterminer | OAM | OAM | OAM | OAM |
| Refroidissement | À déterminer | À déterminer | Passif / Liquide | Refroidissement passif | Refroidissement passif | Refroidissement passif |
| TDP (Max) | À déterminer | À déterminer | 1400W (355X) | 1000W | 750 W | 560 W |
Laisser un commentaire