AMD Instinct MI400 Accelerator: 40 PFLOPs Rechenleistung, 432 GB HBM4-Speicher mit 19,6 TB/s, Markteinführung 2026

AMD Instinct MI400 Accelerator: 40 PFLOPs Rechenleistung, 432 GB HBM4-Speicher mit 19,6 TB/s, Markteinführung 2026

Neben der kürzlichen Vorstellung der MI350-Serie bietet AMD eine spannende Vorschau auf die kommende Instinct MI400-Serie der nächsten Generation, die 2026 auf den Markt kommen soll.

Hervorhebung der außergewöhnlichen Funktionen des AMD Instinct MI400

AMDs Instinct MI400-Beschleuniger scheint die Hardware-Fähigkeiten deutlich zu verbessern und bietet eine Rechenleistung, die fast doppelt so hoch ist wie die der MI350-Serie. Offizielle Spezifikationen besagen, dass der MI400 beeindruckende 40 PFLOPs für FP4-Operationen und 20 PFLOPs für FP8-Berechnungen liefern wird, was die Rechenleistung im Vergleich zur aktuellen MI350-Serie effektiv verdoppelt.

AMD nutzt die Vorteile der HBM4-Speichertechnologie für die MI400-Serie. Die neue Generation bietet eine um 50 % höhere Speicherkapazität von 288 GB HBM3e auf 432 GB HBM4. Der HBM4-Standard ermöglicht eine Bandbreite von 19, 6 TB/s – mehr als das Doppelte der 8 TB/s der MI350-Serie. Jede GPU unterstützt zudem eine Scale-Out-Bandbreite von 300 GB/s, was eine deutliche Leistungssteigerung für die kommende Generation der Instinct-Beschleuniger bedeutet.

In früheren Ankündigungen wurde bereits die Integration von bis zu vier Accelerated Compute Dies (XCDs) in den Instinct MI400-Beschleuniger enthüllt. Dies stellt einen deutlichen Fortschritt gegenüber den zwei XCDs der MI300-Modelle dar. Der MI400 verfügt über zwei Active Interposer Dies (AIDs) und trennt die Multimedia- und I/O-Dies, was die Gesamtfunktionalität und Effizienz verbessert.

MI400-Patch
Bildquelle: FreeDesktop.org

Jedes AID wird mit einem dedizierten MID-Tile ausgestattet sein, der eine optimierte Kommunikation zwischen den Recheneinheiten und den E/A-Schnittstellen gewährleistet – eine Verbesserung gegenüber früheren Generationen. Die MI350-Serie nutzte bereits Infinity Fabric für die Kommunikation zwischen den Chips, sodass wir mit der Architektur des MI400 noch größere Fortschritte erwarten können.

Fokus auf groß angelegte KI-Aufgaben

Die MI400-Serie zielt darauf ab, den wachsenden Anforderungen groß angelegter KI-Trainings- und Inferenzaufgaben gerecht zu werden und nutzt dabei die neue CDNA-Next-Architektur, die im Rahmen der Bemühungen zur Vereinheitlichung der RDNA- und CDNA-Architekturen für AMD möglicherweise in UDNA umbenannt wird.

Vergleich der AMD Instinct KI-Beschleuniger

Beschleunigername AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
GPU-Architektur CDNA Next / UDNA CDNA 4 Aqua Vanjaram (CDNA 3) Aqua Vanjaram (CDNA 3) Aldebaran (CDNA 2)
GPU-Prozessknoten Wird noch bekannt gegeben 3 nm 5 nm + 6 nm 5 nm + 6 nm 6 nm
XCDs (Chiplets) 8 (MCM) 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM), 1 (pro Würfel)
GPU-Kerne Wird noch bekannt gegeben Wird noch bekannt gegeben 19.456 19.456 14.080
GPU-Taktfrequenz Wird noch bekannt gegeben Wird noch bekannt gegeben 2100 MHz 2100 MHz 1700 MHz
INT8-Berechnung Wird noch bekannt gegeben Wird noch bekannt gegeben 2614 TOPS 2614 TOPS 383 TOPs
FP6/FP4-Berechnung Wird noch bekannt gegeben 20 PFLOPs N / A N / A N / A
FP8-Berechnung Wird noch bekannt gegeben 10 PFLOPs 2.6 PFLOPs 2.6 PFLOPs N / A
FP16-Berechnung Wird noch bekannt gegeben 5 PFLOPs 1.3 PFLOPs 1.3 PFLOPs 383 TFLOPs
FP32-Berechnung Wird noch bekannt gegeben Wird noch bekannt gegeben 163, 4 TFLOPs 163, 4 TFLOPs 95, 7 TFLOPs
FP64-Rechner Wird noch bekannt gegeben 79 TFLOPs 81, 7 TFLOPs 81, 7 TFLOPs 47, 9 TFLOPs
VRAM Wird noch bekannt gegeben 288 HBM3e 256 GB HBM3e 192 GB HBM3 128 GB HBM2e
Infinity Cache Wird noch bekannt gegeben Wird noch bekannt gegeben 256 MB 256 MB N / A
Speichertakt Wird noch bekannt gegeben 8, 0 Gbit/s 5, 9 Gbit/s 5, 2 Gbit/s 3, 2 Gbit/s
Speicherbus Wird noch bekannt gegeben 8192 Bit 8192 Bit 8192 Bit 8192 Bit
Speicherbandbreite Wird noch bekannt gegeben 8 TB/s 6, 0 TB/s 5, 3 TB/s 3, 2 TB/s
Formfaktor Wird noch bekannt gegeben OAM OAM OAM OAM
Kühlung Wird noch bekannt gegeben Passive Kühlung Passive Kühlung Passive Kühlung Passive Kühlung
TDP (Max.) Wird noch bekannt gegeben 1400 W (355X) 1000 W 750 W 560 W

Ausführlichere Informationen und Einblicke finden Sie im vollständigen Artikel zu den kommenden Innovationen von AMD.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert