AMD Instinct MI400 trapelato negli ultimi aggiornamenti: dovrebbe avere fino a 8 chiplet su die a doppio interposer

AMD Instinct MI400 trapelato negli ultimi aggiornamenti: dovrebbe avere fino a 8 chiplet su die a doppio interposer

I prossimi acceleratori Instinct MI400 di AMD sono destinati a introdurre un’architettura trasformativa con die interposer dedicati che possono supportare fino a 8 chiplet. Questa innovazione rivoluzionaria è stata recentemente evidenziata in varie patch di sviluppo.

Presentazione degli acceleratori AMD Instinct MI400: svelate le caratteristiche principali

La prossima generazione di acceleratori Instinct di AMD, l’MI400, promette un cambiamento significativo nel design che incorpora tile avanzate. Mentre AMD continua a finalizzare l’MI350, con un rilascio pianificato per quest’anno, stanno emergendo informazioni preliminari sull’MI400, il cui lancio è previsto per il 2026.

Le recenti fughe di dati hanno rivelato dettagli intriganti riguardanti l’architettura dell’MI400. Sebbene AMD non abbia ancora reso pubbliche le specifiche complete, le patch recenti forniscono un’allettante anticipazione di cosa comporteranno i nuovi acceleratori.

In particolare, esaminati da Coelacanth Dream, gli aggiornamenti pubblicati su Free Desktop indicano che l’MI400 ora includerà fino a quattro XCD (Accelerated Compute Dies), un sostanziale aggiornamento rispetto ai due XCD per Active Interposer Die (AID) del modello precedente. Inoltre, l’MI400 implementerà due AID insieme a die Multimedia e I/O distinti.

Toppa MI400
Fonte dell’immagine: FreeDesktop.org

Ogni AID sarà dotato di una tile MID dedicata, progettata per ottimizzare la comunicazione tra unità di elaborazione e interfacce I/O, segnando un notevole progresso rispetto ai modelli precedenti. L’MI350 di AMD utilizza già Infinity Fabric per la comunicazione inter-die; tuttavia, i miglioramenti dell’MI400 sono mirati specificamente a soddisfare le esigenze di applicazioni di formazione e inferenza AI su larga scala. Questa nuova architettura, che probabilmente verrà rinominata UDNA nell’ambito della strategia di AMD per unificare le tecnologie RDNA e CDNA, mette in mostra l’impegno di AMD per l’innovazione.

AMD Instinct MI325X
Fonte dell’immagine: AMD

Parallelamente, AMD si sta preparando a svelare quest’anno gli acceleratori MI350 che impiegano l’architettura CDNA 4. Questi acceleratori sono destinati a fornire notevoli miglioramenti rispetto alla serie MI300, con un nodo di processo da 3 nm all’avanguardia e un’efficienza energetica migliorata. Le aspettative includono un aumento fino a 35 volte delle capacità di inferenza AI rispetto a MI300. I dettagli riguardanti le prestazioni di MI400 devono ancora essere divulgati, il che fa sì che la comunità attenda con ansia i prossimi annunci.

Panoramica delle specifiche: acceleratori AMD Instinct AI

Nome dell’acceleratore AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
Architettura GPU CDNA Avanti / UDNA CDNA4 Acqua Vanjaram (CDNA 3) Acqua Vanjaram (CDNA 3) Aldebaran (CDNA 2)
Nodo di processo GPU Da definire 3nm 5nm+6nm 5nm+6nm 6 miglia nautiche
XCD (Chiplet) 8 (M. C.M.) 8 (M. C.M.) 8 (M. C.M.) 8 (M. C.M.) 2 (MCM) 1 (per dado)
Core GPU Da definire Da definire 19.456 19.456 14.080
Velocità di clock della GPU Da definire Da definire 2100 MHz 2100 MHz 1700 MHz
Calcolo INT8 Da definire Da definire 2614 ALTI 2614 ALTI 383 TOP
Calcolo FP6/FP4 Da definire 9.2 PFLOP N / A N / A N / A
Calcolo FP8 Da definire 4.6 PFLOP 2.6 PFLOP 2.6 PFLOP N / A
Calcolo FP16 Da definire 2.3 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOP
Calcolo FP32 Da definire Da definire 163, 4 TFLOP 163, 4 TFLOP 95, 7 TFLOP
Calcolo FP64 Da definire Da definire 81, 7 TFLOP 81, 7 TFLOP 47, 9 TFLOP
Memoria virtuale Da definire 288 HBM3e 256 GB HBM3e 192 GB HBM3 128 GB HBM2e
Cache infinita Da definire Da definire 256 MB 256 MB N / A
Orologio di memoria Da definire 8, 0 Gbps? 5, 9 Gbps 5, 2 Gbps 3, 2 Gbps
Bus di memoria Da definire 8192 bit 8192 bit 8192 bit 8192 bit
Larghezza di banda della memoria Da definire 8 TB/s 6, 0 TB/s 5, 3 TB/s 3, 2 TB/s
Fattore di forma Da definire OAM OAM OAM OAM
Raffreddamento Da definire Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo Raffreddamento passivo
Potenza massima assorbita (TDP) Da definire Da definire 1000W 750W 560W

Per aggiornamenti dettagliati, fare riferimento alle informazioni condivise da Videocardz.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *