
Los próximos aceleradores Instinct MI400 de AMD están preparados para introducir una arquitectura transformadora que incluye matrices de interposición dedicadas que pueden admitir hasta 8 chiplets. Esta revolucionaria innovación se destacó recientemente en varios parches de desarrollo.
Presentamos los aceleradores AMD Instinct MI400: se revelan sus características principales
La próxima generación de aceleradores Instinct de AMD, el MI400, promete un cambio significativo en el diseño que incorpora módulos avanzados. Mientras AMD continúa ultimando los detalles del MI350, cuyo lanzamiento está previsto para este año, están surgiendo algunas ideas preliminares sobre el MI400, cuyo lanzamiento está previsto para 2026.
Las recientes filtraciones de datos han revelado detalles intrigantes sobre la arquitectura del MI400. Aunque AMD aún no ha revelado oficialmente las especificaciones completas, los parches recientes ofrecen una visión tentadora de lo que implicarán los nuevos aceleradores.
Reseñado por Coelacanth Dream, las actualizaciones publicadas en Free Desktop indican que el MI400 ahora incluirá hasta cuatro XCD (Accelerated Compute Dies), una mejora sustancial con respecto a los dos XCD por Active Interposer Die (AID) del modelo anterior. Además, el MI400 implementará dos AID junto con matrices multimedia y de E/S diferenciadas.

Cada AID contará con un mosaico MID dedicado diseñado para optimizar la comunicación entre las unidades de cómputo y las interfaces de E/S, lo que marca un avance notable con respecto a los modelos anteriores. El MI350 de AMD ya utiliza Infinity Fabric para la comunicación entre matrices; sin embargo, las mejoras del MI400 están destinadas específicamente a satisfacer las demandas de las aplicaciones de inferencia y entrenamiento de IA a gran escala. Esta nueva arquitectura, que probablemente se rebautizará como UDNA según la estrategia de AMD de unificar las tecnologías RDNA y CDNA, muestra el compromiso de AMD con la innovación.

Paralelamente, AMD se prepara para presentar este año los aceleradores MI350 que emplean la arquitectura CDNA 4. Estos aceleradores están preparados para ofrecer mejoras notables con respecto a la serie MI300, con un nodo de proceso de 3 nm de vanguardia y una eficiencia energética mejorada. Las expectativas incluyen un aumento de hasta 35 veces en las capacidades de inferencia de IA en comparación con el MI300. Los detalles sobre el rendimiento del MI400 aún no se han revelado, lo que hace que la comunidad espere con entusiasmo los próximos anuncios.
Descripción general de especificaciones: aceleradores de IA AMD Instinct
Nombre del acelerador | Instinto AMD MI400 | AMD Instinto MI350X | Instinto AMD MI325X | AMD Instinto MI300X | AMD Instinto MI250X |
---|---|---|---|---|---|
Arquitectura de GPU | CDNA Siguiente / UDNA | ADNc 4 | Agua Vanjaram (CDNA 3) | Agua Vanjaram (CDNA 3) | Aldebarán (CDNA 2) |
Nodo de proceso de GPU | Por determinar | 3 nm | 5 nm + 6 nm | 5 nm + 6 nm | 6 millas náuticas |
XCD (Chiplets) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM) 1 (por dado) |
Núcleos de GPU | Por determinar | Por determinar | 19.456 | 19.456 | 14.080 |
Velocidad del reloj de la GPU | Por determinar | Por determinar | 2100 MHz | 2100 MHz | 1700 MHz |
INT8 Cálculo | Por determinar | Por determinar | 2614 TOPES | 2614 TOPES | 383 TOP |
Computación FP6/FP4 | Por determinar | 9.2 PFLOP | N / A | N / A | N / A |
FP8 Computación | Por determinar | 4.6 PFLOP | 2.6 PFLOP | 2.6 PFLOP | N / A |
FP16 Computación | Por determinar | 2.3 PFLOP | 1.3 PFLOP | 1.3 PFLOP | 383 TFLOP |
FP32 Computación | Por determinar | Por determinar | 163, 4 TFLOP | 163, 4 TFLOP | 95, 7 TFLOP |
FP64 Computación | Por determinar | Por determinar | 81, 7 TFLOP | 81, 7 TFLOP | 47, 9 TFLOP |
Memoria RAM virtual | Por determinar | 288HBM3e | 256 GB HBM3e | 192 GB HBM3 | 128 GB HBM2e |
Caché infinito | Por determinar | Por determinar | 256 MB | 256 MB | N / A |
Reloj de memoria | Por determinar | ¿8, 0 Gbps? | 5, 9 Gbps | 5, 2 Gbps | 3, 2 Gbps |
Bus de memoria | Por determinar | 8192 bits | 8192 bits | 8192 bits | 8192 bits |
Ancho de banda de memoria | Por determinar | 8 TB/seg | 6, 0 TB/s | 5, 3 TB/s | 3, 2 TB/s |
Factor de forma | Por determinar | OAM | OAM | OAM | OAM |
Enfriamiento | Por determinar | Refrigeración pasiva | Refrigeración pasiva | Refrigeración pasiva | Refrigeración pasiva |
TDP (máximo) | Por determinar | Por determinar | 1000W | 750 W | 560 W |
Para obtener actualizaciones detalladas, consulte la información compartida por Videocardz.
Deja una respuesta