AMD Instinct MI400 filtrado en actualizaciones recientes: se espera que tenga hasta 8 chiplets en matrices de interposición duales

AMD Instinct MI400 filtrado en actualizaciones recientes: se espera que tenga hasta 8 chiplets en matrices de interposición duales

Los próximos aceleradores Instinct MI400 de AMD están preparados para introducir una arquitectura transformadora que incluye matrices de interposición dedicadas que pueden admitir hasta 8 chiplets. Esta revolucionaria innovación se destacó recientemente en varios parches de desarrollo.

Presentamos los aceleradores AMD Instinct MI400: se revelan sus características principales

La próxima generación de aceleradores Instinct de AMD, el MI400, promete un cambio significativo en el diseño que incorpora módulos avanzados. Mientras AMD continúa ultimando los detalles del MI350, cuyo lanzamiento está previsto para este año, están surgiendo algunas ideas preliminares sobre el MI400, cuyo lanzamiento está previsto para 2026.

Las recientes filtraciones de datos han revelado detalles intrigantes sobre la arquitectura del MI400. Aunque AMD aún no ha revelado oficialmente las especificaciones completas, los parches recientes ofrecen una visión tentadora de lo que implicarán los nuevos aceleradores.

Reseñado por Coelacanth Dream, las actualizaciones publicadas en Free Desktop indican que el MI400 ahora incluirá hasta cuatro XCD (Accelerated Compute Dies), una mejora sustancial con respecto a los dos XCD por Active Interposer Die (AID) del modelo anterior. Además, el MI400 implementará dos AID junto con matrices multimedia y de E/S diferenciadas.

Parche MI400
Fuente de la imagen: FreeDesktop.org

Cada AID contará con un mosaico MID dedicado diseñado para optimizar la comunicación entre las unidades de cómputo y las interfaces de E/S, lo que marca un avance notable con respecto a los modelos anteriores. El MI350 de AMD ya utiliza Infinity Fabric para la comunicación entre matrices; sin embargo, las mejoras del MI400 están destinadas específicamente a satisfacer las demandas de las aplicaciones de inferencia y entrenamiento de IA a gran escala. Esta nueva arquitectura, que probablemente se rebautizará como UDNA según la estrategia de AMD de unificar las tecnologías RDNA y CDNA, muestra el compromiso de AMD con la innovación.

Instinto AMD MI325X
Fuente de la imagen: AMD

Paralelamente, AMD se prepara para presentar este año los aceleradores MI350 que emplean la arquitectura CDNA 4. Estos aceleradores están preparados para ofrecer mejoras notables con respecto a la serie MI300, con un nodo de proceso de 3 nm de vanguardia y una eficiencia energética mejorada. Las expectativas incluyen un aumento de hasta 35 veces en las capacidades de inferencia de IA en comparación con el MI300. Los detalles sobre el rendimiento del MI400 aún no se han revelado, lo que hace que la comunidad espere con entusiasmo los próximos anuncios.

Descripción general de especificaciones: aceleradores de IA AMD Instinct

Nombre del acelerador Instinto AMD MI400 AMD Instinto MI350X Instinto AMD MI325X AMD Instinto MI300X AMD Instinto MI250X
Arquitectura de GPU CDNA Siguiente / UDNA ADNc 4 Agua Vanjaram (CDNA 3) Agua Vanjaram (CDNA 3) Aldebarán (CDNA 2)
Nodo de proceso de GPU Por determinar 3 nm 5 nm + 6 nm 5 nm + 6 nm 6 millas náuticas
XCD (Chiplets) 8 (MCM) 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM) 1 (por dado)
Núcleos de GPU Por determinar Por determinar 19.456 19.456 14.080
Velocidad del reloj de la GPU Por determinar Por determinar 2100 MHz 2100 MHz 1700 MHz
INT8 Cálculo Por determinar Por determinar 2614 TOPES 2614 TOPES 383 TOP
Computación FP6/FP4 Por determinar 9.2 PFLOP N / A N / A N / A
FP8 Computación Por determinar 4.6 PFLOP 2.6 PFLOP 2.6 PFLOP N / A
FP16 Computación Por determinar 2.3 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOP
FP32 Computación Por determinar Por determinar 163, 4 TFLOP 163, 4 TFLOP 95, 7 TFLOP
FP64 Computación Por determinar Por determinar 81, 7 TFLOP 81, 7 TFLOP 47, 9 TFLOP
Memoria RAM virtual Por determinar 288HBM3e 256 GB HBM3e 192 GB HBM3 128 GB HBM2e
Caché infinito Por determinar Por determinar 256 MB 256 MB N / A
Reloj de memoria Por determinar ¿8, 0 Gbps? 5, 9 Gbps 5, 2 Gbps 3, 2 Gbps
Bus de memoria Por determinar 8192 bits 8192 bits 8192 bits 8192 bits
Ancho de banda de memoria Por determinar 8 TB/seg 6, 0 TB/s 5, 3 TB/s 3, 2 TB/s
Factor de forma Por determinar OAM OAM OAM OAM
Enfriamiento Por determinar Refrigeración pasiva Refrigeración pasiva Refrigeración pasiva Refrigeración pasiva
TDP (máximo) Por determinar Por determinar 1000W 750 W 560 W

Para obtener actualizaciones detalladas, consulte la información compartida por Videocardz.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *