M3 Ultra DeepSeek R1: 671 mil millones de parámetros, 448 GB de memoria unificada, alto rendimiento de ancho de banda por debajo de 200 W, sin necesidad de múltiples GPU

M3 Ultra DeepSeek R1: 671 mil millones de parámetros, 448 GB de memoria unificada, alto rendimiento de ancho de banda por debajo de 200 W, sin necesidad de múltiples GPU

A principios de esta semana, Apple presentó la última versión de su Mac Studio, ahora equipada con el vanguardista chip M3 Ultra. Este innovador procesador no solo redefine los estándares de rendimiento, sino que también supera las propias pruebas de rendimiento de Apple, con una impresionante configuración de hasta 32 núcleos de CPU y 80 núcleos de GPU. Esta combinación mejora significativamente las capacidades computacionales y gráficas en comparación con su predecesor, el M2 Ultra. Además, el M3 Ultra ha demostrado su potencia al gestionar sin problemas el modelo DeepSeek R1, que cuenta con la asombrosa cifra de 671 mil millones de parámetros.

Revolucionando el rendimiento: las capacidades del chip M3 Ultra

El modelo DeepSeek R1, con un peso de 404 GB, requiere una memoria de alto ancho de banda, típicamente asociada con la VRAM de la GPU. Lo que distingue al M3 Ultra de Apple es su arquitectura de memoria unificada, que asigna recursos eficientemente con un bajo consumo de energía. Un análisis reciente del canal de YouTube Dave2D ofrece información sobre cómo esta arquitectura mejora el rendimiento, especialmente al compararla con modelos anteriores de silicio de Apple.

En contraste, las configuraciones de PC tradicionales suelen requerir múltiples GPU de alta gama para ejecutar eficientemente estos modelos de IA expansivos, lo que aumenta significativamente el consumo de energía. Sin embargo, el chip M3 Ultra funciona eficazmente con mucha mayor eficiencia. Esto se debe a su conjunto compartido de recursos de memoria de alto ancho de banda, que permite que los modelos de IA complejos utilicen los recursos de memoria de forma similar a la VRAM, garantizando así un rendimiento óptimo.

Prueba de rendimiento del chip M3 Ultra de Apple con el modelo DeepSeek R1

Es fundamental tener en cuenta que, si bien los modelos de IA más pequeños se ejecutan de forma fluida y eficiente sin agotar todos los recursos, el gigantesco DeepSeek R1 requiere la configuración de élite del chip M3 Ultra de Apple, con una notable capacidad de 512 GB de memoria. Sin embargo, macOS restringe la asignación predeterminada de VRAM; por lo tanto, es necesario realizar ajustes, que se realizan aumentando el límite a 448 GB mediante la Terminal.

A pesar de ser una versión cuantificada de 4 bits que sacrifica algo de precisión, el modelo DeepSeek R1 funciona de maravilla dentro de las limitaciones del M3 Ultra Mac Studio, manteniendo sus 671 mil millones de parámetros. En cuanto al consumo de energía, el M3 Ultra destaca, con un sistema completo que consume menos de 200 W al ejecutar este modelo de alto consumo de recursos. Este requerimiento energético es una pequeña fracción de lo que los sistemas multi-GPU tradicionales requerirían para alcanzar niveles de rendimiento similares, y Dave señala que estas configuraciones podrían requerir potencialmente un consumo de energía diez veces superior al del chip M3 Ultra.

Análisis del rendimiento del chip M3 Ultra

Curiosamente, el modelo R1, con sus 671 mil millones de parámetros, mostró un rendimiento superior al de iteraciones más pequeñas, como el modelo de 70 mil millones de parámetros, posiblemente debido a las eficiencias arquitectónicas inherentes al diseño M3 Ultra. En general, el chip M3 Ultra de Apple se perfila como un potente competidor capaz de gestionar modelos de IA extensivos que superan con creces las expectativas convencionales. Esperamos ofrecer más información sobre el rendimiento y la eficiencia de este extraordinario chip, así que estén atentos a las próximas actualizaciones.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *