M3 Ultra DeepSeek R1 : 671 milliards de paramètres, 448 Go de mémoire unifiée, bande passante élevée inférieure à 200 W, pas besoin de plusieurs GPU

Plus tôt cette semaine, Apple a dévoilé la dernière version de son Mac Studio, désormais équipé de la puce M3 Ultra de pointe. Ce processeur innovant redéfinit non seulement les standards de performance, mais surpasse également les benchmarks d’Apple, avec une configuration impressionnante comprenant un CPU jusqu’à 32 cœurs et un GPU à 80 cœurs. Cette combinaison améliore considérablement les capacités de calcul et graphiques par rapport à son prédécesseur, le M2 Ultra. De plus, le M3 Ultra a démontré sa puissance en gérant sans difficulté le modèle DeepSeek R1, qui affiche un nombre impressionnant de 671 milliards de paramètres.

Révolutionner les performances : les capacités de la puce M3 Ultra

Le modèle DeepSeek R1, d’une capacité de 404 Go, nécessite une mémoire à large bande passante, généralement associée à la VRAM du GPU. Ce qui distingue l’Apple M3 Ultra, c’est son architecture mémoire unifiée, qui alloue efficacement les ressources tout en maintenant une faible consommation d’énergie. Une analyse récente de la chaîne YouTube Dave2D explique comment cette architecture améliore les performances, notamment en la comparant aux précédents modèles Apple Silicon.

En revanche, les configurations PC traditionnelles nécessitent généralement plusieurs GPU haut de gamme pour exécuter efficacement des modèles d’IA aussi volumineux, ce qui augmente considérablement la consommation d’énergie. Cependant, la puce M3 Ultra fonctionne avec une efficacité bien supérieure. Ceci est dû à son pool de ressources partagées de mémoire à large bande passante, qui permet aux modèles d’IA complexes d’exploiter les ressources mémoire comme la VRAM, garantissant ainsi des performances optimales.

Test de performance de la puce M3 Ultra d'Apple avec le modèle DeepSeek R1

Il est essentiel de noter que si les modèles d’IA plus petits s’exécutent de manière fluide et efficace sans épuiser toutes les ressources, le gigantesque DeepSeek R1 nécessite la configuration de la puce M3 Ultra d’Apple, dotée d’une mémoire remarquable de 512 Go. Cependant, macOS limite l’allocation de VRAM par défaut ; des ajustements sont donc nécessaires, en augmentant la limite à 448 Go via le Terminal.

Bien qu’il s’agisse d’une version quantifiée 4 bits au détriment de la précision, le modèle DeepSeek R1 fonctionne parfaitement dans les limites de la puce M3 Ultra Mac Studio, conservant ses 671 milliards de paramètres. En termes de consommation d’énergie, la puce M3 Ultra se démarque : le système consomme moins de 200 W pour exécuter ce modèle gourmand en ressources. Cette consommation représente une infime partie de ce que les systèmes multi-GPU traditionnels exigeraient pour atteindre des niveaux de performances similaires. Dave souligne que de telles configurations pourraient potentiellement nécessiter une consommation décuplé de la puce M3 Ultra.

Analyse des performances de la puce M3 Ultra

Il est intéressant de noter que le modèle R1, avec ses 671 milliards de paramètres, a affiché des performances supérieures à celles d’itérations plus petites comme le modèle à 70 milliards de paramètres, probablement grâce à l’efficacité architecturale inhérente à la conception du M3 Ultra. Globalement, la puce M3 Ultra d’Apple s’impose comme un concurrent de poids, capable de gérer des modèles d’IA complets bien au-delà des attentes conventionnelles. Nous prévoyons de fournir de plus amples informations sur les performances et l’efficacité de cette puce remarquable ; restez donc connectés pour plus d’informations.

Source et images