M3 Ultra DeepSeek R1: 671 miliardi di parametri, memoria unificata da 448 GB, prestazioni di larghezza di banda elevate inferiori a 200 W, nessuna GPU multipla richiesta

M3 Ultra DeepSeek R1: 671 miliardi di parametri, memoria unificata da 448 GB, prestazioni di larghezza di banda elevate inferiori a 200 W, nessuna GPU multipla richiesta

All’inizio di questa settimana, Apple ha presentato l’ultima iterazione del suo Mac Studio, ora alimentato dal chip M3 Ultra all’avanguardia. Questo processore innovativo non solo ridefinisce gli standard di prestazioni, ma supera anche i benchmark di Apple, con una configurazione impressionante di una CPU fino a 32 core e una GPU a 80 core. Questa combinazione migliora significativamente sia le capacità computazionali che grafiche rispetto al suo predecessore, l’M2 Ultra. Inoltre, l’M3 Ultra ha dimostrato la sua forza gestendo senza sforzo il modello DeepSeek R1, che vanta ben 671 miliardi di parametri.

Rivoluzionare le prestazioni: le capacità del chip M3 Ultra

Il modello DeepSeek R1, con un peso di 404 GB, richiede una memoria ad alta larghezza di banda solitamente associata alla GPU VRAM. Ciò che distingue l’M3 Ultra di Apple è la sua architettura di memoria unificata, che alloca in modo efficiente le risorse mantenendo un basso consumo energetico. Una recente analisi del canale YouTube Dave2D fornisce approfondimenti su come questa architettura elevi le prestazioni, soprattutto se confrontata con i precedenti modelli Apple Silicon.

Al contrario, le configurazioni PC tradizionali solitamente necessitano di più GPU di fascia alta per eseguire in modo efficiente tali modelli AI espansivi, aumentando significativamente il consumo energetico. Tuttavia, il chip M3 Ultra funziona efficacemente con un’efficienza molto maggiore. Ciò è attribuito al suo pool di risorse condivise di memoria ad alta larghezza di banda, che consente ai modelli AI complessi di utilizzare le risorse di memoria in un modo simile alla VRAM, garantendo così prestazioni ottimali.

Test delle prestazioni del chip M3 Ultra di Apple con il modello DeepSeek R1

È essenziale notare che mentre i modelli AI più piccoli vengono eseguiti in modo fluido ed efficiente senza esaurire tutte le risorse, il gigantesco DeepSeek R1 richiede la configurazione del chip M3 Ultra d’élite di Apple con ben 512 GB di memoria. Tuttavia, macOS limita l’allocazione VRAM predefinita; pertanto, sono necessarie delle modifiche, eseguite aumentando il limite tramite il Terminale a 448 GB.

Nonostante sia una versione quantizzata a 4 bit che sacrifica un po’ di precisione, il modello DeepSeek R1 funziona in modo eccellente entro i limiti dell’M3 Ultra Mac Studio, mantenendo i suoi 671 miliardi di parametri. In termini di consumo energetico, l’M3 Ultra si distingue, con l’intero sistema che assorbe meno di 200 W durante l’esecuzione di questo modello ad alta intensità di risorse. Questo fabbisogno energetico è una piccola frazione di ciò che i sistemi multi-GPU tradizionali richiederebbero per raggiungere livelli di prestazioni simili, con Dave che ha notato che tali configurazioni potrebbero potenzialmente richiedere dieci volte il consumo energetico del chip M3 Ultra.

Analisi delle prestazioni del chip M3 Ultra

È interessante notare che il modello R1 con i suoi vasti 671 miliardi di parametri ha mostrato prestazioni superiori rispetto a iterazioni più piccole come il modello da 70 miliardi di parametri, probabilmente a causa delle efficienze architettoniche insite nel design M3 Ultra. Nel complesso, il chip M3 Ultra di Apple emerge come un potente contendente in grado di gestire modelli AI estesi ben oltre le aspettative convenzionali. Prevediamo di fornire ulteriori approfondimenti sulle prestazioni e l’efficienza di questo straordinario chip, quindi rimanete sintonizzati per ulteriori aggiornamenti.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *