Micron ha svelato un progresso fondamentale nel settore della tecnologia della memoria con l’introduzione dei moduli di memoria SOCAMM2, che promettono una maggiore capacità e una migliore efficienza energetica.
SOCAMM2 di Micron: risoluzione dei colli di bottiglia della memoria e riduzione della latenza con KV-Cache
Con l’evoluzione delle applicazioni di intelligenza artificiale, il problema dei colli di bottiglia della memoria si è intensificato a causa dell’aumento dei carichi di lavoro. Questa sfida ha spinto i produttori di DRAM a dare priorità alle innovazioni nella memoria ad alta larghezza di banda (HBM) e in altre soluzioni di memoria orientate all’intelligenza artificiale. In un recente annuncio, Micron ha annunciato un risultato rivoluzionario con i suoi moduli SOCAMM2, che vantano una capacità per modulo di 256 GB. Questo sviluppo rappresenta un aumento sostanziale rispetto al precedente limite di 192 GB, consentendo a SOCAMM2 di svolgere un ruolo cruciale nelle moderne infrastrutture di intelligenza artificiale, affrontando i vincoli di memoria esistenti.
I risultati ottenuti da Micron nel fornire un’enorme capacità di memoria e larghezza di banda utilizzando meno energia rispetto alla tradizionale memoria server con SOCAMM2 da 256 GB stanno abilitando la prossima generazione di CPU AI.
– Ian Finder, responsabile del prodotto, CPU per data center presso NVIDIA
L’ultima iterazione di SOCAMM2 presenta un progresso in cui un singolo die monolitico LPDRAM può raggiungere i 32 GB. Di conseguenza, il modulo da 256 GB fornisce fino a 2 TB di LPDRAM per CPU a 8 canali, ottimizzando la capacità dei server AI di elaborare efficacemente finestre di contesto prolungate. Inoltre, Micron ha indicato che il Time-to-First-Token (TTFT) per l’inferenza di contesto lungo è migliorato di 2, 3 volte, il che migliora significativamente le prestazioni dei carichi di lavoro focalizzati sulle applicazioni agentiche.

La tecnologia SOCAMM2 è stata sviluppata in collaborazione con NVIDIA e le discussioni precedenti hanno evidenziato come l’infrastruttura di intelligenza artificiale di Vera Rubin sarà una delle prime applicazioni di questo standard di memoria. Nel dinamico campo dell’intelligenza artificiale, la memoria ad alte prestazioni sta diventando sempre più essenziale per i carichi di lavoro che richiedono bassa latenza e una capacità di contesto significativa. Tuttavia, è importante notare che le capacità di SOCAMM2 potrebbero anche influire sulla disponibilità di DRAM, potenzialmente influenzando l’allocazione per prodotti generici come la GDDR7.
Micron ha confermato che campioni dei moduli SOCAMM2 da 256 GB sono stati distribuiti ai clienti e che una dimostrazione di questa soluzione innovativa avrà luogo al GTC 2026.
Lascia un commento