A Micron revelou um avanço crucial no setor de tecnologia de memória com o lançamento dos módulos de memória SOCAMM2, que prometem maior capacidade e melhor eficiência energética.
SOCAMM2 da Micron: Solucionando gargalos de memória e reduzindo a latência com cache KV.
Com a evolução das aplicações de inteligência artificial, o problema do gargalo de memória se intensificou devido ao aumento da carga de trabalho. Esse desafio levou os fabricantes de DRAM a priorizar inovações em Memória de Alta Largura de Banda (HBM) e outras soluções de memória voltadas para IA. Em um anúncio recente, a Micron relatou uma conquista inovadora com seus módulos SOCAMM2, que possuem capacidade de 256 GB por módulo. Esse desenvolvimento representa um aumento substancial em relação ao limite anterior de 192 GB, permitindo que o SOCAMM2 desempenhe um papel crucial na infraestrutura moderna de IA, solucionando as limitações de memória existentes.
As conquistas da Micron em fornecer capacidade de memória e largura de banda massivas usando menos energia do que a memória de servidor tradicional com o SOCAMM2 de 256 GB estão possibilitando a próxima geração de CPUs de IA.
– Ian Finder, Chefe de Produto de CPUs para Data Center da NVIDIA
A versão mais recente do SOCAMM2 apresenta um avanço em que um único chip monolítico de LPDRAM pode atingir 32 GB. Consequentemente, o módulo de 256 GB fornece até 2 TB de LPDRAM por CPU de 8 canais, otimizando a capacidade dos servidores de IA de processar janelas de contexto prolongadas com eficiência. Além disso, a Micron indicou que o Tempo até o Primeiro Token (TTFT) para inferência de contexto longo foi aprimorado em 2, 3 vezes, o que melhora significativamente o desempenho de cargas de trabalho focadas em aplicações de agentes.

A tecnologia SOCAMM2 foi desenvolvida em parceria com a NVIDIA, e discussões anteriores destacaram como a infraestrutura de IA Vera Rubin será uma das primeiras aplicações desse padrão de memória. No dinâmico campo da IA, a memória de alto desempenho está se tornando cada vez mais vital para cargas de trabalho que exigem baixa latência e capacidade de contexto significativa. No entanto, é importante observar que os recursos do SOCAMM2 também podem impactar a disponibilidade de DRAM, afetando potencialmente a alocação para produtos de uso geral, como GDDR7.
A Micron confirmou que amostras dos módulos SOCAMM2 de 256 GB foram distribuídas aos clientes, e uma demonstração dessa solução inovadora está prevista para ocorrer na GTC 2026.
Deixe um comentário