Impacto surpreendente do TurboQuant do Google na demanda por memória: insights do pesquisador

O setor de memória tem experimentado flutuações significativas recentemente, particularmente após o lançamento do TurboQuant do Google. No entanto, a noção predominante de que esse lançamento sinaliza o fim da escassez de memória é amplamente considerada um equívoco.

Impacto limitado da TurboQuant na demanda por memória: um superciclo em curso

Embora tenha havido uma queda notável nos preços da memória DDR nos últimos dias — e tenham surgido discussões sobre as implicações do algoritmo TurboQuant do Google — o Financial Times enfatiza que associar esse desenvolvimento ao fim da escassez de memória é uma interpretação equivocada. Os indicadores atuais, incluindo relatórios de receita e projeções de demanda futura, sugerem fortemente que a escassez de memória continuará num futuro próximo.

O TurboQuant “potencialmente reduz o custo de execução de grandes modelos de linguagem em um fator de quatro a oito”, afirmou Kwon Seok-joon, professor da Universidade Sungkyunkwan em Seul.”À primeira vista, isso parece ameaçar a demanda por chips de memória de alta largura de banda.”

No entanto, Kwon acrescentou: “a inferência drasticamente mais barata desbloqueia cargas de trabalho anteriormente caras demais para serem executadas”, como assistentes de codificação em tempo real e operação simultânea de múltiplos agentes de IA, elevando assim a demanda total por computação, e não reduzindo-a.

– The Financial Times

Aprofundar-se nos aspectos técnicos do TurboQuant ampliaria significativamente esta análise. Essencialmente, o algoritmo de compressão facilita a operação de grandes modelos de linguagem (LLMs) em aceleradores, minimizando o uso de memória e, consequentemente, otimizando a eficiência. Especialistas compararam o TurboQuant ao Paradoxo de Jevons. Contudo, na realidade, a mudança está evoluindo de uma demanda agressiva para uma utilização generalizada, sugerindo uma extensão do ciclo atual. Essa tendência é evidente à medida que os fabricantes de DRAM iniciam acordos plurianuais com os principais hiperescaladores para obter uma melhor compreensão dos padrões de demanda.

Dois módulos de memória Hynix 2GB 1Rx8 PC4N-19000S com a etiqueta 'HMA325S7MFR8C - UG NO AA' colocados sobre a superfície de uma placa de silício vibrante. — Créditos da imagem: SK hynix

Em seu recente relatório de receita do primeiro trimestre, a Samsung reportou impressionantes US$ 37 bilhões gerados exclusivamente por seu segmento de DRAM, com resultados operacionais que rivalizam com os dos principais provedores de hiperescala. Além disso, as previsões indicam que os preços dos contratos de DRAM aumentarão nos próximos trimestres.À medida que o cenário de memória evolui, torna-se cada vez mais evidente que nenhuma entidade que opera na área de IA pode prosperar sem recursos de memória suficientes. Michael Dell, CEO da Dell Technologies, comentou recentemente sobre o potencial de crescimento exponencial da demanda, impulsionado por um aumento significativo no uso de memória por processador.

A menos que novas capacidades de produção sejam estabelecidas e estejam operacionais, a redução da escassez de memória parece improvável. Assim, sob essa perspectiva, a falta de memória poderá continuar sendo um desafio até o segundo semestre de 2027 e possivelmente além, dependendo da velocidade com que os fornecedores conseguirem ativar novas linhas de produção.

Fonte e imagens