Le secteur de la mémoire a connu d’importantes fluctuations ces derniers temps, notamment suite au lancement de TurboQuant par Google. Cependant, l’idée répandue selon laquelle ce lancement annonce la fin des pénuries de mémoire est largement considérée comme une erreur d’interprétation.
Impact limité de TurboQuant sur la demande de mémoire : un supercycle en cours
Bien que les prix de la mémoire DDR aient sensiblement baissé ces derniers jours – et que les implications de l’algorithme TurboQuant de Google fassent l’objet de discussions –, le Financial Times souligne qu’il serait erroné d’interpréter cette évolution comme la fin des pénuries de mémoire. Les indicateurs actuels, notamment les rapports de revenus et les projections de la demande future, laissent fortement penser que la pénurie de mémoire persistera dans un avenir prévisible.
« TurboQuant pourrait potentiellement réduire de quatre à huit fois le coût d’exécution de grands modèles de langage », a déclaré Kwon Seok-joon, professeur à l’université Sungkyunkwan de Séoul.« À première vue, cela semble menacer la demande de puces mémoire à large bande passante.»
Cependant, Kwon a ajouté : « une inférence considérablement moins coûteuse débloque des charges de travail auparavant trop coûteuses à exécuter », telles que les assistants de codage en temps réel et le fonctionnement simultané de plusieurs agents d’IA, ce qui fait augmenter la demande totale de calcul, et non la diminuer.
– Le Financial Times
Une analyse plus approfondie des aspects techniques de TurboQuant élargirait considérablement cette étude. Concrètement, l’algorithme de compression facilite l’exécution de grands modèles de langage (LLM) sur les accélérateurs tout en minimisant l’utilisation de la mémoire, optimisant ainsi l’efficacité. Certains experts ont comparé TurboQuant au paradoxe de Jevons. Or, dans les faits, on observe une évolution d’une forte demande vers une utilisation généralisée, ce qui laisse présager une prolongation du cycle actuel. Cette tendance se manifeste notamment par la conclusion d’accords pluriannuels entre les fabricants de DRAM et les principaux hyperscalers afin de mieux appréhender les tendances de la demande.

Dans son rapport de revenus du premier trimestre, Samsung a annoncé un chiffre d’affaires impressionnant de 37 milliards de dollars généré par son seul segment DRAM, avec des résultats d’exploitation rivalisant avec ceux des principaux fournisseurs de services cloud. De plus, les prévisions indiquent une hausse des prix contractuels de la DRAM dans les prochains trimestres. Face à l’évolution du marché de la mémoire, il devient de plus en plus évident qu’aucune entreprise du secteur de l’IA ne peut prospérer sans ressources mémoire suffisantes. Michael Dell, PDG de Dell Technologies, a récemment souligné le potentiel d’une explosion de la demande, stimulée par une augmentation significative de la consommation de mémoire par processeur.
À moins que de nouvelles capacités de production ne soient mises en place et opérationnelles, une atténuation des pénuries de mémoire semble improbable. De ce point de vue, il apparaît donc que la rareté de la mémoire pourrait persister jusqu’au second semestre 2027, voire au-delà, en fonction du rythme auquel les fournisseurs activeront de nouvelles lignes de production.
Laisser un commentaire