Pénuries massives de processeurs dans le secteur du cloud dues à l’essor de l’IA agentielle

Pénuries massives de processeurs dans le secteur du cloud dues à l’essor de l’IA agentielle

Le paysage des chaînes d’approvisionnement technologiques connaît de profondes turbulences, avec des pénuries aiguës de GPU, de mémoire et maintenant de CPU, toutes attribuées à la demande croissante d’IA agentique.

Amazon et les fournisseurs de cloud sont confrontés à une pénurie de processeurs face à la demande croissante d’IA agentielle.

L’essor fulgurant de l’IA agentique transforme le secteur technologique, engendrant de sérieux défis pour les fournisseurs de services cloud et les fabricants de semi-conducteurs qui peinent à satisfaire la demande croissante. Alors même que le secteur est confronté à des pénuries d’approvisionnement, il doit désormais faire face à un déficit critique de processeurs, marquant une accélération significative de la raréfaction des ressources.

D’après un rapport de Dylan Patel de Semianalysis, le principal goulot d’étranglement pour les fournisseurs de cloud est passé des GPU aux CPU. Initialement, les GPU étaient principalement utilisés pour des tâches d’inférence simples. Cependant, face à la complexité croissante des modèles d’IA et à leurs exigences, les CPU sont désormais essentiels aux opérations critiques, notamment les interactions avec les bases de données et les simulations complexes, ce qui a entraîné une forte augmentation de la demande en ressources CPU dans les centres de données cloud.

Traditionnellement, les serveurs cloud fonctionnaient avec un déséquilibre important, utilisant souvent de nombreux GPU pour chaque CPU. Par exemple, une configuration courante pouvait comporter huit GPU pour un CPU. Cependant, ce ratio se réduit, car les CPU et les GPU sont désormais utilisés de manière plus équilibrée dans les applications d’IA, telles que l’apprentissage par renforcement (RL) et l’inférence agentielle.

Cette forte hausse de la demande a engendré une instabilité sur des plateformes comme GitHub, les utilisateurs signalant des interruptions de service fréquentes et des échecs de validation des modifications.

Ouais, du coup on a passé du temps à regarder les stats de GitHub : la fréquence des pannes, les échecs de commit, etc. C’est catastrophique. Et c’est parce que Microsoft a vendu tous ses processeurs en surplus à des tiers. Soit pour un usage interne dans leurs labos, mais en fait non, plutôt à des labos externes qui signent des contrats avec Entropic et OpenAI.

Du coup, ils n’ont quasiment plus de processeurs, c’est ça ? Et on a constaté le même problème dans beaucoup d’autres entreprises. Avant, on avait beaucoup de serveurs GPU par serveur CPU. On pouvait ainsi avoir 100 mégawatts de GPU pour seulement un mégawatt, voire moins, de CPU. Aujourd’hui, ce ratio est beaucoup plus faible, aussi bien pour l’entraînement par renforcement que pour l’inférence, notamment l’inférence multi-agents. Résultat : tout le monde se retrouve à court de processeurs. Amazon, par exemple, a des volumes de CPU très importants.

Dylan Patel (Semianalysis)

La principale cause de cette pénurie de processeurs semble être la demande colossale qui a laissé les fournisseurs de cloud comme Amazon et Microsoft totalement à court de ressources. Les taux de consommation élevés reflètent un intérêt croissant pour les entreprises d’IA, telles qu’OpenAI et Entropic, qui ont tiré parti de leurs relations privilégiées pour sécuriser leurs ressources CPU. Malgré les plans ambitieux d’Amazon visant à tripler son offre de serveurs CPU chaque année, l’entreprise ne parvient pas à suivre le rythme de la demande sans cesse croissante.

Par ailleurs, la transition d’OpenAI de l’architecture x86 vers l’architecture ARM, motivée par la disponibilité des processeurs Amazon Graviton, a aggravé la situation. Cette migration vers ARM visait à pallier la pénurie de processeurs. Malheureusement, elle a entraîné une augmentation de la demande de puces ARM, notamment de la part des entreprises spécialisées en IA qui ont adapté leurs bases de code pour tirer parti de ces ressources.

Les conséquences pour le secteur technologique sont alarmantes : une pénurie critique de processeurs se profile à l’horizon. Les différents fournisseurs devront impérativement augmenter leur production pour répondre à cette demande. Cette situation affectera non seulement les puces ARM, mais aussi les processeurs x86, AMD et Intel exerçant une pression accrue sur leurs chaînes d’approvisionnement afin de soutenir les fournisseurs de services cloud. NVIDIA intensifie également sa production de racks de processeurs Vera, qui intègrent plusieurs puces et une importante capacité de mémoire DRAM. Cette priorité accordée à l’IA risque de détourner des ressources des marchés grand public et professionnels, entraînant une hausse des prix et une disponibilité limitée pour le grand public.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *