Escassez massiva de CPUs no segmento de nuvem impulsionada pelo aumento da IA ​​ativa.

Escassez massiva de CPUs no segmento de nuvem impulsionada pelo aumento da IA ​​ativa.

O cenário das cadeias de suprimentos de tecnologia está passando por uma turbulência significativa, com GPUs, memória e agora CPUs enfrentando escassez aguda, tudo atribuído à crescente demanda por IA Agética.

Amazon e provedores de nuvem ficam sem CPUs em meio à crescente demanda por IA ativa.

A ascensão meteórica da IA ​​Agética está transformando a indústria de tecnologia, causando sérios desafios para provedores de serviços em nuvem e fabricantes de semicondutores que lutam para atender à crescente demanda. Mesmo enquanto a indústria enfrentava problemas de abastecimento anteriores, agora se depara com um déficit crítico de CPUs, marcando uma mudança significativa na escassez de recursos.

De acordo com um relatório de Dylan Patel, da Semianalysis, o gargalo para provedores de nuvem mudou das GPUs para as CPUs. Inicialmente, as GPUs eram usadas principalmente para tarefas de inferência mais simples. No entanto, com a crescente complexidade dos modelos de IA e seus requisitos, as CPUs agora são cruciais para operações críticas, incluindo interações com bancos de dados e simulações complexas, o que resultou em um aumento drástico na demanda por recursos de CPU em data centers de nuvem.

Tradicionalmente, os servidores em nuvem operavam com um desequilíbrio significativo, muitas vezes dependendo de várias GPUs para cada CPU. Por exemplo, uma configuração comum poderia envolver oito GPUs para cada CPU. No entanto, essa proporção está diminuindo, já que CPUs e GPUs estão sendo utilizadas de forma mais equilibrada em aplicações de IA, como treinamento de aprendizado por reforço (RL) e inferência agentiva.

Esse aumento repentino na demanda provocou instabilidade em plataformas como o GitHub, com usuários relatando frequentes interrupções e falhas ao confirmar alterações.

Sim, então, temos estado a verificar as estatísticas do GitHub, tipo, com que frequência fica inativo, com que frequência falha ao fazer commits, sabe, essas coisas, né? É terrível. E isso porque a Microsoft vendeu todos os seus processadores sobresselentes a terceiros, certo? Ou para uso interno nos seus laboratórios, mas, sabe, não exatamente, mais para laboratórios externos que fecham contratos com a Entropic e a OpenAI.

Então, eles simplesmente não têm mais CPUs disponíveis, certo? E vimos o mesmo em muitas outras empresas, não é? Antes, tínhamos vários servidores de GPU para cada servidor de CPU. Então, 100 megawatts de GPUs eram atendidos por apenas um megawatt ou menos de CPUs. Hoje em dia, essa proporção está muito mais equilibrada, tanto para treinamento de RL quanto para inferência, inferência agentiva. Então, vimos todo mundo ficar sem CPUs. O volume de CPUs da Amazon…

Dylan Patel (Semianálise)

A principal causa dessa crise de CPUs parece ser a demanda avassaladora que deixou provedores de nuvem como Amazon e Microsoft completamente sem estoque de CPUs disponível. As altas taxas de consumo refletem uma mudança em direção a empresas de IA, como OpenAI e Entropic, que têm usado seus relacionamentos para garantir recursos de CPU. Mesmo com os planos ambiciosos da Amazon de triplicar sua oferta de servidores com CPU anualmente, a empresa não consegue acompanhar a demanda crescente.

Além disso, a transição da OpenAI da arquitetura x86 para a ARM, impulsionada pela disponibilidade das CPUs Amazon Graviton, exacerbou a situação. Essa migração para ARM tinha como objetivo aliviar a escassez de CPUs. Infelizmente, levou a uma demanda ainda maior por chips ARM, principalmente por parte de empresas de IA que adaptaram seus códigos para aproveitar esses recursos.

As implicações para o setor de tecnologia são drásticas: uma grave escassez de CPUs está no horizonte. Respostas de diversos fornecedores para ampliar a produção serão necessárias para atender a essa demanda. A situação afetará não apenas os chips ARM, mas também os processadores x86, com a AMD e a Intel pressionando suas cadeias de suprimentos para dar suporte aos provedores de nuvem. A NVIDIA também está intensificando a produção de racks de CPU Vera, que incluem múltiplos chips e uma capacidade substancial de DRAM. Esse foco em IA provavelmente desviará recursos dos mercados de consumo e corporativo, resultando em preços mais altos e disponibilidade limitada para o mercado em geral.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *