Problemas de superaquecimento e falhas no servidor NVIDIA Blackwell AI levam grandes clientes como Microsoft e Google a reduzir pedidos

Problemas de superaquecimento e falhas no servidor NVIDIA Blackwell AI levam grandes clientes como Microsoft e Google a reduzir pedidos

Os próximos servidores Blackwell AI da NVIDIA estão enfrentando desafios significativos na cadeia de suprimentos, já que a empresa enfrenta problemas relacionados a superaquecimento e deficiências arquitetônicas no design.

Atrasos nas entregas do servidor Blackwell AI levam os clientes a recorrer à série ‘Hopper’

O lançamento dos servidores Blackwell AI da NVIDIA não ocorreu como o esperado, indicando que a Team Green está atualmente enfrentando um obstáculo substancial. Originalmente projetada para iniciar a produção em volume no quarto trimestre de 2024, parece que a nova arquitetura de IA está cercada por uma falha de design que resultou em problemas de superaquecimento. Embora a NVIDIA tenha afirmado anteriormente que esses problemas foram resolvidos, um relatório investigativo do The Information indica o contrário, caracterizando os servidores Blackwell AI como apresentando “falhas”.

Este relatório destaca que a remessa inicial significativa de servidores GB200 AI da NVIDIA foi afetada por problemas de superaquecimento e falhas, decorrentes principalmente de problemas com a “conectividade do chip”. Esses desafios levantaram preocupações entre os principais clientes, incluindo Microsoft, Amazon, Google e Meta, levando a uma redução em seus pedidos de servidores Blackwell, apesar dessas empresas terem firmado acordos anteriores que ultrapassavam US$ 10 bilhões.

Servidor NVIDIA GB200 AI

A situação emergente é crítica para a NVIDIA e representa uma ameaça potencial à lucratividade de seu segmento de IA, pois as interrupções na cadeia de suprimentos podem ter implicações financeiras severas. Embora os detalhes em torno da natureza exata do problema permaneçam obscuros, insights anteriores sugeriram que a tecnologia de empacotamento avançada da TSMC, conhecida como CoWoS, está no centro dos problemas de conectividade de chip mencionados anteriormente. A NVIDIA anunciou modificações na máscara de GPU Blackwell produzida na TSMC; no entanto, essas mudanças ainda não produziram resultados satisfatórios.

Consequentemente, muitos clientes estão voltando para alternativas mais confiáveis, como as oferecidas pela geração Hopper estabelecida da NVIDIA, enquanto aguardam soluções para os problemas persistentes com a Blackwell. Até o momento, a extensão do impacto no desempenho financeiro da NVIDIA permanece incerta. No entanto, sem resoluções oportunas, o sucesso futuro da arquitetura Blackwell está em risco, o que pode representar complicações adicionais para a NVIDIA no futuro.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *