I problemi di surriscaldamento e glitch del server NVIDIA Blackwell AI spingono importanti clienti come Microsoft e Google a ridurre gli ordini

I problemi di surriscaldamento e glitch del server NVIDIA Blackwell AI spingono importanti clienti come Microsoft e Google a ridurre gli ordini

Secondo quanto riferito, i prossimi server Blackwell AI di NVIDIA stanno incontrando notevoli difficoltà nella supply chain, poiché l’azienda è alle prese con problemi legati al surriscaldamento e a carenze architettoniche nella progettazione.

I ritardi nelle consegne del server Blackwell AI spingono i clienti a rivolgersi alla serie “Hopper”

Il lancio dei server Blackwell AI di NVIDIA non è andato come previsto, il che indica che il Team Green sta attualmente affrontando un ostacolo sostanziale. Originariamente previsto per iniziare la produzione in serie entro il quarto trimestre del 2024, sembra che la nuova architettura AI sia afflitta da un difetto di progettazione che ha causato problemi di surriscaldamento. Sebbene NVIDIA avesse precedentemente sostenuto che questi problemi erano stati risolti, un rapporto investigativo di The Information indica il contrario, caratterizzando i server Blackwell AI come soggetti a “glitch”.

Questo rapporto evidenzia che la prima significativa spedizione di server AI GB200 di NVIDIA è stata afflitta da problemi di surriscaldamento e glitch, derivanti principalmente da problemi con la “connettività del chip”. Tali sfide hanno sollevato preoccupazioni tra i principali clienti, tra cui Microsoft, Amazon, Google e Meta, portando a una riduzione dei loro ordini di server Blackwell, nonostante queste aziende avessero precedentemente stipulato accordi per oltre 10 miliardi di dollari.

Server AI NVIDIA GB200

La situazione emergente è critica per NVIDIA e rappresenta una potenziale minaccia per la redditività del suo segmento AI, poiché le interruzioni della supply chain possono avere gravi implicazioni finanziarie. Mentre i dettagli che circondano la natura esatta del problema rimangono poco chiari, precedenti approfondimenti suggerivano che la tecnologia di packaging avanzata di TSMC, nota come CoWoS, è al centro dei problemi di connettività dei chip menzionati in precedenza. NVIDIA ha annunciato modifiche alla maschera GPU Blackwell prodotta presso TSMC; tuttavia, queste modifiche devono ancora produrre risultati soddisfacenti.

Di conseguenza, molti clienti stanno tornando ad alternative più affidabili, come quelle offerte dalla consolidata generazione Hopper di NVIDIA, in attesa di soluzioni per i problemi persistenti con Blackwell. Al momento, l’entità dell’impatto sulle prestazioni finanziarie di NVIDIA rimane incerta. Tuttavia, senza risoluzioni tempestive, il successo futuro dell’architettura Blackwell è in pericolo, il che potrebbe comportare ulteriori complicazioni per NVIDIA in futuro.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *