Überhitzungs- und Störungsprobleme beim NVIDIA Blackwell AI-Server veranlassen Großkunden wie Microsoft und Google zur Reduzierung ihrer Bestellungen

Überhitzungs- und Störungsprobleme beim NVIDIA Blackwell AI-Server veranlassen Großkunden wie Microsoft und Google zur Reduzierung ihrer Bestellungen

Berichten zufolge stoßen die kommenden Blackwell-KI-Server von NVIDIA auf erhebliche Herausforderungen in der Lieferkette, da das Unternehmen mit Problemen im Zusammenhang mit Überhitzung und architektonischen Mängeln im Design zu kämpfen hat.

Verzögerungen bei der Auslieferung von Blackwell-KI-Servern veranlassen Kunden, auf die „Hopper“-Serie umzusteigen

Der Start der Blackwell-KI-Server von NVIDIA verlief nicht wie erwartet, was darauf hindeutet, dass Team Green derzeit vor einer erheblichen Hürde steht. Ursprünglich war geplant, die Massenproduktion im vierten Quartal 2024 aufzunehmen, doch die neue KI-Architektur scheint von einem Konstruktionsfehler geplagt zu sein, der zu Überhitzungsproblemen geführt hat. Obwohl NVIDIA zuvor behauptet hatte, diese Probleme seien behoben, deutet ein Untersuchungsbericht von The Information darauf hin, dass die Blackwell-KI-Server „Störungen“ aufweisen.

Dieser Bericht hebt hervor, dass die erste große Lieferung von NVIDIAs GB200-KI-Servern von Überhitzungs- und Störungsproblemen geplagt war, die überwiegend auf Probleme mit der „Chip-Konnektivität“ zurückzuführen waren. Solche Herausforderungen haben bei wichtigen Kunden wie Microsoft, Amazon, Google und Meta Besorgnis hervorgerufen und zu einer Reduzierung ihrer Bestellungen für Blackwell-Server geführt, obwohl diese Unternehmen zuvor Verträge im Wert von über 10 Milliarden US-Dollar abgeschlossen hatten.

NVIDIA GB200 KI-Server

Die sich abzeichnende Situation ist für NVIDIA kritisch und stellt eine potenzielle Bedrohung für die Rentabilität seines KI-Segments dar, da Unterbrechungen der Lieferkette schwerwiegende finanzielle Auswirkungen haben können. Während die genauen Einzelheiten des Problems noch unklar sind, deuteten frühere Erkenntnisse darauf hin, dass die fortschrittliche Verpackungstechnologie von TSMC, bekannt als CoWoS, im Mittelpunkt der zuvor erwähnten Chip-Konnektivitätsprobleme steht. NVIDIA hat zwar Änderungen an der bei TSMC hergestellten Blackwell-GPU-Maske angekündigt; diese Änderungen haben jedoch noch keine zufriedenstellenden Ergebnisse gebracht.

Daher greifen viele Kunden auf zuverlässigere Alternativen zurück, wie sie beispielsweise von NVIDIAs etablierter Hopper-Generation angeboten werden, während sie auf Lösungen für die anhaltenden Probleme mit Blackwell warten. Zum jetzigen Zeitpunkt ist das Ausmaß der Auswirkungen auf NVIDIAs finanzielle Leistungsfähigkeit noch ungewiss. Ohne zeitnahe Lösungen ist jedoch der zukünftige Erfolg der Blackwell-Architektur gefährdet, was für NVIDIA in Zukunft weitere Komplikationen mit sich bringen könnte.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert