Les problèmes de surchauffe et de dysfonctionnement du serveur d’IA NVIDIA Blackwell incitent les principaux clients comme Microsoft et Google à réduire leurs commandes

Les problèmes de surchauffe et de dysfonctionnement du serveur d’IA NVIDIA Blackwell incitent les principaux clients comme Microsoft et Google à réduire leurs commandes

Les prochains serveurs Blackwell AI de NVIDIA seraient confrontés à d’importants défis en matière de chaîne d’approvisionnement, car la société est aux prises avec des problèmes liés à la surchauffe et aux défauts architecturaux de la conception.

Les retards dans les livraisons des serveurs Blackwell AI incitent les clients à se tourner vers la série « Hopper »

Le lancement des serveurs Blackwell AI de NVIDIA ne s’est pas déroulé comme prévu, ce qui indique que Team Green est actuellement confronté à un obstacle de taille. La production en série, initialement prévue pour le quatrième trimestre 2024, semble être entachée d’un défaut de conception qui a entraîné des problèmes de surchauffe. Bien que NVIDIA ait précédemment affirmé que ces problèmes avaient été résolus, un rapport d’enquête de The Information indique le contraire, qualifiant les serveurs Blackwell AI de « pépins ».

Ce rapport souligne que la première expédition importante de serveurs d’IA GB200 de NVIDIA a été en proie à des problèmes de surchauffe et de pépins, principalement dus à des problèmes de « connectivité de la puce ». De tels défis ont suscité des inquiétudes chez les principaux clients, notamment Microsoft, Amazon, Google et Meta, entraînant une réduction de leurs commandes de serveurs Blackwell, bien que ces sociétés aient précédemment passé des accords dépassant les 10 milliards de dollars.

Serveur IA NVIDIA GB200

La situation qui se présente est critique pour NVIDIA et constitue une menace potentielle pour la rentabilité de son segment IA, car les perturbations de la chaîne d’approvisionnement peuvent avoir de graves conséquences financières. Bien que les détails entourant la nature exacte du problème restent flous, des informations antérieures suggèrent que la technologie de packaging avancée de TSMC, connue sous le nom de CoWoS, est au cœur des problèmes de connectivité des puces mentionnés précédemment. NVIDIA a annoncé des modifications au masque GPU Blackwell produit par TSMC ; cependant, ces changements n’ont pas encore donné de résultats satisfaisants.

Par conséquent, de nombreux clients se tournent vers des alternatives plus fiables, telles que celles proposées par la génération Hopper de NVIDIA, en attendant que les problèmes persistants liés à Blackwell soient résolus. À l’heure actuelle, l’ampleur de l’impact sur les performances financières de NVIDIA reste incertaine. Cependant, sans résolution rapide, le succès futur de l’architecture Blackwell est en danger, ce qui pourrait poser de nouvelles complications pour NVIDIA à l’avenir.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *