Le responsable de la stratégie du géant chinois de la technologie affirme que DeepSeek réduit le besoin de GPU NVIDIA AI

Le responsable de la stratégie du géant chinois de la technologie affirme que DeepSeek réduit le besoin de GPU NVIDIA AI

Le contenu suivant ne constitue pas un conseil en investissement. L’auteur ne détient aucune position sur les actions mentionnées.

Alors que les mégacapitalisations américaines investissent des milliards dans les GPU d’IA, James Mitchell, directeur de la stratégie chez Tencent, suggère que les récentes avancées de DeepSeek pourraient indiquer que de telles dépenses colossales pourraient être inutiles. DeepSeek affirme avoir conçu des modèles d’IA qui rivalisent avec ceux des grandes entreprises américaines, mais à un coût considérablement réduit, une affirmation qui a profondément influencé le paysage boursier.

L’entité la plus touchée est probablement NVIDIA, qui peine à se remettre de près de 600 milliards de dollars de pertes depuis la chute de janvier. Malgré les efforts déployés lors de la récente conférence GTC, dirigée par le PDG Jensen Huang, pour mettre en avant les marchés potentiels de plusieurs milliers de milliards de dollars pour les offres de NVIDIA, le sentiment des investisseurs reste prudent et le cours de l’action stagne.

Impact des innovations de DeepSeek sur les dépenses en GPU des entreprises technologiques chinoises

Lors d’une récente discussion, James Mitchell, directeur scientifique de Tencent, a expliqué que l’une des principales raisons d’investir dans les GPU d’IA de NVIDIA était la nécessité d’entraîner des modèles de langage volumineux (LLM).Peu après la montée en puissance des technologies de DeepSeek en janvier, Tencent a présenté son modèle d’IA Hunyuan Turbo S, revendiquant des temps de réponse inférieurs à une seconde, adapté au marché chinois.

Tout en cherchant à devancer DeepSeek dans le développement de modèles d’IA performants, Tencent reconnaît que les techniques d’entraînement innovantes de DeepSeek ont ​​considérablement réduit les coûts de développement de l’IA. En s’appuyant sur une ingénierie logicielle sophistiquée, DeepSeek améliorerait l’efficacité tout en minimisant les coûts associés à l’entraînement des modèles d’IA. Traditionnellement, les ingénieurs s’appuyaient sur le logiciel CUDA de NVIDIA pour exploiter efficacement les GPU, mais cela impliquait souvent de compromettre le contrôle précis de leurs produits.

Concernant l’allocation des capitaux, Mitchell a souligné que les investissements dans les GPU pour l’entraînement de grands modèles linguistiques étaient essentiels avant les révélations de DeepSeek. Il a rappelé une époque, l’année dernière, où l’on croyait que chaque nouvelle génération de LLM nécessitait un nombre de GPU nettement plus important. Il a cependant indiqué que DeepSeek avait changé la donne, notamment parmi les entreprises technologiques chinoises. Comme l’a noté Mitchell, « cette période s’est terminée avec les avancées réalisées par DeepSeek ».

Il a révélé qu’à la suite de ces avancées, « l’industrie atteint désormais une productivité beaucoup plus élevée pour la formation LLM en utilisant les GPU existants, éliminant ainsi le besoin d’acquérir des GPU supplémentaires au rythme précédemment prévu.» Notamment, en raison des restrictions sur l’achat des derniers GPU IA de NVIDIA, y compris les produits Blackwell et Hopper, les entreprises chinoises sont obligées de s’appuyer sur des modèles de GPU plus anciens ou sur de grands clusters pour atténuer les ressources informatiques limitées.

Tencent a affirmé que son modèle Turbo S excellait en mathématiques, en raisonnement et dans d’autres fonctionnalités d’IA par rapport aux offres de DeepSeek. Des experts du secteur suggèrent que les entreprises chinoises pourraient envisager des partenariats avec Huawei et ses puces Ascend AI, tout en faisant face à l’embargo en cours sur les puces.

Bien que, comme NVIDIA, Huawei fournisse à ses utilisateurs de puces des logiciels pour les gérer, des rapports indiquent que DeepSeek a constaté que les performances logicielles de Huawei étaient inférieures à celles des solutions NVIDIA. Dans le même temps, l’action NVIDIA continue de chuter, en baisse de 14 % depuis le début de l’année, les investisseurs attendant des données plus concluantes pour stimuler la demande. Tencent, cotée sur les marchés de gré à gré, affiche une impressionnante capitalisation boursière de 601 milliards de dollars.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *