
Le débat en cours sur les dépenses de formation associées au modèle R1 de DeepSeek a provoqué une volatilité importante sur le marché, révélant une couche de tromperie jusque-là méconnue. Les implications financières réelles sont en effet plus frappantes que ce qui avait été initialement affirmé.
Informations révisées sur les dépenses de formation de DeepSeek dépassant les « 5 millions de dollars » annoncés
Une étude approfondie réalisée par SemiAnalysis a remis en cause l’idée reçue selon laquelle le modèle R1 de DeepSeek aurait considérablement optimisé l’efficacité, diminuant ainsi le besoin de ressources informatiques robustes, telles que celles proposées par NVIDIA. Au départ, les analystes du secteur ont indiqué que les dépenses de DeepSeek pour son modèle R1 s’élevaient à seulement « 5 millions de dollars », un chiffre comparable aux coûts associés aux modèles GPT d’OpenAI. Cette révélation a déclenché une vague de panique parmi les investisseurs particuliers, ce qui a eu un impact négatif sur le marché boursier américain. Cependant, à mesure que de plus amples informations ont fait surface, un examen plus approfondi des coûts réels impliqués est justifié.
Pour mettre les choses en perspective, DeepSeek a débuté en tant que filiale du fonds spéculatif chinois High-Flyer. Selon SemiAnalysis, en 2021, DeepSeek a acquis 10 000 unités de GPU A100 de NVIDIA avant que des contrôles d’exportation stricts ne soient appliqués. Suite à la décision de la société mère de scinder le projet, DeepSeek a rapidement étendu ses opérations, augmentant considérablement ses capacités de calcul.

Les résultats indiquent que DeepSeek est équipé d’environ 10 000 GPU H800 IA « spécifiques à la Chine », ainsi que de 10 000 puces IA H100 de pointe. En outre, l’organisation a investi dans les accélérateurs IA H20 de NVIDIA, créant ainsi un « pool » substantiel de ressources partagées entre DeepSeek et les entreprises de High-Flyer pour des activités telles que le trading, la recherche, la formation et l’inférence. Au total, les dépenses d’investissement de DeepSeek sont estimées à environ 1, 6 milliard de dollars, avec des dépenses opérationnelles qui atteindraient environ 944 millions de dollars, des chiffres jusqu’à 400 fois supérieurs aux calculs antérieurs du marché.

Il est important de noter que l’estimation initiale des coûts ne représentait probablement qu’une fraction des coûts de formation totaux associés à l’exécution du modèle R1. De manière remarquable, DeepSeek a démontré une aptitude à attirer des talents locaux en organisant des événements de recrutement dans des universités prestigieuses, les employés sélectionnés recevant des salaires supérieurs à 1, 3 million de dollars. Cette stratégie a permis à l’équipe de développement de DeepSeek de concevoir des solutions compétitives capables de rivaliser avec des géants du secteur comme OpenAI. Malheureusement, les chiffres financiers erronés ont donné l’impulsion à l’événement dit du cygne noir de la semaine dernière sur le marché.
SemiAnalysis a entrepris des évaluations approfondies du modèle d’IA de DeepSeek ; les lecteurs sont encouragés à explorer ces résultats pour plus d’informations et de détails complexes.
Laisser un commentaire