
Avertissement : cet article ne constitue pas un conseil en investissement. L’auteur ne détient aucune position dans les actions mentionnées.
Le lancement du modèle d’IA R1 de DeepSeek a déclenché une transformation radicale du paysage technologique aux États-Unis et en Europe. Ces régions, habituées depuis longtemps à un sentiment de sécurité dû aux contrôles drastiques des exportations américaines limitant l’accès de la Chine à la technologie avancée des semi-conducteurs, sont désormais confrontées à un défi de taille. La Chine exploite stratégiquement cette opportunité en s’engageant à réaliser des investissements substantiels visant à accélérer son secteur florissant de l’IA.
Deepseek R1 est le moment Sputnik de l’IA.
— Marc Andreessen 🇺🇸 (@pmarca) 26 janvier 2025
Souvent qualifié de « moment Sputnik de l’IA », le modèle open source R1 de DeepSeek fait déjà des vagues, car il non seulement égale mais dépasse souvent les performances de modèles d’IA renommés comme o1 d’OpenAI. Ce développement représente un tournant critique dans la recherche et la mise en œuvre de l’IA.
Tout d’abord, l’équipe DeepSeek est incroyable et a réalisé un travail absolument fantastique depuis leur premier modèle, en particulier en matière d’efficacité. MLA permet une efficacité de mémoire d’environ 10 fois supérieure à celle du cache KV. Ils ont obtenu un MoE efficace avec >8 experts travaillant avec des performances quasi parfaites…
– Armen Aghajanyan (@ArmenAgha) 26 janvier 2025
L’offre de DeepSeek est remarquablement efficace, car elle ne nécessite qu’environ 1/50ème des coûts de formation associés aux modèles comparables des entreprises occidentales. Associée à la nature open source de R1, elle constitue une proposition convaincante pour les développeurs et les utilisateurs.
ce type fait le PREMIER argument technique dans ce Deep Copendemonium. Bravo ! Vous rendez un mauvais service à tout le monde ; peu importe qu’il s’agisse de 50 000 H100, de 30 000 ou de 10 000. Quoi qu’il en soit, ce n’est certainement PAS uniquement 2 000 H800 pour 5 millions de dollars de formation, peut-être. Mes calculs donnent 22, 4 % de MFU https://t.co/HD3iNLFxbA pic.twitter.com/TeZexTHyby
DeepSeek affirme que son modèle R1 a été formé à l’aide de seulement 2000 GPU H800. Pourtant, les analyses de divers experts techniques suggèrent que le cluster de formation réel était probablement beaucoup plus grand. Néanmoins, les inquiétudes concernant la rentabilité de DeepSeek restent très pertinentes, en particulier à la lumière du fait que l’entreprise ne facture que 3 % de ce qu’OpenAI demande généralement pour des ressources premium similaires.
L’engagement de la Chine en matière d’investissement dans l’IA
La situation est d’autant plus compliquée que les géants technologiques américains sont aux prises avec les incertitudes découlant du triomphe de DeepSeek. Sans exception, les actions de sociétés comme NVIDIA ont connu de fortes baisses – NVIDIA, par exemple, a chuté de 13 % dans les premiers échanges avant l’ouverture du marché. En revanche, la Chine s’apprête à investir 1 000 milliards de yuans dans son secteur de l’IA :
« La Banque de Chine prévoit d’apporter un soutien financier global spécial d’un montant total d’au moins 1 000 milliards de yuans à diverses entités de l’ensemble de la chaîne industrielle de l’intelligence artificielle au cours des cinq prochaines années… »
Ce financement vise à renforcer l’autosuffisance de la Chine en matière de technologie de l’IA, à améliorer les capacités infrastructurelles liées à l’IA (comme les centres de données) et à favoriser l’innovation dans l’ensemble du secteur.
Parallèlement, les États-Unis ont dévoilé leur ambitieux projet Stargate, prévoyant un minimum de 500 milliards de dollars d’investissements au cours des quatre prochaines années pour renforcer leur propre infrastructure d’IA.
Pensez-vous que le modèle R1 de DeepSeek représente une transformation fondamentale dans le secteur de l’IA ? N’hésitez pas à nous faire part de vos opinions dans la section commentaires ci-dessous.
Laisser un commentaire