Le PDG d’AI affirme que le laboratoire chinois DeepSeek dispose de 50 000 GPU NVIDIA H100 pour le développement avancé de l’IA

Le PDG d’AI affirme que le laboratoire chinois DeepSeek dispose de 50 000 GPU NVIDIA H100 pour le développement avancé de l’IA

Veuillez noter que ce contenu ne constitue pas un conseil en investissement. L’auteur ne détient aucune position dans les actions évoquées ici.

Modèle d’IA R1 de DeepSeek : rivaliser avec les géants mondiaux

DeepSeek, un laboratoire d’intelligence artificielle pionnier en Chine, a suscité une attention considérable avec le lancement de son modèle R1, qui a des répercussions dans toute l’industrie. Cette technologie d’IA de pointe aurait accès à des dizaines de milliers de GPU NVIDIA pour la formation, se positionnant aux côtés de modèles renommés comme o1 d’OpenAI et Llama de Meta. Le PDG de Scale AI, Alexandr Wang, a récemment souligné les réalisations de DeepSeek dans une interview éclairante avec CNBC.

Paysage avancé des GPU de NVIDIA

Wang a dévoilé que la série Hopper de NVIDIA, qui comprend les derniers GPU H100 et H200, représente l’état actuel de leur technologie. Alors que NVIDIA accélère les livraisons des puces Blackwell tant attendues, ces GPU Hopper restent essentiels pour alimenter les avancées de l’IA à l’échelle mondiale. Selon Wang, le modèle R1 a non seulement atteint mais dépassé les performances des modèles d’IA de premier plan lors d’évaluations rigoureuses menées par son organisation.

Aperçus de « Le dernier examen de l’humanité »

Lors de sa conversation avec Andrew Ross Sorkin de CNBC, Wang a expliqué un cadre de tests intensifs baptisé « Le dernier examen de l’humanité », conçu pour évaluer les prouesses de l’IA au moyen de requêtes complexes de professeurs réputés dans des domaines tels que les mathématiques, la physique, la biologie et la chimie. Wang a noté que les résultats indiquaient que le R1 de DeepSeek était soit le plus performant, soit comparable aux principaux modèles américains comme o1.

Compétition sino-américaine en matière d’intelligence artificielle : un paradigme en mutation

Abordant la rivalité actuelle entre les États-Unis et la Chine dans le domaine de l’intelligence artificielle, Wang a reconnu l’avance historique des États-Unis dans ce domaine, mais a souligné que les avancées de DeepSeek signalent un changement potentiel dans le paysage. Il a souligné le timing stratégique de la sortie du R1, notant son dévoilement le jour de Noël, une période généralement marquée par des festivités en Occident.

Performances du processeur graphique NVIDIA

Le débat sur la disponibilité des GPU

La discussion a ensuite tourné autour de la disponibilité des GPU en Chine. Wang a évoqué la demande mondiale pour les puissants GPU de NVIDIA, qui sont devenus des points centraux de la réglementation américaine sur les exportations. Notamment, l’administration Biden a imposé des restrictions à partir de 2022 sur la vente de ces puces haut de gamme à la Chine, ce qui a conduit NVIDIA à développer des modèles alternatifs, notamment les H800 et A800, qui ont fait face à des restrictions similaires d’ici octobre 2023.

Cache GPU de DeepSeek et défis futurs

Selon Wang, même si les laboratoires chinois disposent de capacités considérables, la réalité de l’accès à ces GPU avancés est nuancée. Il estime que DeepSeek possède environ 50 000 H100, ce qui remet en cause l’idée reçue selon laquelle ses ressources sont limitées. Cependant, Wang a reconnu les contraintes imminentes auxquelles ces laboratoires pourraient être confrontés dans le cadre des contrôles à l’exportation existants, déclarant : « À l’avenir, ils seront limités par les contrôles des puces et les contrôles à l’exportation que nous avons mis en place.»

À mesure que le paysage mondial de l’IA évolue, la concurrence entre ces géants technologiques façonnera sans aucun doute l’avenir du développement de l’intelligence artificielle.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *