
Les fabricants chinois de GPU font des progrès considérables dans le paysage mondial de l’IA en permettant l’exécution du modèle de langage étendu (LLM) R1 de DeepSeek sur des systèmes locaux. Cette initiative témoigne de leur ambition de rivaliser dans un secteur de l’IA en pleine évolution.
Progrès des GPU chinois : Moore Threads et Kunlun de Baidu défendent les modèles d’IA de DeepSeek
La Chine a récemment été à l’avant-garde de l’industrie de l’IA, non seulement avec l’introduction de modèles qui rivalisent avec ceux d’acteurs établis comme OpenAI, mais aussi grâce à l’amélioration des capacités matérielles de l’IA. Parmi les développements notables, citons la préparation de Huawei pour affronter le bastion de NVIDIA avec sa puce d’IA Ascend 910C, ainsi que les contributions notables des fabricants de GPU chinois.
Moore Threads et Kunlun de Baidu figurent parmi les leaders de cette initiative, tous deux ayant réussi à prendre en charge le modèle R1 de DeepSeek à l’aide de leurs GPU grand public. Cette avancée est cruciale car elle accélère la course à la puissance de calcul accrue de l’IA.
Moore Threads : Améliorer le traitement de l’IA locale
Moore Threads a introduit la prise en charge des modèles de distillation de DeepSeek via un service de déploiement. Leurs GPU MTT S80 et MTT S4000 sont désormais compatibles avec ces modèles, le MTT S4000 étant spécialement conçu pour gérer les charges de travail exigeantes des postes de travail. De plus, la société a rendu ces modèles accessibles sur son cluster KUAE interne, conçu méticuleusement pour les tâches d’IA et doté de GPU MTT S4000.

Cette avancée de Moore Threads devrait encourager les utilisateurs professionnels à adopter leurs GPU, compte tenu de la capacité robuste à exécuter les modèles d’IA de DeepSeek en local. De plus, les MTT S80 et MTT S4000 peuvent être utilisés pour les charges de travail d’inférence, ce qui démontre le support étendu du fabricant. Cependant, les mesures de performance des modèles de DeepSeek sur ces GPU restent à vérifier, mais il est peu probable qu’elles correspondent aux résultats des offres d’AMD et de NVIDIA.

L’initiative de Baidu : la puce d’IA Kunlun Core P800
Baidu a réalisé des progrès significatifs avec son cluster d’IA interne équipé de puces d’IA Kunlun Core P800. Les rapports de MyDrivers suggèrent que le Core P800 surpasse de 20 à 50 % les GPU grand public similaires, prend en charge l’inférence 8 bits et est conçu pour des coûts de déploiement et de maintenance faibles. Cette puce d’IA est entièrement compatible avec les modèles d’IA V3/R1 de DeepSeek, ce qui simplifie le déploiement.
L’ampleur du cluster IA de Baidu est impressionnante : il comprend 30 000 GPU IA Core P800, et devrait bientôt atteindre une capacité opérationnelle complète. Ces avancées illustrent la manière dont les fabricants chinois de GPU non seulement surmontent les obstacles internationaux, mais renforcent également leur engagement à développer une infrastructure matérielle nationale durable et robuste.
Laisser un commentaire