L’AMD Radeon RX 7900 XTX surpasse la NVIDIA GeForce RTX 4090 dans les tests d’inférence d’IA DeepSeek : comment exécuter R1 sur votre système AMD local

La Radeon RX 7900 XTX d’AMD s’est imposée comme un concurrent de poids dans le domaine de l’inférence IA, surpassant la GeForce RTX 4090 de NVIDIA dans les tests de référence utilisant le modèle d’IA R1 de DeepSeek. Ce développement signale un changement significatif dans le paysage informatique, rendant les capacités d’IA avancées plus accessibles aux utilisateurs quotidiens.

Modèle d’IA R1 de DeepSeek : l’avantage concurrentiel d’AMD

La sortie du dernier modèle d’IA de DeepSeek a suscité un enthousiasme considérable au sein de la communauté technologique. Pour ceux qui s’interrogent sur les exigences de calcul nécessaires à l’exécution de ce modèle, le GPU AMD Radeon RX 7900 XTX, utilisant son architecture « RDNA 3 », s’avère suffisant pour la tâche. Les récents benchmarks démontrent un net avantage de performance de la série phare RX 7000 d’AMD par rapport à son homologue NVIDIA sur différents modèles.

DeepSeek fonctionne très bien sur @AMDRadeon 7900 XTX. Découvrez comment l’exécuter sur les GPU Radeon et les APU Ryzen AI ici : https://t.co/FVLDLJ18Ov pic.twitter.com/5OKEkyJjh3

— David McAfee (@McAfeeDavid_AMD) 29 janvier 2025

Avantages du traitement de l’IA locale avec les GPU AMD

Pour les personnes qui utilisent des GPU grand public pour des tâches d’IA, la série AMD Radeon constitue une option intéressante, offrant d’excellentes performances par rapport au prix par rapport aux accélérateurs d’IA traditionnels. L’exécution de modèles d’IA en local améliore non seulement les performances, mais répond également aux problèmes de confidentialité importants associés à l’utilisation de services cloud, notamment en ce qui concerne les données traitées par les solutions d’IA de DeepSeek.

Guide étape par étape pour exécuter DeepSeek R1 sur votre matériel AMD

La mise en route du modèle R1 de DeepSeek est simple. Suivez ces étapes pour des performances optimales :

Étape 1 : Assurez-vous que vous utilisez le pilote Adrenalin version 25.1.1 Facultatif ou ultérieure.

Étape 2 : Téléchargez LM Studio version 0.3.8 ou supérieure depuis lmstudio.ai/ryzenai.

Étape 3 : installez LM Studio et contournez l’écran d’intégration.

Étape 4 : Cliquez sur l’onglet « découvrir ».

Étape 5 : sélectionnez le distillateur DeepSeek R1 souhaité. Les modèles plus petits comme Qwen 1.5B sont recommandés pour la vitesse, tandis que les modèles plus grands offrent des capacités de raisonnement améliorées.

Étape 6 : Sur le côté droit, sélectionnez la quantification « Q4 KM » et cliquez sur « Télécharger ».

Étape 7 : après le téléchargement, revenez à l’onglet de discussion, choisissez le distillat DeepSeek R1 dans la liste déroulante et assurez-vous que « sélectionner manuellement les paramètres » est coché.

Étape 8 : Dans les couches de déchargement du GPU, déplacez le curseur vers le paramètre maximum.

Étape 9 : Cliquez sur « Charger le modèle ».

Étape 10 : Commencez à interagir avec votre modèle de raisonnement exécuté localement !

Ressources supplémentaires et tendances futures

Si vous rencontrez des difficultés, AMD a également créé un didacticiel détaillé sur YouTube qui décrit le processus de configuration pour l’exécution des grands modèles linguistiques de DeepSeek sur des machines AMD locales. Cela est particulièrement utile pour les utilisateurs soucieux de la sécurité et de la confidentialité des données.

À l’avenir, le lancement attendu de nouveaux GPU d’AMD et de NVIDIA promet des avancées substantielles dans les capacités d’inférence, grâce en partie à des moteurs d’IA dédiés conçus pour gérer plus efficacement les charges de travail exigeantes.