AMD alimente les modèles d’IA GPT-OSS 20B et 120B d’OpenAI sur Ryzen et Radeon : Ryzen AI MAX+ 395 est la seule puce d’IA à prendre en charge le modèle 120B avec un pool de mémoire extraordinaire de 128 Go

OpenAI a dévoilé ses derniers modèles d’IA, les GPT-OSS 20B et GPT-OSS 120B, et AMD est à l’avant-garde de cette innovation. L’entreprise a annoncé la prise en charge complète de ces modèles par ses GPU Ryzen AI MAX et Radeon, permettant aux utilisateurs de bénéficier de fonctionnalités avancées et d’améliorations de performances.

L’APU Ryzen AI MAX+ 395 d’AMD : une révolution pour le GPT-OSS 120B d’OpenAI

Avec l’introduction des nouveaux modèles d’IA d’OpenAI, AMD positionne ses processeurs Ryzen AI et ses GPU Radeon comme la référence pour des performances optimales. Plus précisément, l’APU Ryzen AI MAX+ 395 est présenté comme la puce exclusive capable d’exécuter nativement le modèle GPT-OSS 120B, tout en offrant une prise en charge Day-0, permettant aux utilisateurs de tester les modèles immédiatement via LM Studio.

AMD Ryzen AI Max+ exploitant le GPT-OSS 120B d'OpenAI avec prise en charge MCP pour un traitement amélioré.

Que sont exactement ces nouveaux modèles ? La série GPT-OSS comprend des modèles à poids ouvert capables de réaliser des tâches de raisonnement et d’agentique complètes. Si de nombreuses puces et PC d’IA peuvent gérer la version 20 B, le modèle 120 B, plus exigeant, nécessite des ressources matérielles importantes. C’est là que les architectures Ryzen AI MAX et Strix Halo d’AMD se distinguent, avec jusqu’à 128 Go de mémoire dédiée à ces fonctionnalités d’IA avancées.

Exploration des capacités avancées de l'IA avec les systèmes AMD.

Les poids MXFP4 convertis en GGML nécessitent environ 61 Go de VRAM, s’intégrant parfaitement aux 96 Go de mémoire graphique dédiée du processeur AMD Ryzen AI MAX+ 395. Pour utiliser cette fonctionnalité efficacement, les utilisateurs doivent s’assurer que la version de leur pilote est AMD Software : Adrenalin Edition 25.8.1 WHQL ou supérieure.

Avec des vitesses atteignant 30 jetons par seconde, les utilisateurs AMD bénéficient d’un modèle puissant, digne d’un centre de données. Ces performances sont encore améliorées par la bande passante de la plateforme Ryzen AI MAX+, associée à l’architecture innovante « mix of experts » du GPT-OSS 120B. Grâce à sa mémoire importante, les utilisateurs peuvent également bénéficier des implémentations du protocole MCP (Model Context Protocol).Les utilisateurs de processeurs AMD Ryzen AI série 300 peuvent notamment exploiter pleinement le modèle 20B, plus compact.

Pour des performances optimales avec le modèle GPT-OSS 20B, il est recommandé d’utiliser la carte graphique AMD Radeon 9070 XT 16 Go. Cette configuration offre non seulement des vitesses exceptionnelles, mais présente également des avantages impressionnants en termes de délai de disponibilité du premier jeton (TTFT), notamment avec les implémentations du protocole MCP (Model Context Protocol) dans des scénarios gourmands en ressources de calcul.

Comment tester les modèles GPT-OSS 120B et 20B d’OpenAI sur du matériel AMD

Téléchargez et installez les derniers pilotes AMD Software : Adrenalin Edition 25.8.1 WHQL ou supérieur. Attention, les pilotes plus anciens peuvent compromettre les performances et la compatibilité.
Pour les utilisateurs d’une machine AMD Ryzen compatible IA, accédez à votre Bureau et sélectionnez AMD Software : Adrenalin Edition > onglet Performances > onglet Réglages > Mémoire graphique variable.Définissez la mémoire graphique variable selon les spécifications décrites dans le tableau ci-joint. Si vous utilisez une carte graphique AMD Radeon, vous pouvez ignorer cette étape.
Installez LM Studio sur votre système.
Lorsque vous y êtes invité, choisissez d’ignorer le processus d’intégration.
Recherchez « gpt-oss » dans l’application. Vous devriez trouver une option préfixée par « LM Studio community ».Sélectionnez la version 20B ou 120B en fonction de la compatibilité de votre matériel.
Accédez à l’onglet de discussion dans LM Studio.
Utilisez le menu déroulant pour sélectionner le modèle OpenAI souhaité, en veillant à cocher « Charger manuellement les paramètres ».
Réglez le curseur « Déchargement GPU » sur le paramètre maximum et activez l’option de mémorisation des paramètres.
Cliquez sur le bouton de chargement. Notez que le chargement du modèle 120B peut prendre du temps et que la barre de chargement peut sembler bloquée en raison de la taille du modèle.
Commencez à interagir avec le modèle grâce à des invites !

Matrice de support produit AMD détaillant la compatibilité avec les modèles OpenAI.

AMD a également publié une liste de compatibilité pour les modèles GPT-OSS d’OpenAI. Son Ryzen AI MAX+ 395 se distingue comme la seule puce capable d’exécuter le modèle 120B. En revanche, d’autres options comme les GPU Radeon RX 9000, Radeon AI PRO R9000 et Radeon RX 7000, tous équipés d’au moins 16 Go de mémoire, gèrent sans problème les modèles GPT-OSS 20B.

Source et images