Les GPU NVIDIA RTX offrent des performances d’IA inégalées pour les nouveaux modèles « gpt-oss

NVIDIA, en collaboration avec OpenAI, a dévoilé le dernier-né de sa suite de modèles d’IA : la famille gpt-oss. Cette version offre aux consommateurs l’accès à une technologie d’IA révolutionnaire, exploitant les capacités de traitement exceptionnelles des GPU RTX.

NVIDIA a détaillé aujourd’hui son partenariat avec OpenAI, marquant une avancée significative qui permet à l’intelligence artificielle de pointe de fonctionner rapidement sur les PC et les stations de travail équipés de RTX, des ressources qui étaient auparavant limitées aux centres de données cloud.

Le fondateur et PDG de NVIDIA, Jensen Huang, a souligné l’importance de cette décision pour l’industrie technologique :

« OpenAI a montré au monde entier ce que l’on pouvait construire sur l’IA NVIDIA, et aujourd’hui, ils font progresser l’innovation dans les logiciels open source », a déclaré Jensen Huang.« Les modèles gpt-oss permettent aux développeurs du monde entier de s’appuyer sur cette base open source de pointe, renforçant ainsi le leadership technologique des États-Unis en matière d’IA, le tout sur la plus grande infrastructure de calcul d’IA au monde.»

Ce lancement marque un tournant, inaugurant une ère d’IA embarquée plus rapide et plus intelligente, propulsée par les formidables capacités des GPU GeForce RTX et PRO. Deux versions du modèle sont proposées, s’adressant à un large éventail d’utilisateurs :

Modèle gpt-oss-20b : Conçu pour des performances optimales sur les PC NVIDIA RTX AI équipés d’un minimum de 16 Go de VRAM, ce modèle peut traiter jusqu’à 250 jetons par seconde lorsqu’il est exécuté sur un GPU RTX 5090.
Modèle gpt-oss-120b : Conçu pour les environnements professionnels, ce modèle est pris en charge par les GPU NVIDIA RTX PRO, maximisant les capacités de traitement.

OpenAI lève 8, 3 milliards de dollars de fonds — OpenAI obtient 8, 3 milliards de dollars dans le cadre d’un financement de 40 milliards de dollars

Les modèles gpt-oss sont les premiers à exploiter la précision MXFP4 sur NVIDIA RTX, une méthode d’entraînement de pointe qui améliore la qualité des modèles sans compromettre les performances par rapport aux techniques plus anciennes. Les deux modèles offrent une capacité de longueur de contexte impressionnante, allant jusqu’à 131 072 jetons, l’une des plus étendues disponibles pour l’inférence locale. Ils intègrent une architecture flexible de mélange d’experts (MoE), permettant des capacités de chaîne de pensée et prenant en charge le suivi des instructions et l’utilisation d’outils.

Le RTX AI Garage de cette semaine se concentre sur la manière dont les développeurs et les passionnés d’IA peuvent utiliser efficacement les nouveaux modèles OpenAI sur les GPU NVIDIA RTX :

Source et images