OpenAI deviendra le plus gros client de la puce d’IA NVIDIA-Groq avec une capacité d’inférence dédiée de 3 GW.

OpenAI a récemment consolidé sa collaboration avec NVIDIA, mettant en lumière non seulement l’initiative Vera Rubin, mais aussi le renforcement des capacités d’inférence grâce à la solution NVIDIA-Groq attendue.

OpenAI se tourne vers NVIDIA pour l’inférence, ouvrant ainsi de nouvelles perspectives avec la solution Groq.

Dans le paysage dynamique de l’intelligence artificielle, OpenAI recherche activement des financements auprès de divers partenaires d’infrastructure. Récemment, l’organisation a annoncé une levée de fonds impressionnante de 110 milliards de dollars, largement soutenue par des leaders du secteur tels que NVIDIA, SoftBank et Amazon. OpenAI considère ces investissements comme essentiels pour maintenir son élan dans le secteur de l’IA, lui permettant ainsi de sécuriser les ressources de calcul nécessaires à ses projets ambitieux. Notamment, un article du WSJ indique que NVIDIA prévoit de dévoiler son processeur basé sur Groq lors de la prochaine conférence GTC 2026, confirmant ainsi les spéculations précédentes quant à son importance pour l’amélioration des capacités de traitement de l’IA.

Alors qu’OpenAI se positionne stratégiquement parmi ses partenaires, elle deviendra le principal client de cette solution de nouvelle génération. Cette collaboration, notamment autour de l’engagement de NVIDIA, est prometteuse. Des informations récentes indiquent qu’OpenAI exploitera 3 GW de capacité d’inférence dédiée, potentiellement issue des annonces que NVIDIA fera en mars. Selon certaines sources, l’inférence représente un défi majeur pour OpenAI ces derniers temps, ce qui a engendré une certaine insatisfaction vis-à-vis des offres précédentes de NVIDIA dans ce domaine.

OpenAI a accepté de devenir l’un des plus importants clients du nouveau processeur, selon certaines sources, ce qui représente une victoire majeure pour Nvidia. Le fabricant de ChatGPT, qui compte parmi les plus gros clients de Nvidia, a passé les derniers mois à rechercher des alternatives plus performantes aux puces Nvidia.

– WSJ

Parallèlement, OpenAI explorait des partenariats avec des entreprises comme Cerebras et Groq afin d’assurer des performances optimales pour les applications sensibles à la latence. Toutefois, le choix de se concentrer sur NVIDIA laisse penser que la future solution Groq, et notamment ses unités de traitement logique (LPU), s’est révélée suffisamment prometteuse pour qu’OpenAI s’engage sur une capacité substantielle de 3 GW. Les informations relatives à cette collaboration NVIDIA-Groq laissent entrevoir une configuration sophistiquée de plateaux de calcul hybrides, un sujet actuellement débattu par les experts du secteur.

Une personne se tient sur scène et présente différentes unités de serveurs ouvertes, avec leurs systèmes de refroidissement et leurs composants matériels visibles. — Crédits image : NVIDIA

Pour la suite, des annonces importantes de la part d’NVIDIA sont attendues lors de la GTC de cette année. Parmi les points forts prévus figurent les développements concernant l’initiative Vera Rubin, des avancées potentiellement révolutionnaires liées à la prochaine génération de Feynman, et des détails sur la solution basée sur Groq, autant d’éléments qui laissent présager un avenir prometteur pour les capacités d’IA.

Source et images

OpenAI deviendra le plus gros client de la puce d’IA NVIDIA-Groq avec une capacité d’inférence dédiée de 3 GW.

OpenAI se tourne vers NVIDIA pour l’inférence, ouvrant ainsi de nouvelles perspectives avec la solution Groq.

Articles connexes:

L'album « Deadline » de BLACKPINK bat des records avec plus de 1,4 million d'exemplaires vendus dès le premier jour sur Hanteo.

« Michael Pachter affirme que la nouvelle console Xbox a du mal à trouver son public à cause de la stratégie du Game Pass »

Laisser un commentaire Annuler la réponse