NVIDIA réalise une percée en matière d’inférence IA 35 fois plus rapide que prévu, tandis que Foxconn accélère la production des racks Groq 3 LPX pour les modèles à mille milliards de paramètres.

NVIDIA réalise une percée en matière d’inférence IA 35 fois plus rapide que prévu, tandis que Foxconn accélère la production des racks Groq 3 LPX pour les modèles à mille milliards de paramètres.

Foxconn a été désigné comme fournisseur principal de la nouvelle puce Groq 3 LPX de NVIDIA, un processeur avancé conçu spécifiquement pour améliorer considérablement les capacités d’inférence de l’IA.

Les plateformes Vera Rubin de NVIDIA s’apprêtent à réaliser des avancées majeures avec Groq 3 LPX, propulsant les actions de Foxconn à des niveaux records.

Lors de la GTC 2026, NVIDIA a présenté la puce Groq 3 LPX ainsi que la plateforme d’IA Vera Rubin. Cette nouvelle puce, classée comme unité de traitement logique (LPU), vise à multiplier par 35 les performances d’inférence de l’IA. Chaque rack Groq 3 LPX comprendra 256 puces dotées de 128 Go de SRAM et de 12 To de mémoire DDR5, spécialement conçues pour les modèles d’IA à plusieurs billions de paramètres.

Vue côte à côte du GPU Rubin et du LPU Groq 3 fournissant des spécifications de performance telles que 288 Go HBM4 et 500 Mo SRAM, avec des mesures de performance détaillant 50 PFLOPS (NVFP4) pour le GPU Rubin et 1, 2 PFLOPS (FP8) pour le LPU Groq 3.
Réunir des processeurs aux performances extrêmes.
L'image du serveur NVIDIA Groq 3 LPX présente des spécifications telles que « calcul d'inférence IA » à 315 PFLOPS, « capacité SRAM » de 128 Go et « bande passante mémoire » de 40 PB/s.
Spécifications pour le calcul d’inférence IA.

Selon de récents rapports des médias taïwanais, les livraisons de la puce Groq 3 LPX sont en avance sur le calendrier prévu et devraient débuter au troisième trimestre 2026. Ce calendrier rapide souligne l’engagement de NVIDIA à accélérer le développement de sa plateforme Vera Rubin afin de répondre à la demande croissante de solutions d’inférence IA sophistiquées, un élément essentiel pour l’ère naissante de l’IA agentique.

NVIDIA réalise des progrès significatifs dans le secteur de l’inférence IA avec son boîtier Groq 3 LPX, dont la livraison accélérée est prévue pour le troisième trimestre. Foxconn est le fournisseur exclusif du plateau de calcul et joue un rôle majeur dans l’assemblage des boîtiers LPX, se positionnant ainsi en concurrent direct sur le marché de l’inférence IA.

UDN

Les projections initiales concernant les livraisons de Groq 3 LPX étaient assez prudentes, mais des analyses actualisées de la chaîne d’approvisionnement suggèrent qu’environ 1, 5 million d’unités de puces LP30 et LP35 — qui font partie intégrante des racks LPX — devraient être livrées cette année, ce nombre pouvant potentiellement atteindre 2, 5 millions en 2027.

D’après ces analyses, Foxconn se distingue comme fournisseur exclusif du plateau de calcul Groq 3 LPX et occupe la première place dans l’assemblage des baies LPX. La demande exceptionnelle pour les plateformes NVIDIA Vera Rubin et les racks Groq 3 LPX devrait permettre à Foxconn d’accroître sa part de marché de 55 % à 60 % au cours du second semestre, générant ainsi une forte croissance de son chiffre d’affaires.

Une présentation intitulée « NVIDIA Extreme Co-Design : des facteurs X chaque année » illustrant diverses architectures matérielles, notamment Blackwell, Rubin et Feynman, avec les modèles NVLink et les processeurs associés pour les années 2024, 2026 et 2028.
Feuille de route de NVIDIA pour les principales architectures matérielles.

Foxconn prévoit de livrer environ 6 000 racks Groq 3 LPX cette année, et 10 000 unités supplémentaires en 2027. Il est important de noter que ce chiffre ne tient pas compte des racks LPX de nouvelle génération basés sur des puces LP40, dont la livraison devrait commencer l’année prochaine.

Les baies Vera Rubin « NVL72 » devraient atteindre une production de 12 000 unités d’ici 2026, avec pour principaux clients les géants technologiques Google, Amazon AWS et Microsoft. La production en série des serveurs Vera Rubin VR200 NVL72 devrait démarrer fin du troisième trimestre 2026.

Face à une forte demande du marché, Foxconn augmente également ses capacités de production pour les derniers serveurs d’IA de NVIDIA. Son PDG, Liu Yangwei, a déclaré que l’entreprise est en mesure de fabriquer plus de 1 000 baies par semaine et prévoit de porter cette capacité à 2 000 baies d’ici fin 2026.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *