NVIDIA affirme que l’acquisition de Groq améliorera son architecture en tant qu’accélérateur de décodage à faible latence, similaire à Mellanox.

Le secteur est en ébullition suite aux discussions concernant les stratégies futures de NVIDIA pour la technologie LPU (Latent Processing Unit) de Groq. Lors de la récente conférence téléphonique sur les résultats du quatrième trimestre 2026, le PDG Jensen Huang a laissé entendre des développements prometteurs, annonçant une évolution majeure dans le paysage technologique de NVIDIA.

Les unités de traitement logique Groq de NVIDIA : un leadership renforcé dans les environnements sensibles à la latence

NVIDIA a lancé cette année une stratégie d’acquisitions agressive, notamment marquée par un partenariat majeur avec Groq, évalué à près de 20 milliards de dollars. Cet accord, qui ne porte pas sur une licence et a été révélé la veille de Noël, n’a pas encore été entièrement détaillé. Cependant, lors de la conférence téléphonique sur les résultats, Jensen Huang a donné un aperçu de la manière dont les LPU de Groq pourraient s’intégrer aux futures initiatives d’IA de NVIDIA.

Concernant notre vision de Groq et du décodeur à faible latence, j’ai d’excellentes idées que j’aimerais partager avec vous à la GTC.

Donc, avec Groq, vous découvrirez GTC, mais nous allons étendre notre architecture en utilisant Groq comme accélérateur, de la même manière que nous avons étendu l’architecture de NVIDIA avec Mellanox.

– Jensen Huang, PDG de NVIDIA

L’objectif principal de l’acquisition de Groq est de répondre aux besoins des charges de travail sensibles à la latence, un défi majeur dans le paysage informatique actuel, notamment pour l’inférence en IA. Avec l’évolution constante de l’IA, la demande de temps de réponse ultrarapides fait de la latence un facteur critique pour les fournisseurs de services. Si NVIDIA a excellé dans le domaine de l’entraînement grâce à ses architectures Hopper et Blackwell, l’entreprise ambitionne de renforcer sa position dominante dans l’inférence avec sa future technologie Vera Rubin, pour laquelle les unités LPU de Groq joueront un rôle essentiel.

Huang a comparé l’importance de Groq à celle de l’acquisition précédente de Mellanox, qui avait permis à l’entreprise de surmonter des obstacles majeurs en matière de réseau. La contribution de Mellanox avait facilité une co-conception poussée des stratégies de centres de données de NVIDIA. De même, Groq devrait optimiser l’architecture de NVIDIA en intégrant potentiellement des LPU à l’échelle du rack, renforçant ainsi sa position dans le secteur de l’IA.

Une personne se tient sur scène et présente différentes unités de serveurs ouvertes, avec leurs systèmes de refroidissement et leurs composants matériels visibles. — Crédits image : NVIDIA

En intelligence artificielle, le décodage et le pré-remplissage sont des étapes cruciales de l’inférence, le décodage devenant de plus en plus vital dans les environnements multi-agents.À mesure que les systèmes d’IA s’interconnectent, la capacité à décoder l’information rapidement et efficacement est essentielle. NVIDIA entend tirer parti des LPU Groq pour améliorer cette capacité. L’intégration de la technologie SRAM sur puce, qui offre une bande passante interne impressionnante, fait déjà sensation, comme en témoignent les implémentations d’entreprises telles que Cerebras et Microsoft.

L’intégration des LPU de Groq à l’architecture NVIDIA ouvre des perspectives intéressantes. Selon une théorie répandue, NVIDIA pourrait créer des nœuds de calcul hybrides dotés de plusieurs LPU interconnectés par un réseau unifié, ce qui optimiserait l’efficacité des calculs.

Images côte à côte d'un semi-conducteur étiqueté « LPU » et d'un autre étiqueté « GPU », détaillant leurs circuits complexes.

D’après les analystes de GF Securities ( via Jukan ), NVIDIA pourrait dévoiler un « rack LPX » lors du prochain événement GTC, présentant potentiellement jusqu’à 256 unités LPU dans une seule configuration. Les analystes supposent que l’entreprise pourrait utiliser un protocole plésiosynchrone natif pour la communication interne des LPU, ainsi que NVLink Fusion pour faciliter une gestion robuste des données GPU pendant l’inférence.

Vue détaillée d'une carte mère serveur avec des composants étiquetés, notamment « CPU », « GPU », « NVLink Fusion » et « LPU », avec — Rendu préliminaire du plateau de calcul hybride LPU de NVIDIA | Crédits image : Wccftech

En définitive, les LPU de Groq ont le potentiel de reproduire l’impact révolutionnaire de Mellanox sur les réseaux, permettant ainsi à NVIDIA de s’emparer d’un avantage concurrentiel dans les applications sensibles à la latence. Huang a indiqué que la puissance de calcul et les revenus sont actuellement en forte croissance, portés par l’évolution rapide des applications d’IA. Les observateurs attendent avec impatience le lancement officiel de ces avancées lors de la prochaine conférence GTC.

Source et images