Intel et SambaNova s’associent pour concurrencer le partenariat Groq de NVIDIA dans le domaine des solutions d’inférence IA.

Intel et SambaNova s’associent pour concurrencer le partenariat Groq de NVIDIA dans le domaine des solutions d’inférence IA.

Dans le paysage en constante évolution de l’intelligence artificielle (IA), les solutions d’inférence suscitent un intérêt croissant chez les fournisseurs de services informatiques. Suite au récent partenariat entre NVIDIA et Groq, la communauté de l’IA a pris conscience de l’urgence d’une approche diversifiée au-delà des GPU traditionnels. C’est dans ce contexte qu’intervient la collaboration émergente entre Intel et SambaNova.

Les processeurs Intel Xeon 6 serviront d’hôte aux systèmes agents, alimentés par la puce SN50 de SambaNova pour l’inférence.

Lors de la récente conférence GTC de NVIDIA, le concept d’inférence désagrégée a été mis en avant, le fabricant insistant sur l’abandon d’une approche purement centrée sur le GPU. Cette stratégie implique l’intégration de diverses unités de calcul avancées dans son infrastructure. Cette évolution est illustrée par l’accord de licence conclu avec Groq, qui a permis d’intégrer des LPU à base de SRAM dans les racks LPX de Rubin. Intel et SambaNova ont décidé d’explorer des pistes similaires, en introduisant une architecture d’inférence innovante qui combine les RDU de SambaNova avec les processeurs Xeon 6 d’Intel.

SambaNova a annoncé la dernière phase de sa collaboration avec Intel : une solution matérielle hétérogène qui combine des GPU pour les tâches de préremplissage, des processeurs Intel® Xeon® 6 comme hôtes et CPU « d’action », et des RDU SambaNova pour le décodage, dans le but de fournir une inférence supérieure pour les applications d’IA agentique exigeantes.

– SambaNova

Cet accord de collaboration est stratégiquement conçu pour optimiser les charges de travail : les RDU sont dédiées aux tâches de décodage, tandis que les GPU gèrent les processus de préremplissage et les CPU Xeon 6 prennent en charge l’orchestration et les calculs généraux. Ce partenariat ne lie pas les solutions GPU à un hyperscaler spécifique, ouvrant ainsi la voie à une intégration potentielle avec des ASIC. Cependant, SambaNova n’a pas précisé les performances des GPU dans cette configuration. L’entreprise reconnaît le rôle crucial des unités SN50 dans la mise en œuvre de flux de travail d’agents de codage de bout en bout, et affirme leur supériorité par rapport aux alternatives ARM.

Une personne tient une puce semi-conductrice sur laquelle on peut lire le texte « sambanova », ainsi que les inscriptions « CEREBRAS 500K M2019-05 » et « TITANIUM ».
Crédits photo : SambaNova

À présent, examinons en détail la puce SN50. Annoncée début 2026, cette solution intègre les unités RDU de cinquième génération de SambaNova, ainsi que des technologies de mémoire avancées telles que la DRAM, la SRAM et la HBM. Dotée de 2 To de mémoire DDR5, de 64 Go de HBM3 et de 520 Mo de SRAM, cette architecture est conçue pour minimiser la latence tout en optimisant le débit et la capacité. Selon SambaNova, l’association unique de DRAM, SRAM et HBM facilite ce qu’ils appellent la « mise en cache active », offrant ainsi un avantage concurrentiel en matière d’efficacité de traitement.

Un tableau comparatif intitulé « Paysage : Fournir une inférence de qualité supérieure sur les charges de travail les plus importantes » présentant des données pour les solutions Intel, NVIDIA et Cerebras.
Capture d’écran

En comparant les stratégies d’Intel et de SambaNova à celles de NVIDIA, une différence notable apparaît. Le partenariat d’Intel privilégie une approche plus pragmatique, minimisant ainsi le besoin d’une infrastructure sous-jacente étendue, généralement requise pour l’inférence désagrégée. De ce fait, la solution Intel-SambaNova séduit les hyperscalers à la recherche d’une offre modulaire à l’échelle du rack, répondant efficacement à la problématique du « préremplissage et du décodage ».

Par ailleurs, le PDG d’Intel a participé activement à la dernière levée de fonds de SambaNova, aux côtés de Lip-Bu Tan, un investisseur historique de la société. Bien que des discussions aient eu lieu en vue d’une acquisition, elles auraient été interrompues en raison de désaccords au sein du conseil d’administration, ce qui a conduit Intel à privilégier un rôle de participant au financement.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *