Intel e SambaNova uniscono le forze per competere con la partnership Groq di NVIDIA nelle soluzioni di inferenza AI.

Nel panorama in continua evoluzione dell’intelligenza artificiale (IA), le soluzioni di inferenza stanno attirando sempre più l’attenzione dei fornitori di risorse di calcolo. A seguito della recente partnership tra NVIDIA e Groq, la comunità dell’IA ha riconosciuto l’urgente necessità di un approccio diversificato che vada oltre le tradizionali GPU.È qui che entra in gioco la nascente collaborazione tra Intel e SambaNova.

Le CPU Intel Xeon 6 fungeranno da host per Agentic Systems, grazie al chip SN50 di SambaNova per l’inferenza.

Durante il recente evento GTC di NVIDIA, il concetto di inferenza disaggregata è emerso con forza, con il produttore che ha sottolineato il passaggio da un approccio puramente “GPU-centrico”.Questa strategia prevede l’integrazione di diverse unità di calcolo avanzate nella propria infrastruttura. Tale evoluzione è evidenziata dall’accordo di licenza con Groq, che ha integrato LPU basate su SRAM nei rack LPX di Rubin. Intel e SambaNova hanno deciso di avventurarsi in territori simili, introducendo un’innovativa “architettura di inferenza” che unisce le RDU di SambaNova con le CPU Xeon 6 di Intel.

SambaNova ha annunciato l’ultima fase della sua collaborazione con Intel: una soluzione hardware eterogenea che combina GPU per le attività di precaricamento, processori Intel® Xeon® 6 sia come host che come CPU “di azione”, e unità RDU di SambaNova per la decodifica, con l’obiettivo di fornire inferenze di livello superiore per le applicazioni di intelligenza artificiale agentica più esigenti.

– SambaNova

Questa collaborazione è strategicamente progettata per ottimizzare i carichi di lavoro, con RDU dedicate alle attività di decodifica, GPU che gestiscono i processi di precaricamento e CPU Xeon 6 che si occupano dell’orchestrazione e delle attività di calcolo generali. In particolare, questa partnership non vincola uno specifico hyperscaler per le soluzioni GPU, lasciando spazio a una potenziale integrazione con ASIC. Tuttavia, SambaNova non ha fornito dettagli specifici sulle metriche di prestazione delle GPU in questa configurazione. L’azienda riconosce le unità SN50 come fondamentali per la realizzazione di “flussi di lavoro end-to-end per agenti di codifica”, affermandone la superiorità rispetto alle alternative ARM.

Una persona tiene in mano un chip semiconduttore con la scritta ben visibile "sambanova", etichettata "CEREBRAS 500K M2019-05" e "TITANIUM". — Crediti immagine: SambaNova

Ora, analizziamo nel dettaglio il chip SN50. Annunciata all’inizio del 2026, questa soluzione integra le unità RDU di quinta generazione di SambaNova, che combinano tecnologie di memoria avanzate come DRAM, SRAM e HBM. Con ben 2 TB di memoria DDR5, 64 GB di HBM3 e 520 MB di SRAM, questa architettura è progettata per ridurre al minimo la latenza massimizzando al contempo la velocità di trasmissione e la capacità. Secondo SambaNova, l’esclusiva combinazione di DRAM, SRAM e HBM facilita quella che definiscono “caching agente”, offrendo un vantaggio competitivo in termini di efficienza di elaborazione.

Un grafico comparativo intitolato "Panorama: Offrire inferenze di alta qualità sui carichi di lavoro più complessi" che mostra i dati relativi alle soluzioni Intel, NVIDIA e Cerebras. — Screenshot

Confrontando le strategie di Intel e SambaNova con quelle di NVIDIA, emerge una differenza significativa. La partnership di Intel propende per un approccio più pragmatico, minimizzando la necessità di un’infrastruttura sottostante complessa, tipicamente richiesta per l’inferenza disaggregata. Questo rende la soluzione Intel-SambaNova attraente per i grandi operatori di cloud computing che cercano un’offerta più modulare su scala rack, in grado di affrontare efficacemente la distinzione tra “pre-caricamento e decodifica”.

Inoltre, l’amministratore delegato di Intel ha partecipato attivamente all’ultimo round di finanziamento di SambaNova, insieme a Lip-Bu Tan, uno dei primi investitori della società. Sebbene si siano svolte discussioni relative a un’acquisizione, queste si sarebbero interrotte a causa di disaccordi nel consiglio di amministrazione, portando Intel a optare invece per un ruolo di partecipante al finanziamento.

Fonte e immagini

Intel e SambaNova uniscono le forze per competere con la partnership Groq di NVIDIA nelle soluzioni di inferenza AI.

Le CPU Intel Xeon 6 fungeranno da host per Agentic Systems, grazie al chip SN50 di SambaNova per l’inferenza.

Gli obiettivi Xbox ricevono un aggiornamento grafico e nuove funzionalità che ne migliorano l'esperienza utente.

Intel Foundry raggiunge un traguardo storico con il chiplet GaN più sottile al mondo, di soli 19 μm.