Nel panorama in continua evoluzione dell’intelligenza artificiale (IA), le soluzioni di inferenza stanno attirando sempre più l’attenzione dei fornitori di risorse di calcolo. A seguito della recente partnership tra NVIDIA e Groq, la comunità dell’IA ha riconosciuto l’urgente necessità di un approccio diversificato che vada oltre le tradizionali GPU.È qui che entra in gioco la nascente collaborazione tra Intel e SambaNova.
Le CPU Intel Xeon 6 fungeranno da host per Agentic Systems, grazie al chip SN50 di SambaNova per l’inferenza.
Durante il recente evento GTC di NVIDIA, il concetto di inferenza disaggregata è emerso con forza, con il produttore che ha sottolineato il passaggio da un approccio puramente “GPU-centrico”.Questa strategia prevede l’integrazione di diverse unità di calcolo avanzate nella propria infrastruttura. Tale evoluzione è evidenziata dall’accordo di licenza con Groq, che ha integrato LPU basate su SRAM nei rack LPX di Rubin. Intel e SambaNova hanno deciso di avventurarsi in territori simili, introducendo un’innovativa “architettura di inferenza” che unisce le RDU di SambaNova con le CPU Xeon 6 di Intel.
SambaNova ha annunciato l’ultima fase della sua collaborazione con Intel: una soluzione hardware eterogenea che combina GPU per le attività di precaricamento, processori Intel® Xeon® 6 sia come host che come CPU “di azione”, e unità RDU di SambaNova per la decodifica, con l’obiettivo di fornire inferenze di livello superiore per le applicazioni di intelligenza artificiale agentica più esigenti.
– SambaNova
Questa collaborazione è strategicamente progettata per ottimizzare i carichi di lavoro, con RDU dedicate alle attività di decodifica, GPU che gestiscono i processi di precaricamento e CPU Xeon 6 che si occupano dell’orchestrazione e delle attività di calcolo generali. In particolare, questa partnership non vincola uno specifico hyperscaler per le soluzioni GPU, lasciando spazio a una potenziale integrazione con ASIC. Tuttavia, SambaNova non ha fornito dettagli specifici sulle metriche di prestazione delle GPU in questa configurazione. L’azienda riconosce le unità SN50 come fondamentali per la realizzazione di “flussi di lavoro end-to-end per agenti di codifica”, affermandone la superiorità rispetto alle alternative ARM.

Ora, analizziamo nel dettaglio il chip SN50. Annunciata all’inizio del 2026, questa soluzione integra le unità RDU di quinta generazione di SambaNova, che combinano tecnologie di memoria avanzate come DRAM, SRAM e HBM. Con ben 2 TB di memoria DDR5, 64 GB di HBM3 e 520 MB di SRAM, questa architettura è progettata per ridurre al minimo la latenza massimizzando al contempo la velocità di trasmissione e la capacità. Secondo SambaNova, l’esclusiva combinazione di DRAM, SRAM e HBM facilita quella che definiscono “caching agente”, offrendo un vantaggio competitivo in termini di efficienza di elaborazione.

Confrontando le strategie di Intel e SambaNova con quelle di NVIDIA, emerge una differenza significativa. La partnership di Intel propende per un approccio più pragmatico, minimizzando la necessità di un’infrastruttura sottostante complessa, tipicamente richiesta per l’inferenza disaggregata. Questo rende la soluzione Intel-SambaNova attraente per i grandi operatori di cloud computing che cercano un’offerta più modulare su scala rack, in grado di affrontare efficacemente la distinzione tra “pre-caricamento e decodifica”.
Inoltre, l’amministratore delegato di Intel ha partecipato attivamente all’ultimo round di finanziamento di SambaNova, insieme a Lip-Bu Tan, uno dei primi investitori della società. Sebbene si siano svolte discussioni relative a un’acquisizione, queste si sarebbero interrotte a causa di disaccordi nel consiglio di amministrazione, portando Intel a optare invece per un ruolo di partecipante al finanziamento.
Lascia un commento