Il settore è in fermento per le discussioni sulle strategie future di NVIDIA per la tecnologia LPU (Latent Processing Unit) di Groq. Durante la recente conference call sui risultati del quarto trimestre 2026, il CEO Jensen Huang ha accennato a sviluppi entusiasmanti, prefigurando un’evoluzione significativa nel panorama tecnologico di NVIDIA.
LPU Groq di NVIDIA: rafforzamento della leadership negli ambienti sensibili alla latenza
Quest’anno, NVIDIA ha avviato un’aggressiva strategia di acquisizioni, segnata in particolare da una partnership monumentale con Groq, del valore di 20 miliardi di dollari. Questo accordo senza licenza, annunciato alla vigilia di Natale, non è ancora stato ampiamente dettagliato. Tuttavia, durante la conference call sui risultati finanziari, Jensen Huang ha fornito spunti su come le LPU di Groq potrebbero integrarsi con le future iniziative di intelligenza artificiale di NVIDIA.
Per quanto riguarda il nostro approccio a Groq e al decoder a bassa latenza, ho alcune idee fantastiche che vorrei condividere con voi al GTC.
Quindi quello che faremo con Groq è che vedrete GTC, ma quello che faremo sarà estendere la nostra architettura con Groq come acceleratore, più o meno nello stesso modo in cui abbiamo esteso l’architettura NVIDIA con Mellanox.
– Jensen Huang, CEO di NVIDIA
L’obiettivo principale dell’acquisizione di Groq è la gestione dei carichi di lavoro sensibili alla latenza, una sfida urgente nel panorama informatico odierno, in particolare nell’inferenza dell’IA. Con la continua evoluzione dell’IA, la richiesta di tempi di risposta ultrarapidi rende la latenza un fattore critico per i fornitori di servizi. Sebbene NVIDIA abbia eccelso nel campo del training con le sue architetture Hopper e Blackwell, punta a un ulteriore predominio nell’inferenza attraverso la sua imminente tecnologia Vera Rubin, con le unità LPU di Groq posizionate per essere fondamentali in questa strategia.
Huang ha paragonato l’importanza di Groq alla precedente acquisizione di Mellanox, che ha risolto importanti ostacoli di networking per l’azienda. Il contributo di Mellanox ha facilitato un’estrema co-progettazione per le strategie di data center di NVIDIA. Analogamente, Groq è pronta a migliorare l’architettura di NVIDIA integrando potenzialmente LPU a livello di rack, rafforzando così la sua posizione nel settore dell’intelligenza artificiale.

Nell’intelligenza artificiale, la decodifica e il pre-riempimento sono fasi cruciali dell’inferenza, con la decodifica che sta diventando sempre più essenziale negli ambienti multi-agente. Con la crescente interconnessione dei sistemi di intelligenza artificiale, la capacità di decodificare le informazioni in modo rapido ed efficace è essenziale. NVIDIA mira a sfruttare le LPU Groq per migliorare questa capacità. L’integrazione della tecnologia SRAM on-die, che offre un’incredibile larghezza di banda interna, sta già facendo scalpore, come dimostrano le implementazioni di aziende come Cerebras e Microsoft.
Esistono interessanti possibilità per quanto riguarda l’integrazione delle LPU di Groq nell’architettura NVIDIA. Una teoria prevalente suggerisce che NVIDIA potrebbe creare nodi di elaborazione ibridi con più LPU connesse tramite un’interconnessione unificata, migliorando l’efficienza di elaborazione.

Secondo gli analisti di GF Securities ( tramite Jukan ), NVIDIA potrebbe presentare un “rack LPX” al prossimo evento GTC, potenzialmente in grado di ospitare fino a 256 unità LPU in un’unica configurazione. Gli analisti ipotizzano che l’azienda potrebbe utilizzare un protocollo plesiosincrono nativo per la comunicazione interna delle LPU, insieme a NVLink Fusion per facilitare la gestione affidabile dei dati della GPU durante l’inferenza.

In definitiva, le LPU di Groq hanno il potenziale per replicare l’impatto trasformativo di Mellanox sul networking, consentendo a NVIDIA di acquisire un vantaggio competitivo nelle applicazioni sensibili alla latenza. Huang ha indicato che sia la potenza di calcolo che i ricavi sono attualmente in crescita, alimentati dalla rapida evoluzione delle applicazioni di intelligenza artificiale. Gli osservatori attendono con impazienza il lancio ufficiale di questi progressi durante la prossima conferenza GTC.
Lascia un commento