OpenAI diventerà il più grande cliente del chip AI NVIDIA-Groq con 3 GW di capacità di inferenza dedicata

OpenAI ha recentemente consolidato la sua collaborazione con NVIDIA, mettendo in risalto non solo l’iniziativa Vera Rubin, ma anche potenziando le capacità di inferenza attraverso l’attesa soluzione NVIDIA-Groq.

OpenAI sposta l’attenzione su NVIDIA per l’inferenza, aprendo le porte con la soluzione Groq

Nel dinamico panorama dell’intelligenza artificiale, OpenAI sta attivamente cercando accordi di finanziamento con diversi partner infrastrutturali. Di recente, l’organizzazione ha annunciato un nuovo finanziamento di ben 110 miliardi di dollari, sostenuto in modo significativo da leader del settore come NVIDIA, SoftBank e Amazon. OpenAI ritiene che questi investimenti siano essenziali per mantenere il suo slancio nel settore dell’intelligenza artificiale, consentendo all’azienda di assicurarsi le risorse di calcolo necessarie per i suoi ambiziosi progetti. In particolare, un rapporto del WSJ indica che NVIDIA prevede di presentare il suo processore basato su Groq durante il prossimo evento GTC 2026, confermando le precedenti speculazioni sulla sua importanza nel migliorare le capacità di elaborazione dell’intelligenza artificiale.

Grazie al posizionamento strategico di OpenAI tra i suoi partner, emergerà come il principale cliente di questa soluzione di nuova generazione. Questa collaborazione, in particolare per quanto riguarda l’impegno di NVIDIA, è interessante. Recenti dichiarazioni indicano che OpenAI sfrutterà 3 GW di capacità di inferenza dedicata, potenzialmente derivante dai prossimi annunci di NVIDIA a marzo. I report suggeriscono che l’inferenza sia stata un problema critico per OpenAI ultimamente, generando una certa insoddisfazione nei confronti delle precedenti offerte di NVIDIA in questo ambito.

Secondo alcune fonti, OpenAI ha accettato di diventare uno dei principali clienti del nuovo processore, rappresentando una grande vittoria per Nvidia. Il produttore di ChatGPT, uno dei principali clienti di Nvidia, ha trascorso gli ultimi mesi alla ricerca di alternative più efficienti ai chip Nvidia.

– WSJ

Parallelamente, OpenAI stava valutando partnership con aziende come Cerebras e Groq per garantire prestazioni ottimali per le applicazioni sensibili alla latenza. Tuttavia, la decisione di concentrarsi su NVIDIA suggerisce che la futura soluzione Groq, in particolare le sue LPU, si è dimostrata sufficientemente promettente da consentire a OpenAI di impegnarsi per una capacità di 3 GW. Le intuizioni relative a questa collaborazione tra NVIDIA e Groq prevedono una sofisticata configurazione ibrida del vassoio di elaborazione, un argomento attualmente in discussione tra gli esperti del settore.

Una persona è in piedi sul palco e mostra varie unità server aperte con sistemi di raffreddamento e componenti hardware visibili. — Crediti immagine: NVIDIA

Guardando al futuro, si attendono importanti annunci da parte di NVIDIA al GTC di quest’anno. Tra i punti salienti attesi figurano gli sviluppi relativi all’iniziativa Vera Rubin, i progressi potenzialmente rivoluzionari legati alla prossima generazione di Feynman e i dettagli sulla soluzione basata su Groq, tutti elementi che indicano un futuro entusiasmante per le capacità dell’intelligenza artificiale.

Fonte e immagini

OpenAI diventerà il più grande cliente del chip AI NVIDIA-Groq con 3 GW di capacità di inferenza dedicata

OpenAI sposta l’attenzione su NVIDIA per l’inferenza, aprendo le porte con la soluzione Groq

L'album "Deadline" delle BLACKPINK batte i record con oltre 1,4 milioni di copie vendute nel primo giorno su Hanteo

"Michael Pachter afferma che la nuova console Xbox è in difficoltà a causa della strategia del Game Pass"