
NVIDIA, in collaborazione con OpenAI, ha presentato l’ultima novità della sua suite di modelli di intelligenza artificiale, la famiglia gpt-oss. Questa release offre ai consumatori l’accesso a una tecnologia di intelligenza artificiale rivoluzionaria, sfruttando le eccezionali capacità di elaborazione delle GPU RTX.
NVIDIA ha illustrato oggi nei dettagli la sua partnership con OpenAI, segnando un progresso significativo che consente all’intelligenza artificiale all’avanguardia di operare rapidamente su PC e workstation basati su RTX, risorse che in precedenza erano limitate ai data center cloud.
Il fondatore e CEO di NVIDIA, Jensen Huang, ha sottolineato l’importanza di questa mossa per il settore tecnologico:
“OpenAI ha mostrato al mondo cosa si poteva costruire sull’intelligenza artificiale di NVIDIA e ora sta promuovendo l’innovazione nel software open source”, ha affermato Jensen Huang.”I modelli gpt-oss consentono agli sviluppatori di tutto il mondo di basarsi su questa base open source all’avanguardia, rafforzando la leadership tecnologica statunitense nell’intelligenza artificiale, il tutto sulla più grande infrastruttura di elaborazione AI al mondo”.
Questo lancio rappresenta un momento cruciale, inaugurando un’era di intelligenza artificiale sui dispositivi più veloce e intelligente, supportata dalle formidabili capacità delle GPU GeForce RTX e PRO. Verranno introdotte due versioni del modello, pensate per soddisfare un ampio spettro di utenti:
- Modello gpt-oss-20b: progettato per prestazioni ottimali su PC NVIDIA RTX AI dotati di almeno 16 GB di VRAM, questo modello può elaborare fino a 250 token al secondo se eseguito su una GPU RTX 5090.
- Modello gpt-oss-120b: progettato per ambienti professionali, questo modello è supportato dalle GPU NVIDIA RTX PRO, massimizzando le capacità di elaborazione.

I modelli gpt-oss sono i primi a sfruttare la precisione MXFP4 su NVIDIA RTX, un metodo di training all’avanguardia che migliora la qualità del modello senza sacrificare le prestazioni rispetto alle tecniche precedenti. Entrambi i modelli vantano un’impressionante capacità di lunghezza del contesto fino a 131.072 token, una delle più estese disponibili per l’inferenza locale. Sono dotati di un’architettura flessibile basata su un mix di esperti (MoE), che consente funzionalità di catena di pensiero e supporta l’istruzione e l’utilizzo di strumenti.
L’RTX AI Garage di questa settimana si concentra su come gli sviluppatori e gli appassionati di intelligenza artificiale possono utilizzare in modo efficace i nuovi modelli OpenAI sulle GPU NVIDIA RTX:
Lascia un commento