Google sfida la serie o1 di OpenAI con il modello Gemini 2.0 Flash Thinking

Google sfida la serie o1 di OpenAI con il modello Gemini 2.0 Flash Thinking

Nuovi progressi nell’intelligenza artificiale incentrata sul ragionamento: Google e OpenAI svelano nuovi modelli

A settembre, OpenAI ha alzato l’asticella introducendo l’innovativa serie o1 di modelli linguistici di grandi dimensioni (LLM). Questi modelli avanzati danno priorità al ragionamento approfondito prima di fornire risposte, rendendoli eccezionalmente efficaci per attività complesse in campi come scienza, programmazione e matematica.

Facciamo un salto in avanti fino a oggi, Google ha lanciato il suo LLM incentrato sul ragionamento denominato Gemini 2.0 Flash Thinking . Questo modello sperimentale, identificato come gemini-2.0-flash-thinking-exp-1219, è ora accessibile agli sviluppatori tramite Google AI Studio. Google afferma che questo modello eccelle nella comprensione multimodale, nel ragionamento logico e nelle applicazioni di codifica.

Secondo l’annuncio di Google, l’estensione del tempo di calcolo durante l’inferenza ha prodotto risultati incoraggianti. Tuttavia, non sono stati pubblicati benchmark di prestazioni specifici per corroborare queste affermazioni. Tuttavia, il feedback preliminare di Chatbot Arena indica che Gemini-2.0-Flash-Thinking ha raggiunto una classifica notevole, ora al primo posto in tutte le categorie valutate.

Ultime notizie da Chatbot Arena⚡🤔 Gemini-2.0-Flash-Thinking di @GoogleDeepMind debutta al primo posto in TUTTE le categorie! Il balzo da Gemini-2.0-Flash: – In generale: n. 3 → n. 1 – In generale (controllo dello stile): n. 4 → n. 1 – Matematica: n. 2 → n. 1 – Scrittura creativa: n. 2 → n. 1 – Richieste difficili: n. 1 → n. 1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1

— lmarena.ai (precedentemente lmsys.org) (@lmarena_ai) 19 dicembre 2024

Casi d’uso chiave per Gemini 2.0 Flash Thinking

Google ha delineato diversi casi d’uso interessanti per gli sviluppatori interessati a sperimentare il modello Gemini 2.0 Flash Thinking:

  • Affrontare i problemi più intricati con ragionamento avanzato
  • Dimostrare in modo trasparente i processi di pensiero del modello
  • Risolvere problemi di codifica e query matematiche complesse

Questo modello all’avanguardia vanta una lunghezza del contesto di oltre 128k token e presenta un limite di conoscenza che si estende fino ad agosto 2024. Gli sviluppatori possono utilizzare il modello di ragionamento Gemini accedendo all’API Gemini in Google AI Studio e su Vertex AI.

Vuoi vedere Gemini 2.0 Flash Thinking in azione? Guarda questa demo in cui il modello risolve un problema di fisica e ne spiega il ragionamento. pic.twitter.com/Nl0hYj7ZFS

— Jeff Dean (@JeffDean) 19 dicembre 2024

Vantaggio competitivo: aggiornamento del modello o1 di OpenAI

All’inizio di questa settimana, OpenAI ha anche annunciato un significativo lancio del suo modello di ragionamento o1, che è ora disponibile per gli sviluppatori sul livello di utilizzo 5 all’interno del framework API. Questa ultima iterazione del modello o1 segnala prestazioni all’avanguardia in diversi benchmark AI ampiamente riconosciuti. Gli sviluppatori possono sfruttare questo modello per migliorare varie applicazioni, tra cui meccanismi di servizio clienti migliorati, logistica della supply chain ottimizzata e previsioni finanziarie più accurate.

Con il lancio da parte di Google e OpenAI dei loro LLM incentrati sul ragionamento, il panorama per lo sviluppo di applicazioni di intelligenza artificiale innovative è diventato sempre più dinamico in diversi settori.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *