
Questo non è un consiglio di investimento. L’autore non detiene posizioni nelle azioni menzionate nel presente documento.
xAI presenta Grok 3 LLM: una svolta o un’esperienza sopravvalutata?
In un’entusiasmante rivelazione, xAI ha lanciato il suo modello linguistico Grok 3 (LLM) durante una trasmissione in diretta lunedì, ospitata nientemeno che da Elon Musk. La società di intelligenza artificiale ha definito Grok 3 un progresso senza pari nell’intelligenza artificiale; tuttavia, diversi esperti del settore stanno mettendo in dubbio i suoi benchmark pubblicizzati, citando notevoli carenze.
grok 3 è l’intelligenza artificiale più intelligente al mondo
ora disponibile per tutti gli abbonati Premium+
— Grok (@grok) 18 febbraio 2025
Secondo un post di xAI, il modello Grok 3 è stato pubblicizzato come “l’intelligenza artificiale più intelligente al mondo”, suscitando interesse in vari settori.
GROK 3: RISOLVERE LA FISICA, I GIOCHI E L’UNIVERSO
Presentazione completa e demo dell’ultimo modello di xAI
0:00 La missione di xAI: comprendere l’universo 1:20 Presentazione del team 2:01 Grok significa comprendere profondamente 2:29 Da Grok 2 a Grok 3 6:30 Benchmark di Grok 3 9:07 Grok 3 migliora…https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I
— Mario Nawfal (@MarioNawfal) 18 febbraio 2025
Un video completo della dimostrazione può essere trovato nel post linkato sopra. Inoltre, seguendo quello che è stato soprannominato “effetto DeepSeek”, Musk ha annunciato che la versione precedente, Grok 2, sarà presto open source, offrendo ulteriori approfondimenti sullo sviluppo della tecnologia.
Il nuovo modello “Grok 3” di xAI (pubblicato ieri sera) supera tutti gli altri modelli fondamentali rilasciati al pubblico (inclusi DeepSeek-V3 e GPT-4o) nei benchmark di matematica, scienza e codifica.pic.twitter.com/iB6KuDPsdc
— Stock Talk (@stocktalkweekly) 18 febbraio 2025
xAI è stata proattiva nell’affermare che Grok 3 supera tutti gli altri modelli fondazionali disponibili al pubblico, come DeepSeek-V3 e GPT-4o, in particolare in aree come matematica, scienza e programmazione. LLM ha persino ottenuto un punteggio impressionante di 1.402 sul benchmark Arena.
xAI ha superato le aspettative
sembra che Grok 3 sia l’intelligenza artificiale più potente del mondo pic.twitter.com/OtO6rGD22e
— Manifold (@ManifoldMarkets) 18 febbraio 2025
Nel frattempo, nel mondo degli investimenti speculativi, un contratto di scommesse su Manifold Markets riguardante Grok 3 incoronato come l’IA più potente sta propendendo verso una conclusione “sì”.Tuttavia, osserviamo un calo notevole della probabilità dal 91% di lunedì sera tardi a solo il 78% attuale.
Sembra che le nuove recensioni critiche di Grok 3, seppur limitate, possano influenzare queste probabilità in calo.
Voglio dire…hai bisogno di modelli di ragionamento per questo tipo di domande
— Bao Bui (@vqbaobui) 18 febbraio 2025
Ad esempio, Zihan Wang, un ex dipendente di DeepSeek, ha posto una domanda di fisica a Grok 3 presentando un’immagine di due palle di ferro di diverse dimensioni sospese a diverse altezze dalla Torre Pendente di Pisa, chiedendo quale avrebbe colpito per prima il suolo. La risposta logica prevista sarebbe stata la palla più pesante, ma Grok 3 ha affermato erroneamente che entrambe sarebbero atterrate simultaneamente.
Si può distinguere l’influencer dalla gente reale. Anche @Teknium1 bacia l’anello. C’è una ragione per cui non hanno parlato di FrontierMath, Arc-AGI o HLE mentre lo pubblicizzavano come “il modello più intelligente”.I miei test iniziali hanno la stessa atmosfera di @karpathy : si avvicinano a o1-pro ma non si avvicinano nemmeno a o3-mini.
— relletreknit (@relletreknit) 18 febbraio 2025
Inoltre, ci sono sempre più dubbi sulla decisione di xAI di non rilasciare le metriche delle prestazioni di Grok 3 su benchmark consolidati come FrontierMath, Arc-AGI o HLE.
È importante notare che queste critiche non intendono sminuire il potenziale di Grok 3, che è senza dubbio un modello di IA formidabile. Piuttosto, sollevano importanti questioni sull’autenticità delle affermazioni di xAI riguardo alla sua superiorità.
Sviluppi finanziari e prospettive future
In uno sviluppo separato ma ugualmente importante, Bloomberg ha recentemente riferito che xAI sta cercando fino a $ 10 miliardi in nuovi finanziamenti, catapultando potenzialmente la sua valutazione a $ 75 miliardi. In precedenza, la startup si era assicurata $ 6 miliardi durante un round di finanziamento che l’aveva valutata a $ 40 miliardi.
All’inizio dell’anno scorso siamo riusciti a malapena ad allenarci per 10 km, ma siamo riusciti ad allenarci per 100 km senza sosta per Grok3. Siamo così orgogliosi, ne arriveranno altri!
— Guodong Zhang (@Guodzh) 18 febbraio 2025
Vale la pena notare che Guodong Zhang di xAI ha annunciato che Grok 3 è stato addestrato utilizzando ben 100.000 GPU, il che indica un balzo significativo in termini di risorse e capacità. Questo sviluppo arriva in mezzo alle previsioni secondo cui i ricavi dalle vendite di chip AI potrebbero salire a 227 miliardi di dollari entro il 2032.
Per maggiori dettagli e approfondimenti, puoi consultare l’articolo completo qui.
Lascia un commento