
Disclaimer: Questo articolo non costituisce un consiglio di investimento. L’autore non detiene posizioni in nessuno dei titoli menzionati.
Il debutto del modello AI R1 di DeepSeek ha innescato un cambiamento trasformativo nel panorama tecnologico negli Stati Uniti e in Europa. Queste regioni, da tempo abituate a un senso di sicurezza dovuto ai severi controlli sulle esportazioni statunitensi che limitano l’accesso della Cina alla tecnologia avanzata dei semiconduttori, ora affrontano una sfida significativa. La Cina sta sfruttando strategicamente questa opportunità promettendo investimenti sostanziali volti ad accelerare il suo fiorente settore AI.
Deepseek R1 è il momento Sputnik dell’intelligenza artificiale.
— Marc Andreessen 🇺🇸 (@pmarca) 26 gennaio 2025
Spesso definito “il momento Sputnik dell’IA”, il modello R1 open source di DeepSeek sta già facendo scalpore, poiché non solo eguaglia ma spesso supera le prestazioni di rinomati modelli di IA come o1 di OpenAI. Questo sviluppo rappresenta una congiuntura critica nella ricerca e nell’implementazione dell’IA.
Innanzitutto, il team DeepSeek è incredibile e ha svolto un lavoro assolutamente fantastico sin dal loro primo modello, soprattutto per quanto riguarda l’efficienza. MLA consente un’efficienza di memoria di circa 10 volte superiore dalla cache KV. Hanno ottenuto un MoE efficiente con >8 esperti che lavorano con un…
– Armen Aghajanyan (@ArmenAgha) 26 gennaio 2025
In una notevole svolta degli eventi, l’offerta di DeepSeek è nota per la sua efficienza, richiedendo solo circa 1/50 dei costi di formazione associati a modelli comparabili di aziende occidentali. Se abbinata alla natura open source di R1, crea una proposta convincente sia per gli sviluppatori che per gli utenti.
questo tizio fa il PRIMO argomento tecnico in questo Deep Copendemonium. Complimenti!> Stai facendo un torto a tutti; non importa se sono 50k H100, o 30k, o 10k. Qualunque cosa sia, di certo NON sono solo 2k H800 per 5 milioni di dollari di formazione, forse. I miei calcoli danno il 22, 4% di MFU https://t.co/HD3iNLFxbA pic.twitter.com/TeZexTHyby
DeepSeek afferma che il suo modello R1 è stato addestrato utilizzando solo 2000 GPU H800. Tuttavia, le analisi di vari esperti di tecnologia suggeriscono che il cluster di addestramento effettivo era probabilmente significativamente più grande. Tuttavia, le preoccupazioni relative all’efficienza dei costi di DeepSeek rimangono altamente rilevanti, soprattutto alla luce del fatto che l’azienda addebita solo il 3% di quanto OpenAI richiede in genere per risorse premium simili.
L’impegno della Cina negli investimenti nell’intelligenza artificiale
Questa situazione si complica ulteriormente poiché i giganti della tecnologia degli Stati Uniti sono alle prese con le incertezze derivanti dal trionfo di DeepSeek. Senza eccezioni, le azioni di aziende come NVIDIA hanno visto bruschi cali: NVIDIA, ad esempio, è scesa del 13% nelle prime contrattazioni pre-mercato. In netto contrasto, la Cina è pronta a investire 1 trilione di yuan nel suo settore AI:
“La Banca di Cina prevede di fornire un supporto finanziario completo e speciale con una portata complessiva non inferiore a 1 trilione di yuan a varie entità nell’intera filiera del settore dell’intelligenza artificiale nei prossimi cinque anni…”
Questo finanziamento mira a rafforzare l’autosufficienza della Cina nella tecnologia dell’intelligenza artificiale, a migliorare le capacità infrastrutturali legate all’intelligenza artificiale (come i data center) e a promuovere l’innovazione nell’intero settore.
Parallelamente, gli Stati Uniti hanno presentato il loro ambizioso progetto Stargate, prevedendo un minimo di 500 miliardi di dollari di investimenti nei prossimi quattro anni per rafforzare la propria infrastruttura di intelligenza artificiale.
Credi che il modello R1 di DeepSeek rappresenti una trasformazione fondamentale nel settore dell’intelligenza artificiale? Accogliamo volentieri le tue opinioni nella sezione commenti qui sotto.
Lascia un commento