
Si prega di notare che questo contenuto non costituisce un consiglio di investimento. L’autore non detiene posizioni nei titoli azionari qui discussi.
Modello AI R1 di DeepSeek: competere con i giganti globali
DeepSeek, un laboratorio di intelligenza artificiale pionieristico in Cina, ha attirato notevole attenzione con il lancio del suo modello R1, che sta avendo risonanza in tutto il settore. Questa tecnologia di intelligenza artificiale all’avanguardia ha presumibilmente accesso a decine di migliaia di GPU NVIDIA per l’addestramento, posizionandosi accanto a modelli rinomati come o1 di OpenAI e Llama di Meta. Il CEO di Scale AI, Alexandr Wang, ha recentemente evidenziato i risultati di DeepSeek in un’intervista illuminante con CNBC.
Panorama GPU avanzato di NVIDIA
Wang ha svelato che la serie Hopper di NVIDIA, che include le ultime GPU H100 e H200, rappresenta lo stato attuale della loro tecnologia. Mentre NVIDIA aumenta le spedizioni dei chip Blackwell attesi, queste GPU Hopper rimangono fondamentali per alimentare i progressi dell’IA a livello globale. Secondo Wang, il modello R1 non solo ha raggiunto, ma ha superato le prestazioni dei modelli di IA di livello superiore durante le rigorose valutazioni condotte dalla sua organizzazione.
Approfondimenti da “L’ultimo esame dell’umanità”
Durante la sua conversazione con Andrew Ross Sorkin della CNBC, Wang ha elaborato un framework di test intensivo soprannominato “L’ultimo esame dell’umanità”, progettato per valutare le capacità dell’intelligenza artificiale tramite query complesse da parte di stimati professori in campi come matematica, fisica, biologia e chimica. Wang ha osservato che i risultati indicavano R1 di DeepSeek come il migliore performer o paragonabile ai principali modelli americani come o1.
Competizione tra Stati Uniti e Cina nell’intelligenza artificiale: un paradigma in evoluzione
Affrontando la rivalità in corso nell’intelligenza artificiale tra Stati Uniti e Cina, Wang ha riconosciuto la leadership storica dell’America nel campo, ma ha sottolineato che i progressi di DeepSeek segnalano un potenziale cambiamento nel panorama. Ha commentato la tempistica strategica del rilascio di R1, sottolineando la sua presentazione il giorno di Natale, un periodo tipicamente segnato dalle festività in Occidente.

Il dibattito sulla disponibilità della GPU
La conversazione si è poi spostata sulla disponibilità di GPU in Cina. Wang ha commentato la domanda globale delle potenti GPU di NVIDIA, che sono diventate punti focali delle normative sulle esportazioni statunitensi. In particolare, l’amministrazione Biden ha imposto restrizioni a partire dal 2022 sulla vendita di questi chip premium alla Cina, portando allo sviluppo da parte di NVIDIA di modelli alternativi, tra cui H800 e A800, che hanno dovuto affrontare restrizioni simili entro ottobre 2023.
Cache GPU di DeepSeek e sfide future
Secondo Wang, nonostante ci siano capacità significative nei laboratori cinesi, la realtà dell’accesso a queste GPU avanzate è sfumata. Ha stimato che DeepSeek possiede circa 50.000 H100, sfidando la percezione comune delle limitazioni delle loro risorse. Tuttavia, Wang ha riconosciuto le imminenti limitazioni che questi laboratori potrebbero affrontare in base agli attuali controlli sulle esportazioni, affermando: “In futuro, saranno limitati dai controlli sui chip e dai controlli sulle esportazioni che abbiamo in atto”.
Con l’evoluzione del panorama globale dell’intelligenza artificiale, la competizione tra questi giganti della tecnologia definirà senza dubbio il futuro dello sviluppo dell’intelligenza artificiale.
Lascia un commento