DeepSeek ha ingannato i mercati dell’intelligenza artificiale: i costi effettivi della formazione sono 400 volte superiori a quelli dichiarati

DeepSeek ha ingannato i mercati dell’intelligenza artificiale: i costi effettivi della formazione sono 400 volte superiori a quelli dichiarati

Il dibattito in corso sulle spese di formazione associate al modello R1 di DeepSeek ha scatenato una significativa volatilità del mercato, rivelando uno strato di inganno che in precedenza non era stato riconosciuto. Le implicazioni finanziarie effettive sono in effetti più sorprendenti di quanto inizialmente affermato.

Approfondimenti rivisti sulle spese di formazione di DeepSeek che superano i “5 milioni di dollari” segnalati

Uno studio completo di SemiAnalysis ha messo in discussione la narrazione prevalente secondo cui il modello R1 di DeepSeek ha notevolmente ottimizzato l’efficienza, riducendo così la necessità di risorse di elaborazione robuste, come quelle offerte da NVIDIA. Inizialmente, gli analisti del settore hanno riferito che le spese di DeepSeek per il loro modello R1 ammontavano a soli “5 milioni di $”, una cifra paragonabile ai costi associati ai modelli GPT di OpenAI. Questa rivelazione ha scatenato un’ondata di panico tra gli investitori al dettaglio che ha influenzato negativamente il mercato azionario statunitense. Tuttavia, man mano che sono emerse più informazioni, è giustificato un esame più approfondito dei costi reali coinvolti.

Per mettere le cose in prospettiva, DeepSeek ha iniziato come sussidiaria del fondo speculativo cinese High-Flyer. Secondo SemiAnalysis, nel 2021, DeepSeek ha acquisito 10.000 unità di GPU A100 di NVIDIA prima che venissero applicati severi controlli sulle esportazioni. In seguito alla decisione della società madre di scorporare il progetto, DeepSeek ha rapidamente ampliato le sue operazioni, aumentando significativamente le sue capacità di calcolo.

Analisi dei costi hardware DeepSeek
Crediti immagine: SemiAnalysis

I risultati indicano che DeepSeek è dotato di circa 10.000 GPU H800 AI “specifiche per la Cina”, insieme a 10.000 chip H100 AI all’avanguardia. Inoltre, l’organizzazione ha investito negli acceleratori H20 AI di NVIDIA, creando un sostanziale “pool” di risorse condivise tra DeepSeek e le iniziative di High-Flyer per attività tra cui trading, ricerca, formazione e inferenza. Complessivamente, il CapEx per DeepSeek è stimato in circa 1, 6 miliardi di $, con spese operative che si vocifera raggiungano circa 944 milioni di $, cifre fino a 400 volte superiori rispetto ai precedenti calcoli di mercato.

Nessuno

È importante notare che la stima iniziale dei costi probabilmente rappresentava solo una frazione dei costi di formazione totali associati all’esecuzione del modello R1. Sorprendentemente, DeepSeek ha dimostrato un’attitudine ad attrarre talenti locali ospitando eventi di reclutamento presso prestigiose università, con dipendenti selezionati che hanno ricevuto stipendi superiori a 1, 3 milioni di dollari. Questa strategia ha consentito al team di sviluppo di DeepSeek di progettare soluzioni competitive in grado di competere alla pari con giganti del settore come OpenAI. Sfortunatamente, le cifre finanziarie errate hanno fornito l’impulso per il cosiddetto evento del cigno nero della scorsa settimana sul mercato.

SemiAnalysis ha condotto valutazioni approfondite del modello di intelligenza artificiale di DeepSeek; incoraggiamo i lettori ad approfondire questi risultati per ulteriori approfondimenti e dettagli complessi.

Fonte e immagini

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *