DeepSeek wprowadził rynki AI w błąd: Rzeczywiste koszty szkolenia są 400 razy wyższe niż podawano

Rozwijająca się debata na temat kosztów szkoleń związanych z modelem R1 firmy DeepSeek wywołała znaczną zmienność rynku, ujawniając warstwę oszustwa, która wcześniej nie była rozpoznawana. Rzeczywiste implikacje finansowe są rzeczywiście bardziej uderzające, niż początkowo twierdzono.

Zrewidowane spostrzeżenia na temat wydatków na szkolenia DeepSeek przekraczają zgłoszone „5 milionów dolarów”

Kompleksowe badanie przeprowadzone przez SemiAnalysis zakwestionowało dominującą narrację, że model R1 firmy DeepSeek radykalnie zoptymalizował wydajność, zmniejszając tym samym potrzebę solidnych zasobów obliczeniowych, takich jak te oferowane przez firmę NVIDIA. Początkowo analitycy branżowi poinformowali, że wydatki DeepSeek na model R1 wyniosły zaledwie „5 milionów dolarów” — kwotę porównywalną z kosztami związanymi z modelami GPT firmy OpenAI. To odkrycie wywołało falę paniki wśród inwestorów detalicznych, która niekorzystnie wpłynęła na rynek akcji w USA. Jednak w miarę pojawiania się kolejnych informacji uzasadnione jest głębsze zbadanie rzeczywistych kosztów.

Aby ująć to w perspektywie, DeepSeek zaczynał jako spółka zależna chińskiego funduszu hedgingowego High-Flyer. Według SemiAnalysis, w 2021 r. DeepSeek nabył 10 000 jednostek procesorów graficznych A100 firmy NVIDIA, zanim wprowadzono surowe kontrole eksportu. Po decyzji spółki macierzystej o wydzieleniu projektu DeepSeek szybko rozszerzył swoją działalność, znacznie zwiększając swoje możliwości obliczeniowe.

Analiza kosztów sprzętu DeepSeek — Źródła obrazów: SemiAnalysis

Wyniki wskazują, że DeepSeek jest wyposażony w około 10 000 „specyficznych dla Chin” procesorów graficznych H800 AI, a także 10 000 najnowocześniejszych układów H100 AI. Ponadto organizacja zainwestowała w akceleratory H20 AI firmy NVIDIA, tworząc znaczną „pulę” zasobów współdzielonych między przedsięwzięciami DeepSeek i High-Flyer na potrzeby działań obejmujących handel, badania, szkolenia i wnioskowanie.Łącznie CapEx dla DeepSeek szacuje się na około 1, 6 miliarda dolarów, a wydatki operacyjne mają osiągnąć około 944 milionów dolarów — kwoty te są nawet 400 razy wyższe niż wcześniejsze obliczenia rynkowe.

Ważne jest, aby zauważyć, że początkowy kosztorys prawdopodobnie stanowił jedynie ułamek całkowitych kosztów szkolenia związanych z uruchomieniem modelu R1. Co godne uwagi, DeepSeek wykazał zdolność przyciągania lokalnych talentów poprzez organizowanie wydarzeń rekrutacyjnych na prestiżowych uniwersytetach, a wybrani pracownicy otrzymywali pensje przekraczające 1, 3 miliona dolarów. Ta strategia umożliwiła zespołowi programistów DeepSeek projektowanie konkurencyjnych rozwiązań zdolnych do konkurowania z gigantami branży, takimi jak OpenAI. Niestety, błędnie podane dane finansowe dały impuls do wydarzenia z zeszłego tygodnia, tzw.czarnego łabędzia na rynku.

Firma SemiAnalysis przeprowadziła szeroko zakrojoną ocenę modelu sztucznej inteligencji DeepSeek; zachęcamy czytelników do zgłębienia tych ustaleń w celu uzyskania dalszych spostrzeżeń i uzyskania szczegółowych informacji.

Źródło i obrazy