Czy DeepSeek zburzył dominację NVIDIA w dziedzinie AI? Odkrywamy przyszłość wspaniałej siódemki w dziedzinie AI

Czy DeepSeek zburzył dominację NVIDIA w dziedzinie AI? Odkrywamy przyszłość wspaniałej siódemki w dziedzinie AI

Inwestorzy w sztuczną inteligencję (AI), zwłaszcza ci skupieni na NVIDIA, odczuwają skutki niepokojącego przełomu chińskiej firmy DeepSeek. Ich najnowsza oferta, model R1 AI, wprowadziła nowy paradygmat w szkoleniu modeli i znacznie zmniejszyła wymagania dotyczące zasobów, wywołując efekt domina na całym rynku.

Model DeepSeek R1: transformacja szkolenia AI i dynamiki rynku

Jeśli nie jesteś świadomy trwających zawirowań na rynku AI, szczególnie wokół NVIDIA, niech to posłuży jako pouczający przewodnik. Niedawne wprowadzenie przez DeepSeek modelu AI, który można trenować przy znacznie niższych zasobach finansowych, ponownie rozpaliło debaty na temat trwałości tzw.„supercyklu AI”.Koszty szkolenia związane z DeepSeek R1 są szokujące i podważają istniejące postrzeganie inwestycji w AI.

Model DeepSeek R1

R1 to pionierski model dużego języka (LLM) typu open source, który wykorzystuje odrębną metodologię szkolenia, odróżniającą go od współczesnych. Zamiast zagłębiać się w aspekty techniczne, należy podkreślić, że mechanizm R1 działa w oparciu o podejście „łańcucha myśli”.Oznacza to, że przy każdym monicie sztuczna inteligencja opisuje kroki podejmowane w celu dojścia do wniosku, umożliwiając użytkownikom identyfikację miejsc, w których mogły wystąpić błędy podczas przetwarzania.

Ponadto DeepSeek R1 wykorzystuje „Reinforcement Learning”, strategię uczenia maszynowego, w której model uczy się poprzez interakcję ze swoim otoczeniem i maksymalizację nagród za poprawne wyniki. Ta metoda kontrastuje z GPT-O1 firmy OpenAI, która w dużej mierze opiera się na uczeniu nadzorowanym i ogromnych zbiorach danych, co znacznie zwiększa koszty szkolenia.

Porównanie modeli AI

Pomimo powszechnych nieporozumień, plotka o koszcie szkolenia DeepSeek R1 wynoszącym 5, 6 mln USD jest myląca; kwota ta odzwierciedla jedynie koszty operacyjne ostatecznego modelu, a nie pełny zakres wydatków poniesionych podczas jego rozwoju. Biorąc pod uwagę ograniczenia Chin w dostępie do zaawansowanej infrastruktury obliczeniowej AI, DeepSeek zdecydował się nie ujawniać pełnego zakresu swoich możliwości, co skłoniło ekspertów do spekulacji, że mogą posiadać porównywalną, jeśli nie lepszą, technologię.

W jaskrawym porównaniu finansowym koszty operacyjne R1 są około pięć razy niższe niż koszty związane z tokenami wejściowymi i wyjściowymi dla GPT-O1 OpenAI. Ta dysproporcja wywołała falę niepewności i intrygi na rynku. Ważne jest jednak, aby zachować perspektywę optymizmu w odniesieniu do postępów technologicznych DeepSeek.

NVIDIA niewątpliwie odnotowała solidny wzrost przychodów z zasobów obliczeniowych AI, a giganci branży, tacy jak OpenAI, nadal wykorzystują lepszą technologię w porównaniu z DeepSeek. Jeśli DeepSeek może osiągnąć takie wyniki przy ograniczonej mocy obliczeniowej, wyobraź sobie możliwości firm wyposażonych w zaawansowane technologie. Ta sytuacja może zwiastować świetlaną przyszłość dla sektora AI.

Nie ma rywala dla ekosystemu CUDA firmy NVIDIA, co oznacza, że ​​jesteśmy dopiero na progu potencjału AI. Pojawienie się R1 firmy DeepSeek nie oznacza końca szumu wokół AI; raczej oświetla obszary niezbadanego potencjału w branży. Chociaż postępy firmy DeepSeek spowodowały ogromny spadek kapitału rynkowego firmy NVIDIA o ponad 300 miliardów dolarów, oczekuje się, że rynek zostanie skalibrowany ponownie, gdy pojawi się uznanie pozytywnych aspektów sytuacji.

Eksperci sugerują, że w obliczu przyspieszenia inicjatyw w zakresie sztucznej inteligencji przez firmy takie jak Meta, Google i Amazon sukces DeepSeek może ostatecznie zmienić nastawienie na bardziej optymistyczne w stosunku do firmy NVIDIA i całego sektora sztucznej inteligencji.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *