
To nie jest porada inwestycyjna. Autor nie posiada żadnych pozycji w akcjach wymienionych w niniejszym dokumencie.
xAI przedstawia Grok 3 LLM: Przełomowa gra czy przesada?
W ekscytującym odkryciu xAI uruchomiło swój model językowy Grok 3 (LLM) podczas transmisji na żywo w poniedziałek, której gospodarzem był nie kto inny, jak Elon Musk. Firma AI nazwała Grok 3 niezrównanym postępem w dziedzinie sztucznej inteligencji; jednak kilku ekspertów branżowych podważa reklamowane przez nią testy porównawcze, wskazując na znaczące niedociągnięcia.
grok 3 to najinteligentniejsza sztuczna inteligencja na świecie
teraz dostępne dla wszystkich abonentów Premium+
— Grok (@grok) 18 lutego 2025 r.
Według wpisu xAI, model Grok 3 jest reklamowany jako „najinteligentniejsza sztuczna inteligencja na świecie”, co wzbudza zainteresowanie w różnych sektorach.
GROK 3: ROZWIĄZYWANIE ZADAŃ FIZYKI, GIER I WSZECHŚWIATA
Pełna prezentacja i demo najnowszego modelu xAI
0:00 Misja xAI: Zrozumieć wszechświat 1:20 Prezentacja zespołu 2:01 Grok oznacza głębokie zrozumienie 2:29 Od Grok 2 do Grok 3 6:30 Testy porównawcze Grok 3 9:07 Grok 3 ulepsza… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I
— Mario Nawfal (@MarioNawfal) 18 lutego 2025 r.
Pełny film z demonstracji można znaleźć w poście zalinkowanym powyżej. Ponadto, po tym, co zostało nazwane „efektem DeepSeek”, Musk ogłosił, że wcześniejsza wersja, Grok 2, wkrótce zostanie udostępniona jako open source, oferując dalsze informacje na temat rozwoju technologii.
Nowy model „Grok 3” firmy xAI (opublikowany wczoraj wieczorem) pokonuje wszystkie inne publicznie udostępnione podstawowe modele (w tym DeepSeek-V3 i GPT-4o) w testach porównawczych z zakresu matematyki, nauk ścisłych i kodowania.pic.twitter.com/iB6KuDPsdc
— Stock Talk (@stocktalkweekly) 18 lutego 2025 r.
xAI aktywnie zapewnia, że Grok 3 przewyższa wszystkie inne publicznie dostępne modele bazowe, takie jak DeepSeek-V3 i GPT-4o, szczególnie w takich obszarach jak matematyka, nauka i programowanie. LLM osiągnął nawet imponujący wynik 1402 w teście Arena.
xAI przewyższyło oczekiwania
wygląda na to, że Grok 3 jest najpotężniejszą sztuczną inteligencją na świecie pic.twitter.com/OtO6rGD22e
— Manifold (@ManifoldMarkets) 18 lutego 2025 r.
Tymczasem w świecie spekulacyjnych inwestycji kontrakt na Manifold Markets dotyczący Grok 3 jako najpotężniejszej AI skłania się ku konkluzji „tak”.Jednak obserwujemy zauważalny spadek prawdopodobieństwa z 91% późnym wieczorem w poniedziałek do zaledwie 78% obecnie.
Wydaje się, że pojawiające się recenzje krytyczne Grok 3, choć ograniczone, mogą mieć wpływ na te malejące prawdopodobieństwa.
Mam na myśli, że do tego typu pytań potrzebne są modele rozumowania
— Bao Bui (@vqbaobui) 18 lutego 2025 r.
Na przykład Zihan Wang, były pracownik DeepSeek, zadał Grok 3 pytanie z zakresu fizyki, prezentując obraz dwóch żelaznych kul o różnych rozmiarach zawieszonych na różnych wysokościach pod Krzywą Wieżą w Pizie, pytając, która uderzy w ziemię pierwsza. Oczekiwaną logiczną odpowiedzią byłaby cięższa kula, jednak Grok 3 błędnie stwierdził, że obie wylądują jednocześnie.
Można odróżnić influencera od prawdziwych ludzi. Nawet @Teknium1 całuje pierścień. Jest powód, dla którego nie mówili o FrontierMath, Arc-AGI lub HLE, jednocześnie reklamując to jako „najmądrzejszy model”.Moje początkowe testy mają ten sam klimat co @karpathy : zbliżają się do o1-pro, ale nie są nawet blisko o3-mini.
— relletreknit (@relletreknit) 18 lutego 2025 r.
Ponadto pojawiają się coraz większe wątpliwości dotyczące decyzji xAI o nieudostępnianiu metryk wydajności Grok 3 w uznanych testach porównawczych, takich jak FrontierMath, Arc-AGI czy HLE.
Ważne jest, aby zauważyć, że te krytyki nie mają na celu umniejszenia potencjału Grok 3, który jest niewątpliwie imponującym modelem AI. Zamiast tego podnoszą ważne pytania o autentyczność twierdzeń xAI dotyczących jego wyższości.
Rozwój finansowy i perspektywy na przyszłość
W odrębnym, ale równie ważnym wydarzeniu Bloomberg niedawno poinformował, że xAI poszukuje do 10 miliardów dolarów nowego finansowania, co potencjalnie katapultuje jego wycenę do 75 miliardów dolarów. Wcześniej startup pozyskał 6 miliardów dolarów podczas rundy finansowania, która wyceniła go na 40 miliardów dolarów.
W zeszłym roku ledwo udało nam się trenować na poziomie 10k, ale udało nam się trenować non stop na poziomie 100k dla Grok3. Jesteśmy dumni, że będzie więcej!
— Guodong Zhang (@Guodzh) 18 lutego 2025 r.
Warto zauważyć, że Guodong Zhang z xAI ogłosił, że Grok 3 został wytrenowany przy użyciu imponujących 100 000 GPU, co wskazuje na znaczny skok w zasobach i możliwościach. Rozwój ten następuje pośród prognoz, że przychody ze sprzedaży chipów AI mogą wzrosnąć do 227 miliardów dolarów do 2032 roku.
Więcej szczegółów i spostrzeżeń można znaleźć w pełnym artykule tutaj.
Dodaj komentarz