
Chińska firma technologiczna DeepSeek wydaje się być gotowa do wprowadzenia na rynek swojego najnowszego modelu AI, „DeepSeek R2”, już wkrótce. Pojawiły się wczesne szczegóły, które wzbudziły zainteresowanie w całej społeczności technologicznej.
DeepSeek R2: przełom w dziedzinie sztucznej inteligencji oparty na technologii Huawei
Pierwszy główny model sztucznej inteligencji DeepSeek, R1, udowodnił, że Chiny są w stanie konkurować w high-endowym krajobrazie sztucznej inteligencji, kwestionując postrzeganą technologiczną supremację zachodnich firm. Odsłonięcie R1 wywołało poruszenie na giełdzie amerykańskiej, przyczyniając się do strat w wysokości miliardów dolarów, a jednocześnie ujawniając, że zaawansowany rozwój sztucznej inteligencji nie zawsze wymaga ogromnych budżetów, które sugerowały firmy takie jak OpenAI. Ostatnio chińskie media zaczęły rozpowszechniać plotki dotyczące nadchodzącego modelu R2, sugerując, że zachodni sektor sztucznej inteligencji może zostać ponownie zaskoczony innowacyjnymi osiągnięciami z Chin.
🚨Wyciekły wirusowe plotki o DeepSeek R2!
—1, 2T param, 78B aktywne, hybrydowy MoE — 97, 3% tańszy niż GPT 4o (0, 07 USD/M na wejściu, 0, 27 USD/M na wyjściu) — 5, 2PB danych treningowych.89, 7% na C-Eval2.0 — lepsza widoczność.92, 4% na COCO — 82% wykorzystania w Huawei Ascend 910B
Duże odejście od amerykańskiego łańcucha dostaw.pic.twitter.com/Jncg0PvEYU
— Deedy (@deedydas) 26 kwietnia 2025 r.
Chociaż szum wokół modelu R2 jest ekscytujący, kluczowe jest, aby podchodzić do tych raportów z ostrożnością, ponieważ DeepSeek nie potwierdził jeszcze oficjalnie żadnych szczegółów. Według źródeł, DeepSeek R2 będzie wykorzystywał hybrydową architekturę Mixture of Experts (MoE), ulepszoną iterację, która potencjalnie integruje zaawansowane mechanizmy bramkowania obok tradycyjnych gęstych warstw. Przewiduje się, że ta architektura niemal podwoi liczbę parametrów, co da oszałamiające 1, 2 biliona parametrów.

Już sama liczba parametrów pozycjonuje R2 jako groźnego konkurenta dla modeli takich jak OpenAI’s GPT-4 Turbo i Google’s Gemini 2.0 Pro. Jednak implikacje finansowe są równie znaczące; raporty sugerują, że DeepSeek R2 zaoferuje koszty przetwarzania tokenów, które są nawet o 97, 4% niższe niż GPT-4, a ceny ustalono na około 0, 07 USD za milion tokenów wejściowych i 0, 27 USD za milion tokenów wyjściowych. Ta strategia cenowa wskazuje, że R2 może z łatwością stać się najbardziej opłacalnym ekonomicznie rozwiązaniem AI, zmieniającym dynamikę rynku.
Co więcej, warto zauważyć, że model R2 ma wykorzystywać 82% zasobów obliczeniowych klastra chipów Ascend 910B firmy Huawei, prezentując solidną moc obliczeniową 512 PetaFLOPS przy użyciu precyzji FP16. Ten strategiczny wybór wykorzystania wewnętrznych chipów sygnalizuje zaangażowanie DeepSeek w konsolidację łańcucha dostaw AI i optymalizację zarządzania zasobami.
Chociaż te wydarzenia wokół DeepSeek R2 pozostają spekulacyjne, wstępne spostrzeżenia malują obraz produktu, który może stanowić poważne wyzwanie dla uznanych graczy w dziedzinie AI. Oczekiwana premiera może być punktem zwrotnym, wpływającym nie tylko na postęp technologiczny, ale także na ekonomię AI na rynkach globalnych.
Dodaj komentarz