
Należy pamiętać, że niniejsza treść nie stanowi porady inwestycyjnej. Autor nie posiada żadnych pozycji w akcjach omawianych w niniejszym dokumencie.
Model sztucznej inteligencji R1 firmy DeepSeek: rywalizacja z globalnymi gigantami
DeepSeek, pionierskie laboratorium sztucznej inteligencji w Chinach, zyskało znaczną uwagę dzięki wprowadzeniu na rynek modelu R1, który odbił się szerokim echem w całej branży. Ta najnowocześniejsza technologia AI ma podobno dostęp do dziesiątek tysięcy procesorów graficznych NVIDIA do szkolenia, pozycjonując się obok znanych modeli, takich jak o1 OpenAI i Llama Meta. Dyrektor generalny Scale AI, Alexandr Wang, niedawno podkreślił osiągnięcia DeepSeek w wnikliwym wywiadzie dla CNBC.
Zaawansowany krajobraz GPU firmy NVIDIA
Wang ujawnił, że seria Hopper firmy NVIDIA, obejmująca najnowsze procesory graficzne H100 i H200, reprezentuje obecny stan ich technologii. Podczas gdy NVIDIA zwiększa dostawy oczekiwanych układów Blackwell, te procesory graficzne Hopper pozostają kluczowe w napędzaniu postępu AI na całym świecie. Według Wanga model R1 nie tylko dorównał, ale nawet przewyższył wydajność najlepszych modeli AI podczas rygorystycznych ocen przeprowadzonych przez jego organizację.
Wnioski z „Ostatniego egzaminu ludzkości”
Podczas rozmowy z Andrew Rossem Sorkinem z CNBC Wang rozwinął temat intensywnego frameworka testowego nazwanego „Ostatni egzamin ludzkości”, zaprojektowanego w celu oceny sprawności AI poprzez złożone zapytania od szanowanych profesorów z takich dziedzin jak matematyka, fizyka, biologia i chemia. Wang zauważył, że wyniki wskazują, że R1 DeepSeek jest albo najlepszym wykonawcą, albo porównywalnym z wiodącymi amerykańskimi modelami, takimi jak o1.
Konkurencja USA-Chiny w dziedzinie sztucznej inteligencji: zmieniający się paradygmat
Odnosząc się do trwającej rywalizacji w dziedzinie sztucznej inteligencji między Stanami Zjednoczonymi a Chinami, Wang uznał historyczną przewagę Ameryki w tej dziedzinie, ale podkreślił, że postępy DeepSeek sygnalizują potencjalną zmianę sytuacji. Zwrócił uwagę na strategiczny moment wydania R1, zauważając jego odsłonięcie w Boże Narodzenie, okres typowo obchodzony na Zachodzie.

Debata na temat dostępności GPU
Następnie rozmowa skupiła się na dostępności procesorów graficznych w Chinach. Wang skomentował globalny popyt na wydajne procesory graficzne firmy NVIDIA, które stały się głównymi punktami amerykańskich przepisów eksportowych. Co ciekawe, administracja Bidena nałożyła ograniczenia od 2022 r.na sprzedaż tych wysokiej jakości układów do Chin, co doprowadziło do opracowania przez firmę NVIDIA alternatywnych modeli, w tym H800 i A800, które do października 2023 r.podlegały podobnym ograniczeniom.
Pamięć podręczna GPU firmy DeepSeek i przyszłe wyzwania
Według Wanga, podczas gdy w chińskich laboratoriach istnieją znaczące możliwości, rzeczywistość dostępu do tych zaawansowanych GPU jest zniuansowana. Oszacował, że DeepSeek posiada około 50 000 H100, co kwestionuje powszechne postrzeganie ich ograniczeń zasobów. Jednak Wang przyznał, że nadchodzące ograniczenia, z którymi te laboratoria mogą się mierzyć w ramach istniejących kontroli eksportowych, stwierdzając: „W przyszłości będą one ograniczone przez kontrole chipów i kontrole eksportowe, które mamy na miejscu”.
W miarę rozwoju globalnego krajobrazu sztucznej inteligencji konkurencja między tymi technologicznymi gigantami niewątpliwie będzie kształtować przyszłość rozwoju sztucznej inteligencji.
Dodaj komentarz