Model OpenAI Codex wykorzystuje infrastrukturę Cerebras, oferując potężną alternatywę dla rozwiązań NVIDIA w zakresie wnioskowania AI

Firma OpenAI wykonała znaczący krok naprzód w swojej technologicznej podróży, integrując zaawansowane układy sztucznej inteligencji firmy Cerebras ze swoimi systemami. Ta współpraca stanowi przełomowy moment, podkreślając szerszą zmianę w krajobrazie komputerowym, ponieważ OpenAI ujawnia, że ​​jej najnowszy model, Codex, jest teraz wspierany przez Cerebras, oprócz konwencjonalnego wsparcia ze strony firmy NVIDIA.

OpenAI osiąga imponującą wydajność 1000 TPS dzięki technologii Cerebras High-Speed

W miarę jak OpenAI kształtowało swoją relację finansową z firmą NVIDIA, warto zauważyć, że wcześniejsze partnerstwo z Cerebras okazało się przełomem w dziedzinie obliczeń. W niedawnej wersji GPT‑5.3‑Codex‑Spark, OpenAI podkreśliło zalety sprzętu Cerebras, w szczególności jego wyjątkową wydajność „niskich opóźnień” w zadaniach inferencyjnych. Ta współpraca stanowi poważne wyzwanie dla dominacji firmy NVIDIA, szczególnie w obszarze inferencji modeli.

Wariant Codex-Spark wyróżnia się na tle tradycyjnych modeli Codex możliwością zwiększenia wydajności operacyjnej. OpenAI zapewnia, że ​​model ten został zaprojektowany specjalnie z myślą o natychmiastowej reakcji, co przekłada się na znaczną redukcję opóźnień. Dzięki optymalizacji procesów przetwarzania i efektywnemu wykorzystaniu najnowocześniejszego sprzętu Cerebras, firma deklaruje redukcję czasu do pierwszego tokenu aż o 50%, co podkreśla jej możliwości. Co istotne, Codex-Spark działa w oparciu o silnik Cerebras Wafer Scale Engine 3, charakteryzujący się imponującymi parametrami, jak przedstawiono poniżej:

Specyfikacja GPW-3
Węzeł procesu TSMC 5 nm
Tranzystory ~4 biliony
Rdzenie obliczeniowe 900 000 rdzeni zoptymalizowanych pod kątem sztucznej inteligencji
Pamięć SRAM na chipie 44 GB
Przepustowość pamięci (na chipie) 21 PB/s
Rozmiar opłatka Pełny układ scalony o wielkości wafla 300 mm
Architektura rdzeniowa Zoptymalizowane pod kątem sztucznej inteligencji programowalne rdzenie przetwarzające

Uzasadnienie wyboru Cerebras przez OpenAI można przypisać przede wszystkim znacznej przepustowości pamięci oferowanej przez WSE-3, która jest niezbędna do zadań wymagających dużej ilości pamięci, takich jak kodowanie. To wsparcie wysokiej wydajności pozwala Codex-Spark osiągnąć imponującą przepustowość 1000 transakcji na sekundę (TPS), co czyni go responsywnym jak „programista w parze ludzkiej”.Co ciekawe, trenowanie tego modelu w infrastrukturze NVIDIA byłoby ekonomicznie nieefektywne ze względu na nacisk na przetwarzanie wsadowe, a nie na wydajność przy niskich opóźnieniach, dlatego Cerebras okazuje się logicznym wyborem.

Porównanie Cerebras Wafer Scale Engine 3 i NVIDIA H100
Źródła obrazów: Cerebras

Pomimo obiecujących możliwości Cerebras w zakresie scenariuszy inferencyjnych, NVIDIA nadal odgrywa dominującą rolę na rynku. Ich ostatnie ogłoszenia wskazują na nawet dziesięciokrotną redukcję kosztów tokenów dzięki architekturze Blackwell, co dodatkowo umacnia ich pozycję. Sachin Katti z OpenAI zauważył „uzupełniające się możliwości” oferowane przez Cerebras, jednak wydaje się, że lojalność laboratorium AI na polu bitwy obliczeniowej pozostaje głównie po stronie NVIDIA. Pojawienie się Codex-Spark uwypukla jednak krytyczne wąskie gardło w zakresie opóźnień, z którym obecna platforma technologiczna NVIDIA może nie być optymalnie przygotowana do konkurowania.

Patrząc w przyszłość, rynek układów wnioskowania wydaje się coraz bardziej konkurencyjny, a NVIDIA mierzy się z potężnymi konkurentami, takimi jak Cerebras, a także z innowacjami innych producentów układów ASIC i konkurentów, takich jak AMD. Pozostaje pytanie, jak ta dynamika wpłynie na strategię i pozycję rynkową firmy NVIDIA w nadchodzących latach.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *