Model OpenAI Codex wykorzystuje infrastrukturę Cerebras, oferując potężną alternatywę dla rozwiązań NVIDIA w zakresie wnioskowania AI

Firma OpenAI wykonała znaczący krok naprzód w swojej technologicznej podróży, integrując zaawansowane układy sztucznej inteligencji firmy Cerebras ze swoimi systemami. Ta współpraca stanowi przełomowy moment, podkreślając szerszą zmianę w krajobrazie komputerowym, ponieważ OpenAI ujawnia, że jej najnowszy model, Codex, jest teraz wspierany przez Cerebras, oprócz konwencjonalnego wsparcia ze strony firmy NVIDIA.

OpenAI osiąga imponującą wydajność 1000 TPS dzięki technologii Cerebras High-Speed

W miarę jak OpenAI kształtowało swoją relację finansową z firmą NVIDIA, warto zauważyć, że wcześniejsze partnerstwo z Cerebras okazało się przełomem w dziedzinie obliczeń. W niedawnej wersji GPT‑5.3‑Codex‑Spark, OpenAI podkreśliło zalety sprzętu Cerebras, w szczególności jego wyjątkową wydajność „niskich opóźnień” w zadaniach inferencyjnych. Ta współpraca stanowi poważne wyzwanie dla dominacji firmy NVIDIA, szczególnie w obszarze inferencji modeli.

Wariant Codex-Spark wyróżnia się na tle tradycyjnych modeli Codex możliwością zwiększenia wydajności operacyjnej. OpenAI zapewnia, że model ten został zaprojektowany specjalnie z myślą o natychmiastowej reakcji, co przekłada się na znaczną redukcję opóźnień. Dzięki optymalizacji procesów przetwarzania i efektywnemu wykorzystaniu najnowocześniejszego sprzętu Cerebras, firma deklaruje redukcję czasu do pierwszego tokenu aż o 50%, co podkreśla jej możliwości. Co istotne, Codex-Spark działa w oparciu o silnik Cerebras Wafer Scale Engine 3, charakteryzujący się imponującymi parametrami, jak przedstawiono poniżej:

Specyfikacja	GPW-3
Węzeł procesu	TSMC 5 nm
Tranzystory	~4 biliony
Rdzenie obliczeniowe	900 000 rdzeni zoptymalizowanych pod kątem sztucznej inteligencji
Pamięć SRAM na chipie	44 GB
Przepustowość pamięci (na chipie)	21 PB/s
Rozmiar opłatka	Pełny układ scalony o wielkości wafla 300 mm
Architektura rdzeniowa	Zoptymalizowane pod kątem sztucznej inteligencji programowalne rdzenie przetwarzające

Uzasadnienie wyboru Cerebras przez OpenAI można przypisać przede wszystkim znacznej przepustowości pamięci oferowanej przez WSE-3, która jest niezbędna do zadań wymagających dużej ilości pamięci, takich jak kodowanie. To wsparcie wysokiej wydajności pozwala Codex-Spark osiągnąć imponującą przepustowość 1000 transakcji na sekundę (TPS), co czyni go responsywnym jak „programista w parze ludzkiej”.Co ciekawe, trenowanie tego modelu w infrastrukturze NVIDIA byłoby ekonomicznie nieefektywne ze względu na nacisk na przetwarzanie wsadowe, a nie na wydajność przy niskich opóźnieniach, dlatego Cerebras okazuje się logicznym wyborem.

Porównanie Cerebras Wafer Scale Engine 3 i NVIDIA H100 — Źródła obrazów: Cerebras

Pomimo obiecujących możliwości Cerebras w zakresie scenariuszy inferencyjnych, NVIDIA nadal odgrywa dominującą rolę na rynku. Ich ostatnie ogłoszenia wskazują na nawet dziesięciokrotną redukcję kosztów tokenów dzięki architekturze Blackwell, co dodatkowo umacnia ich pozycję. Sachin Katti z OpenAI zauważył „uzupełniające się możliwości” oferowane przez Cerebras, jednak wydaje się, że lojalność laboratorium AI na polu bitwy obliczeniowej pozostaje głównie po stronie NVIDIA. Pojawienie się Codex-Spark uwypukla jednak krytyczne wąskie gardło w zakresie opóźnień, z którym obecna platforma technologiczna NVIDIA może nie być optymalnie przygotowana do konkurowania.

Patrząc w przyszłość, rynek układów wnioskowania wydaje się coraz bardziej konkurencyjny, a NVIDIA mierzy się z potężnymi konkurentami, takimi jak Cerebras, a także z innowacjami innych producentów układów ASIC i konkurentów, takich jak AMD. Pozostaje pytanie, jak ta dynamika wpłynie na strategię i pozycję rynkową firmy NVIDIA w nadchodzących latach.

Źródło i obrazy

Model OpenAI Codex wykorzystuje infrastrukturę Cerebras, oferując potężną alternatywę dla rozwiązań NVIDIA w zakresie wnioskowania AI

OpenAI osiąga imponującą wydajność 1000 TPS dzięki technologii Cerebras High-Speed

Powiązane artykuły:

Luty 2026 r. – dodatkowe gry w ramach PS Plus, w tym Marvel's Spider-Man 2 i mocne tytuły niezależne

Micron rozpoczyna masową produkcję pierwszego na świecie dysku SSD PCIe Gen6: 9650 oferującego prędkość odczytu do 28 GB/s

Dodaj komentarz Anuluj pisanie odpowiedzi