Firma OpenAI wykonała znaczący krok naprzód w swojej technologicznej podróży, integrując zaawansowane układy sztucznej inteligencji firmy Cerebras ze swoimi systemami. Ta współpraca stanowi przełomowy moment, podkreślając szerszą zmianę w krajobrazie komputerowym, ponieważ OpenAI ujawnia, że jej najnowszy model, Codex, jest teraz wspierany przez Cerebras, oprócz konwencjonalnego wsparcia ze strony firmy NVIDIA.
OpenAI osiąga imponującą wydajność 1000 TPS dzięki technologii Cerebras High-Speed
W miarę jak OpenAI kształtowało swoją relację finansową z firmą NVIDIA, warto zauważyć, że wcześniejsze partnerstwo z Cerebras okazało się przełomem w dziedzinie obliczeń. W niedawnej wersji GPT‑5.3‑Codex‑Spark, OpenAI podkreśliło zalety sprzętu Cerebras, w szczególności jego wyjątkową wydajność „niskich opóźnień” w zadaniach inferencyjnych. Ta współpraca stanowi poważne wyzwanie dla dominacji firmy NVIDIA, szczególnie w obszarze inferencji modeli.
Wariant Codex-Spark wyróżnia się na tle tradycyjnych modeli Codex możliwością zwiększenia wydajności operacyjnej. OpenAI zapewnia, że model ten został zaprojektowany specjalnie z myślą o natychmiastowej reakcji, co przekłada się na znaczną redukcję opóźnień. Dzięki optymalizacji procesów przetwarzania i efektywnemu wykorzystaniu najnowocześniejszego sprzętu Cerebras, firma deklaruje redukcję czasu do pierwszego tokenu aż o 50%, co podkreśla jej możliwości. Co istotne, Codex-Spark działa w oparciu o silnik Cerebras Wafer Scale Engine 3, charakteryzujący się imponującymi parametrami, jak przedstawiono poniżej:
| Specyfikacja | GPW-3 |
|---|---|
| Węzeł procesu | TSMC 5 nm |
| Tranzystory | ~4 biliony |
| Rdzenie obliczeniowe | 900 000 rdzeni zoptymalizowanych pod kątem sztucznej inteligencji |
| Pamięć SRAM na chipie | 44 GB |
| Przepustowość pamięci (na chipie) | 21 PB/s |
| Rozmiar opłatka | Pełny układ scalony o wielkości wafla 300 mm |
| Architektura rdzeniowa | Zoptymalizowane pod kątem sztucznej inteligencji programowalne rdzenie przetwarzające |
Uzasadnienie wyboru Cerebras przez OpenAI można przypisać przede wszystkim znacznej przepustowości pamięci oferowanej przez WSE-3, która jest niezbędna do zadań wymagających dużej ilości pamięci, takich jak kodowanie. To wsparcie wysokiej wydajności pozwala Codex-Spark osiągnąć imponującą przepustowość 1000 transakcji na sekundę (TPS), co czyni go responsywnym jak „programista w parze ludzkiej”.Co ciekawe, trenowanie tego modelu w infrastrukturze NVIDIA byłoby ekonomicznie nieefektywne ze względu na nacisk na przetwarzanie wsadowe, a nie na wydajność przy niskich opóźnieniach, dlatego Cerebras okazuje się logicznym wyborem.

Pomimo obiecujących możliwości Cerebras w zakresie scenariuszy inferencyjnych, NVIDIA nadal odgrywa dominującą rolę na rynku. Ich ostatnie ogłoszenia wskazują na nawet dziesięciokrotną redukcję kosztów tokenów dzięki architekturze Blackwell, co dodatkowo umacnia ich pozycję. Sachin Katti z OpenAI zauważył „uzupełniające się możliwości” oferowane przez Cerebras, jednak wydaje się, że lojalność laboratorium AI na polu bitwy obliczeniowej pozostaje głównie po stronie NVIDIA. Pojawienie się Codex-Spark uwypukla jednak krytyczne wąskie gardło w zakresie opóźnień, z którym obecna platforma technologiczna NVIDIA może nie być optymalnie przygotowana do konkurowania.
Patrząc w przyszłość, rynek układów wnioskowania wydaje się coraz bardziej konkurencyjny, a NVIDIA mierzy się z potężnymi konkurentami, takimi jak Cerebras, a także z innowacjami innych producentów układów ASIC i konkurentów, takich jak AMD. Pozostaje pytanie, jak ta dynamika wpłynie na strategię i pozycję rynkową firmy NVIDIA w nadchodzących latach.
Dodaj komentarz