Wraz z rozwojem branży sztucznej inteligencji (AI), tradycyjne wskaźniki oceny infrastruktury AI stają się coraz bardziej przestarzałe. W odpowiedzi NVIDIA opowiada się za zmianą paradygmatu w rozumieniu całkowitego kosztu posiadania (TCO) AI poprzez wprowadzenie wskaźnika „ koszt na token ”.
NVIDIA redefiniuje całkowity koszt posiadania sztucznej inteligencji dzięki kosztowi za tokeny
W kontekście sztucznej inteligencji (AI), tokeny stały się najważniejszym wskaźnikiem. W przeciwieństwie do poprzednich generacji centrów danych, które koncentrowały się głównie na surowej mocy obliczeniowej, współczesne infrastruktury AI – zwane fabrykami AI – są oceniane na podstawie generowanych przez nie tokenów. Nacisk przesuwa się obecnie z prostego generowania dużej liczby tokenów na osiąganie wydajności i opłacalności. Dlatego kluczowe jest ponowne przemyślenie koncepcji całkowitego kosztu posiadania (TCO) dla fabryk AI.
NVIDIA podkreśla, że wiele przedsiębiorstw nadal opiera się na przestarzałych wskaźnikach porównawczych, takich jak specyfikacje układów scalonych i koszty obliczeniowe. Zmiana podejścia jest niezbędna.
- Koszty obliczeniowe : Są to wydatki ponoszone przez przedsiębiorstwa na infrastrukturę sztucznej inteligencji, niezależnie od tego, czy pochodzi ona od dostawców usług w chmurze, czy jest utrzymywana lokalnie.
- FLOPS za dolara : Wskaźnik ten określa ilość mocy obliczeniowej, jaką przedsiębiorstwo uzyskuje za każdego wydanego dolara. Nie odzwierciedla on jednak dokładnie rzeczywistej wydajności tokenów.
- Koszt na token : Liczba ta przedstawia kompleksową analizę kosztów produkcji każdego dostarczonego tokena, zwykle wyrażanych jako koszt na milion tokenów.

W swojej analizie NVIDIA wyjaśnia kilka czynników, które mogą przyczynić się do obniżenia kosztu tokena. Przedstawia równanie do obliczania kosztu na milion tokenów, podkreślając, że wiele przedsiębiorstw z branży AI koncentruje się głównie na liczniku – koszcie na godzinę pracy GPU – pomijając kluczowy mianownik, który znacząco wpływa na całkowity koszt i przychody.
- Minimalizacja kosztów tokenów : Zwiększenie liczby tokenów może prowadzić do obniżenia kosztów na token, co w efekcie zwiększa marżę zysku z każdej przetwarzanej interakcji.
- Maksymalizacja przychodów : Wzrost liczby tokenów dostarczanych na sekundę oznacza większą liczbę tokenów na megawat, przyczyniając się tym samym do zwiększenia inteligencji produktów i usług opartych na sztucznej inteligencji — z potencjałem zwiększenia przychodów z istniejących inwestycji w infrastrukturę.
Dlaczego to takie ważne? Podstawowa odpowiedź leży w fakcie, że dla przedsiębiorstw z branży AI priorytetem jest skupienie się na koszcie tokena, a nie na uproszczonych porównaniach, takich jak liczba flopów na dolara.

NVIDIA porównuje wskaźniki wydajności i kosztów swoich procesorów graficznych Hopper i Blackwell, ujawniając, że chociaż procesory graficzne Hopper są znacznie tańsze w eksploatacji – około dwukrotnie – liczba FLOPS-ów na dolara wskazuje na podobną, dwukrotną różnicę. Jednak samo to nie oddaje istotnych zalet oferowanych przez architekturę Blackwell.
Prawdziwe różnice ujawniają się, gdy weźmiemy pod uwagę przepustowość tokenów i koszt za milion tokenów. W tych obszarach Blackwell przewyższa Hoppera nawet 65 razy, a koszt za milion tokenów jest aż 35 razy niższy. Dla porównania, informacje te pochodzą z benchmarku InferenceX v2 firmy SemiAnalysis.
| Metryczny | NVIDIA Hopper (HGX H200) | NVIDIA Blackwell (GB300 NVL72) | NVIDIA Blackwell w porównaniu do Hoppera |
|---|---|---|---|
| Koszt na GPU za godzinę ($) | 1, 41 dolara | 2, 65 dolara | 2x |
| FLOP za dolara (PFLOPS) | 2.8 | 5.6 | 2x |
| Tokeny na sekundę na GPU | 90 | 6000 | 65x |
| Tokeny na sekundę na MW | 54 tys. | 2, 8 mln | 50x |
| Koszt za milion tokenów ($) | 4, 20 zł | 0, 12 USD | 35x niżej |
Choć można by odrzucić te liczby jako „matematykę CEO” firmy NVIDIA, istnieje istotna logika, która potwierdza ich znaczenie. NVIDIA szczyci się solidnym pakietem rozwiązań programowych z zakresu sztucznej inteligencji i konsekwentnie osiąga doskonałe wyniki w testach porównawczych, pozostawiając konkurencję daleko w tyle.
Dyrektor generalny firmy NVIDIA wezwał również inne firmy do przetestowania swoich układów, wymagając od nich dostarczenia dowodów na wyższą wydajność w porównaniu z produktami firmy NVIDIA.
„Nikt nie jest w stanie udowodnić mi, że jakakolwiek platforma na świecie ma obecnie lepszy wskaźnik całkowitego kosztu posiadania (TCO).Ani jedna firma… Zachęcam ich do korzystania z Inference Max i zademonstrowania ich niewiarygodnych kosztów wnioskowania. To naprawdę bardzo trudne… nikt nie chce się pojawić.”
Jensen Huang – dyrektor generalny NVIDIA
Definiując na nowo wskaźniki wpływające na wydajność sztucznej inteligencji, NVIDIA nie tylko ogłasza zwycięstwo w testach porównawczych; twierdzi również, że odgrywa kluczową rolę w ustalaniu wskaźników mających największe znaczenie dla przedsiębiorstw zajmujących się sztuczną inteligencją.
Dodaj komentarz