
Firma NVIDIA nadal wywiera wpływ na branżę technologiczną dzięki swoim najnowszym osiągnięciom w dziedzinie renderowania neuronowego i gier, w szczególności dzięki serii kart graficznych Blackwell RTX, obejmującej modele RTX 5090 i RTX PRO 6000.
NVIDIA prezentuje innowacje Blackwell RTX na konferencji Hot Chips 2025
Wprowadzona na rynek w styczniu 2023 roku architektura Blackwell RTX zaprezentowała przełomowe funkcje, które koncentrują się przede wszystkim na sztucznej inteligencji (AI).Ta innowacja nie jest nowym przedsięwzięciem firmy NVIDIA, ponieważ jej historia rozpoczęła się od wprowadzenia CUDA w 2006 roku, co stanowiło znaczący postęp w dziedzinie akcelerowanych obliczeń i sztucznej inteligencji.

NVIDIA twierdzi, że postęp w zakresie gęstości obliczeniowej przekroczył skalowanie zgodne z prawem Moore’a, osiągnięty dzięki takim technikom jak Sparsity, nowa architektura zestawu instrukcji (ISA) oraz zoptymalizowane formaty o niższej precyzji. Wprowadzenie w 2018 roku śledzenia promieni w czasie rzeczywistym oraz późniejsze wprowadzenie DLSS w kolejnym roku stanowią kluczowe kamienie milowe w tej ewolucji.

Innowacje te osiągnięto dzięki zastosowaniu zaawansowanych technologii, w tym rdzeni RT i rdzeni Tensor, a teraz Blackwell podnosi te możliwości na nowy poziom.

W obszarze centrów danych NVIDIA wprowadziła precyzję FP4, zapewniając czterokrotnie większą wydajność w przypadku obciążeń wymagających dużej skalowalności. Jensen Huang, dyrektor generalny NVIDIA, dąży do potwierdzenia kluczowej roli sztucznej inteligencji w grafice, wspierając nadejście ery renderowania neuronowego dzięki Blackwell RTX. Marka RTX symbolizuje innowacyjność w symulacjach, tworzeniu treści i grach, torując drogę do rozszerzenia technologii centrów danych na konsumenckie procesory graficzne RTX.

Co zatem wnosi architektura Blackwell? Oferuje ona takie udoskonalenia, jak DLSS 4, MFG, ACE i ulepszone śledzenie ścieżki (Path Tracing), zaprojektowane w celu przyspieszenia wydajności i poprawy wierności obrazu. NVIDIA twierdzi, że Blackwell RTX może osiągnąć „10-krotny wzrost wydajności, zajmowanej powierzchni i cyklu projektowania”.DLSS 4 strategicznie wykorzystuje sztuczną inteligencję do renderowania 100% pikseli po pierwszej klatce, co ostatecznie przekłada się na krótszy czas renderowania i dłuższy czas pracy baterii w urządzeniach mobilnych.

Kluczowe zasady projektowania procesora graficznego RTX Blackwell obejmują:
- Optymalizacja pod kątem nowych obciążeń neuronowych
- Minimalizowanie zużycia pamięci
- Zapewnienie wysokiej jakości usług dla zadań neuronowych i graficznych
- Skalowalna efektywność energetyczna

W skali technicznej, RTX Blackwell to potęga inżynieryjna, oferująca 4000 operacji AI na sekundę (TOPS) i obsługę szybkiego FP4 w oparciu o rdzenie Tensor piątej generacji. Zapewnia do 360 RT TFLOP-ów ukierunkowanych na megageometrię dzięki rdzeniom RT czwartej generacji, a proces zarządzania AI (AMP) skutecznie zarządza modelami AI i przetwarzaniem grafiki.

Architektura procesora strumieniowego RTX Blackwell Streaming Multiprocessor (SM) znacząco różni się od architektury jego odpowiednika w centrach danych. Jednym z istotnych ulepszeń jest integracja jednostek FP32 i INT32, które wcześniej były oddzielne, co zwiększa wydajność przetwarzania.

Co więcej, RTX Blackwell ulepsza funkcję Shader Execution Reordering (SER), podwajając wydajność wykonywania shaderów.

Rdzeń Tensor piątej generacji wprowadza obsługę FP4 i obejmuje tryb MFG w DLSS 4, umożliwiając procesorowi graficznemu wykorzystanie sztucznej inteligencji do jednoczesnego renderowania czterech klatek.

W rezultacie wykorzystanie DLSS 4 wraz z generowaniem klatek znacząco skraca czas renderowania poszczególnych klatek, zapewniając dziesięciokrotny wzrost szybkości bramkowania rdzenia, a jednocześnie osiągając 100-krotnie wyższą częstotliwość odświeżania pamięci DRAM. Platformy mobilne mogą odnotować nawet dwukrotną redukcję zużycia energii przez GPU, co znacznie wydłuża czas pracy na baterii.

Wprowadzenie pamięci GDDR7 umożliwia karcie RTX Blackwell osiągnięcie prędkości do 30 Gb/s, co skutecznie podwaja przepustowość w porównaniu z poprzednią pamięcią GDDR6. Ten nowy standard pamięci dodatkowo zwiększa wydajność na platformach mobilnych.
Dzięki jednostce AMP firmy NVIDIA jednoczesne wykonywanie zadań związanych ze sztuczną inteligencją i grafiką stało się rzeczywistością, co przekłada się na płynniejsze dostarczanie klatek i szybszą reakcję modelu.

Przechodząc od zastosowań gamingowych do zastosowań profesjonalnych, NVIDIA wprowadza w karcie RTX PRO 6000 nowe funkcje, takie jak Universal MIG. Pozwala to na jednoczesną pracę maksymalnie czterech instancji procesorów graficznych RTX PRO, z których każda wyposażona jest w 24 GB pamięci VRAM, przy zachowaniu stałego opóźnienia i przepustowości.
Podczas imponującej demonstracji zaprezentowano możliwości karty RTX PRO 6000, uruchamiając cztery instancje Cyberpunk 2077 w rozdzielczości 1080p przy maksymalnych ustawieniach. Było to zadanie wykonalne dla tej wydajnej karty graficznej.

Przy użyciu standardowej instancji z podziałem czasowym jako punktu odniesienia, porównania z trybami MIG 2x i 4x ujawniły znaczący wzrost skalowalności o 60%.Karta graficzna RTX PRO 6000 Blackwell rzeczywiście doskonale nadaje się do zarządzania wieloma instancjami wymagających aplikacji, takich jak Cyberpunk 2077.

Ogólnie rzecz biorąc, architektura GPU Blackwell firmy NVIDIA poczyniła znaczne postępy od momentu premiery, stale ewoluując zarówno pod kątem zastosowań konsumenckich, jak i profesjonalnych. Wraz z rosnącą liczbą gier i narzędzi do tworzenia treści, które wykorzystują rozbudowane udoskonalenia w zakresie sztucznej inteligencji i neuronów oferowane przez Blackwell, oczekiwania związane z przyszłymi rozwiązaniami w tej dziedzinie są coraz bardziej wyczuwalne.
Dodaj komentarz