Podczas targów CES 2025 firma NVIDIA przedstawiła dogłębny przegląd swojej architektury GPU Blackwell nowej generacji, która ma napędzać nadchodzące karty graficzne do gier RTX 50. Ta innowacyjna konstrukcja obiecuje znaczące postępy w stosunku do poprzedniej architektury Ada, zwiększając wydajność, efektywność i możliwości graficzne zarówno dla graczy, jak i twórców treści.
Eksploracja architektury GPU NVIDIA GeForce RTX 50 „Blackwell”
Architektura Blackwell jest dostosowana do środowisk gier o wysokim zapotrzebowaniu i aplikacji kreatywnych, oferując przełomowe komponenty, które ułatwiają doskonałą wydajność. Wprowadzenie na rynek serii RTX 50 jest spodziewane pod koniec tego miesiąca, przynosząc architekturę stworzoną na węźle procesowym 4 nm TSMC. Ta najnowocześniejsza konstrukcja GPU obejmuje imponujące 92 miliardy tranzystorów, zapewniając do 4000 AI TOPS, 380 RT TFLOPs i 125 TFLOPS mocy obliczeniowej FP32. Ponadto może pochwalić się najszybszym interfejsem pamięci GDDR7, osiągając przepustowość do 1,8 TB/s, wszystko umieszczone w przeprojektowanej estetyce Founders Edition.
Szczegółowy przegląd architektury Blackwell
Architektura Blackwell firmy NVIDIA ma na celu podniesienie wydajności graficznej następnej generacji gier poprzez skupienie się na zaawansowanych możliwościach neuronowych i obciążeniach. Obejmuje to znaczną redukcję zajmowanej pamięci, lepszą efektywność energetyczną i innowacyjne funkcje jakości usług. Kluczowe udoskonalenia obejmują:
- Wprowadzenie rdzeni Tensor piątej generacji, zapewniających szybkie obliczenia FP4 z wydajnością do 4000 AI TOPS.
- Rdzenie Ray Tracing (RT) czwartej generacji o oszałamiającej mocy 360 RT TFLOP, zaprojektowane specjalnie z myślą o Mega Geometrii.
- Procesor zarządzania sztuczną inteligencją nowej generacji, który umożliwia płynne jednoczesne wykonywanie modeli sztucznej inteligencji i obciążeń graficznych.
- Nowe procesory strumieniowe Blackwell (SM) o szczytowej mocy obliczeniowej FP32 wynoszącej 125 TFLOPS.
- Pamięć GDDR7 oferuje najwyższą prędkość transmisji danych na rynku, dochodzącą do 30 Gb/s w przypadku karty RTX 5080.
Dodatkowe funkcje architektury RTX Blackwell obejmują DisplayPort 2.1, kompatybilność z PCIe Gen5 i obsługę 4K NVDEC/NVENC z ulepszoną głębią kolorów.
Ulepszenia wydajności i postęp technologiczny
Porównując procesory strumieniowe Blackwell (SM) z procesorami architektury Ada, widać wyraźnie, że NVIDIA skutecznie podwoiła przepustowość GPU INT32, zwiększając wydajność obciążeń, takich jak Work Graphs i Shader Execution. Nowa architektura umożliwia również wydajniejsze wykonywanie wielu obciążeń, znacznie poprawiając Shader Execution Reordering (SER) o współczynnik dwa.
Ponadto GDDR7 przewyższa starszą pamięć GDDR6/X pod względem wydajności, oferując dwukrotnie większą przepustowość i szybkość transmisji danych, a jednocześnie będąc bardziej energooszczędną. Ta innowacyjna technologia pamięci obsługuje sygnalizację PAM4, co stawia serię RTX 50 jako pierwszą architekturę zdolną w pełni wykorzystać zarówno GDDR7, jak i PCIe 5.0.
Zaawansowane technologie śledzenia promieni
Postępy architektoniczne obejmują również śledzenie promieni. Wprowadzenie rdzeni RT czwartej generacji obejmuje silnik Triangle Cluster Intersection Engine, specjalnie zoptymalizowany pod kątem przetwarzania Mega Geometry. Ta aktualizacja umożliwia lepszą obsługę złożonych scen przy jednoczesnym zachowaniu mniejszego obciążenia pamięci.
Ponadto innowacyjny silnik Mega Geometry zawiera format Triangle Cluster Compression, wydajnie zarządzając danymi wymaganymi do rozległych zadań śledzenia promieni. Daje to 8-krotny współczynnik przecięcia trójkątów promieni, minimalizując jednocześnie wykorzystanie pamięci.
Wprowadzenie formatu FP4 na rdzeniach Tensor 5. generacji Blackwell oferuje drastyczny wzrost przepustowości, zapewniając 32-krotną przewagę wydajnościową nad procesorami graficznymi Pascal i 2-krotny wzrost w porównaniu z procesorami graficznymi generacji Ada. To ulepszenie obsługuje zaawansowane techniki Neural Shading stosowane w grach nowej generacji.
Innowacyjne planowanie i zarządzanie energią
Istotnym wprowadzeniem w architekturze Blackwell jest programowalny koprocesor znany jako Amp. Ten komponent ułatwia wydajną interakcję i dystrybucję obciążenia pomiędzy różnymi rdzeniami GPU, zapewniając optymalną wydajność.
Blackwell obejmuje również zaawansowane tryby zarządzania energią, umożliwiając wyłączenie drzewa zegara GPU w stanach bezczynności. Ta możliwość umożliwia znaczne oszczędności energii, co jest szczególnie korzystne w przypadku projektów mobilnych, takich jak seria „Max-Q”. Architektura zwiększa wydajność, optymalizując jednocześnie zużycie energii za pomocą szyny wtórnej, która umożliwia różne operacje napięciowe dla rdzeni i systemów pamięci.
Co więcej, Blackwell zwiększa swoją częstotliwość reakcji o niezwykłe 1000x, umożliwiając efektywne przydzielanie częstotliwości w oparciu o typ obciążenia. Prowadzi to do poprawy częstotliwości zegara nawet o 300 MHz w porównaniu z procesorami graficznymi Ada.
Możliwości wyświetlania i wideo
Architektura Blackwell wzmacnia również możliwości wyświetlania i przetwarzania wideo. Wprowadza obsługę DisplayPort 2.1b, zwiększając dostarczanie klatek za pomocą zaawansowanych technik pomiaru odwrócenia sprzętu. Architektura obejmuje enkoder 9. generacji i dekoder 6. generacji, kompatybilne z zaawansowanymi kodekami, takimi jak AV1 i HEVC, zapewniając najwyższą jakość wideo i wydajność.
Postępy w DLSS: DLSS 4
Kontynuując ewolucję technologii głębokiego uczenia, DLSS 4 stanowi znaczący krok naprzód od momentu jego powstania w 2018 r. W tej iteracji NVIDIA wykorzystuje zaawansowane superkomputery do ciągłego ulepszania modelu DLSS, co skutkuje znaczną poprawą jakości obrazu i responsywności.
Dzięki DLSS 4 NVIDIA przechodzi na solidną nową architekturę neuronową, uzupełnioną o silnik transformatorowy zdolny do obsługi wielu zestawów danych bardziej efektywnie. Nowy tryb Multi-Frame Generation (MFG) umożliwia generowanie do pięciu modeli na klatkę, co znacznie poprawia jakość renderowania.
To przełomowe podejście przygotowuje grunt pod udostępnienie DLSS 4 z początkowym wsparciem dla 75 gier, największej biblioteki tytułów ulepszonych DLSS wydanych jednocześnie. Deweloperzy, którzy już korzystają z DLSS 3 lub 3.5, uznają integrację za prostą, zapewniającą solidne wsparcie zarówno dla nowych, jak i istniejących linii tytułów.
Zmniejszanie latencji dzięki Reflex 2
Technologia NVIDIA Reflex 2 ma na celu zwiększenie responsywności graczy, szczególnie w środowiskach konkurencyjnych. Wykorzystując technologię Frame Warp, Reflex 2 zmniejsza opóźnienie systemu o 75%, poprawiając ogólne wrażenia z rozgrywki.
To ulepszenie umożliwia próbkowanie pozycji myszy w czasie rzeczywistym przed renderowaniem klatek, co znacznie optymalizuje responsywność. Reflex 2 będzie natywnie obsługiwany w różnych tytułach o wysokiej wydajności, zapewniając, że wszyscy użytkownicy GPU RTX będą mogli skorzystać z tego postępu.
Rewolucjonizowanie gier dzięki sztucznej inteligencji RTX
Architektura Blackwell firmy NVIDIA kładzie nacisk na integrację AI w grach. Dzięki współpracy z Microsoftem w celu uzyskania dostępu do możliwości Neural Rendering firmy DirectX firma NVIDIA jest gotowa uwolnić niezrównaną wydajność z procesorów graficznych RTX 50. Innowacje obejmują Neural Shaders i zaawansowaną obsługę materiałów, obiecując transformacyjną zmianę z tradycyjnej grafiki na grafikę sterowaną przez AI.
Dzięki nowym technologiom, takim jak Neural Radiance Cache (NRC) i RTX Mega Geometry, NVIDIA na nowo definiuje sposób, w jaki światło oddziałuje z obiektami w scenie, oferując niezrównany realizm i interaktywność w środowiskach gier. Wprowadzenie funkcji ulepszonych przez AI do renderowania postaci jeszcze bardziej podkreśla zaangażowanie w wprowadzanie realistycznych szczegółów do wirtualnych światów.
Przyszłość gier jest podniesiona przez możliwości Blackwell, z zaawansowanymi aplikacjami w materiałach neuronowych i optymalizacji oświetlenia, które mają radykalnie zwiększyć wierność wizualną i wydajność. W miarę jak NVIDIA nadal idzie naprzód, społeczność graczy może spodziewać się bezprecedensowych postępów w wydajności graficznej i integracji AI.
Dodaj komentarz