Firma NVIDIA zaprezentowała rewolucyjne udoskonalenie algorytmu ReSTIR, które znacząco zwiększa wydajność funkcji Path Tracing – dwu- lub trzykrotnie, torując drogę przyszłości grafiki w grach.
Ray Tracing: Trendsetter w rozwoju technologii Path Tracing firmy NVIDIA
Path Tracing jest coraz częściej wykorzystywany w grach komputerowych, aby osiągnąć niezrównaną wierność wizualną, synonim wrażeń nowej generacji. NVIDIA, lider w technologii graficznej, jest liderem we wprowadzaniu Path Tracingu na platformę PC. Jednak, podobnie jak w początkach Ray Tracingu, obecnie Path Tracing wymaga wysokowydajnego sprzętu. Na przykład, nawet wydajna karta RTX 5090 ma problemy z zapewnieniem grywalnej liczby klatek na sekundę, osiągając zaledwie 30-40 FPS w wielu tytułach i w dużym stopniu polegając na skalowaniu DLSS i generowaniu klatek.
Ray Tracing rozpoczął swoją podróż na komputerach PC i stopniowo stawał się coraz bardziej wydajny na nowoczesnym sprzęcie. Konsole również skutecznie wdrożyły Ray Tracing, choć głównie w ustawieniach jakości, które w większości scenariuszy wciąż nie osiągają 60 klatek na sekundę.

W przełomowym artykule badawczym zatytułowanym „ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing” firma NVIDIA przedstawia zestaw algorytmów ReSTIR zaprojektowanych w celu zwiększenia wydajności śledzenia ścieżek. Te innowacje mogą zapewnić znaczącą, dwu- lub trzykrotną poprawę szybkości, jednocześnie minimalizując niespójności wizualne, powszechne w obecnych wynikach śledzenia ścieżek i śledzenia promieni.

Ulepszone algorytmy śledzenia ścieżki firmy NVIDIA zbliżają się do poziomu, który firma uznaje za „gotowy do produkcji”, obniżając o połowę koszty związane z ponownym wykorzystaniem przestrzeni. Te udoskonalenia poprawiają również ogólną wydajność i jakość dzięki metodom integrującym oświetlenie bezpośrednie i globalne, a jednocześnie skutecznie redukującym szum barwny i szum disocclusion. Udoskonalenia algorytmu obejmują:
- Obniżenie kosztów mapowania przesunięć związanych z ponownym wykorzystaniem przestrzeni osiągnięto poprzez selektywny wybór sąsiadów.
- Dynamiczne progi zasięgu promienia, które dostosowują się do zmieniających się scen i materiałów.
- Zminimalizowane artefakty korelacji dzięki wykorzystaniu map duplikacji próbek.
- Dodatkowe optymalizacje, które zwiększają stabilność i wydajność poprzez ograniczenie szumu koloru i szumu disokluzji.

Tabela 1 przedstawia wydajność naszych technik, gdzie każdy wiersz dodaje jedną nową funkcję/optymalizację na podstawie publicznego kodu źródłowego Lin i in.[2022].Najpierw mierzymy przyspieszenie uzyskane dzięki naszym technikom redukcji kosztów, które zapewniają średnio 2, 74-krotne przyspieszenie w czterech testowanych scenach. Sceny te wybrano tak, aby odzwierciedlały zakres złożoności geometrii i materiałów. Wyniki dla poszczególnych scen przedstawiono w materiale uzupełniającym.
Aby lepiej zrozumieć wpływ naszych niskopoziomowych optymalizacji GPU, wykonaliśmy profil Opera House za pomocą narzędzia NSight Graphics. Dane z profilera wskazują, że optymalizacje opisane w sekcjach 6.2.1–6.2.3 zmniejszają rozbieżność wątków i poprawiają wydajność obliczeń GPU. W szczególności:
- Zajętość przestrzeni warp SM wzrasta z 22, 4% → 31, 1%
- Liczba aktywnych wątków na osnowę wzrasta z 15, 3 → 19, 9
- Opóźnienie warp zmniejsza się z 347 tys.cykli → 241 tys.cykli
Wszystko to dzieje się bez zmiany zachowania samplera. Zastosowanie rosyjskiej ruletki (sekcja 6.2.4) dodatkowo poprawia te wskaźniki, aby:
- 34, 9% obłożenia
- 20, 6 aktywnych wątków na osnowę
- Opóźnienie 82 tys.cykli
Ponieważ każde przejście ReSTIR wymaga dwóch zestawów rezerwuarów do obsługi ponownego wykorzystania danych czasowych, te zmiany zmniejszają ilość pamięci przypadającą na piksel z 2 × (88 + 16) bajtów w implementacji bazowej (która wykorzystuje 16-bajtowe rezerwuary dla ReSTIR DI) do 2 × 64 bajtów. Przy rozdzielczości renderowania 1920×1080 zmniejsza to zużycie pamięci z 431 MB do 265 MB.
Wyniki optymalizacji GPU w porównaniu z Lin et al.[2022]
Techniczne / Staż Zajętość SM Warp (%) Aktywne wątki na osnowę Opóźnienie Warp (cykle) Przyspieszenie kontra linia bazowa Notatki Linia bazowa (Lin i in.[2022]) 22.4 15.3 347 tys. 1, 0× Publiczny kod źródłowy Optymalizacje GPU niskiego poziomu (sekcja 6.2.1–6.2.3) 31.1 19, 9 241 tys. 2, 74× (średnia z 4 scen) Zmniejszona rozbieżność nici, zwiększona wydajność + Ruletka rosyjska (sekcja 6.2.4) 34, 9 20.6 82 tys. — Dalsze zwiększenie wydajności + Nowe progi (sekcje 4, 5, 6) — — — — Kryteria ponownego połączenia niezależne od sceny poprawiają jakość mapowania przesunięć Wszystkie ulepszenia (dekorelacja, redukcja szumów) — — — 2, 30× Kosztuje o 19% mniej niż najszybsza wersja, ale nadal jest szybsza niż
Postępy firmy NVIDIA zapowiadają znaczący skok w możliwościach Path Tracingu, zwłaszcza od czasu premiery serii kart graficznych RTX 40 i RTX 50. Patrząc w przyszłość, NVIDIA z entuzjazmem podchodzi do wdrażania technik renderowania neuronowego i algorytmów sztucznej inteligencji, aby jeszcze bardziej udoskonalić wydajność swojego sprzętu do gier, dążąc do radykalnej poprawy możliwości wizualnych nowej generacji.
Dodaj komentarz