NVIDIA zwiększa wydajność śledzenia ścieżki trzykrotnie dzięki zaawansowanym algorytmom ReSTIR dla gier nowej generacji

NVIDIA zwiększa wydajność śledzenia ścieżki trzykrotnie dzięki zaawansowanym algorytmom ReSTIR dla gier nowej generacji

Firma NVIDIA zaprezentowała rewolucyjne udoskonalenie algorytmu ReSTIR, które znacząco zwiększa wydajność funkcji Path Tracing – dwu- lub trzykrotnie, torując drogę przyszłości grafiki w grach.

Ray Tracing: Trendsetter w rozwoju technologii Path Tracing firmy NVIDIA

Path Tracing jest coraz częściej wykorzystywany w grach komputerowych, aby osiągnąć niezrównaną wierność wizualną, synonim wrażeń nowej generacji. NVIDIA, lider w technologii graficznej, jest liderem we wprowadzaniu Path Tracingu na platformę PC. Jednak, podobnie jak w początkach Ray Tracingu, obecnie Path Tracing wymaga wysokowydajnego sprzętu. Na przykład, nawet wydajna karta RTX 5090 ma problemy z zapewnieniem grywalnej liczby klatek na sekundę, osiągając zaledwie 30-40 FPS w wielu tytułach i w dużym stopniu polegając na skalowaniu DLSS i generowaniu klatek.

Ray Tracing rozpoczął swoją podróż na komputerach PC i stopniowo stawał się coraz bardziej wydajny na nowoczesnym sprzęcie. Konsole również skutecznie wdrożyły Ray Tracing, choć głównie w ustawieniach jakości, które w większości scenariuszy wciąż nie osiągają 60 klatek na sekundę.

Obraz porównawczy pokazujący „Oryginalny ReSTIR PT (37, 1 ms) FLIP: 0, 321” po lewej stronie i „Ulepszony ReSTIR PT (12, 6 ms) FLIP: 0, 263” po prawej stronie, podkreślając różnice w czasie renderowania i redukcji szumów wizualnych.
Źródło obrazu: NVIDIA

W przełomowym artykule badawczym zatytułowanym „ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing” firma NVIDIA przedstawia zestaw algorytmów ReSTIR zaprojektowanych w celu zwiększenia wydajności śledzenia ścieżek. Te innowacje mogą zapewnić znaczącą, dwu- lub trzykrotną poprawę szybkości, jednocześnie minimalizując niespójności wizualne, powszechne w obecnych wynikach śledzenia ścieżek i śledzenia promieni.

Kolaż porównuje „Oryginalny ReSTIR PT” z „ReSTIR PT Ulepszony” w trzech scenach: „Akwarela”, „Dzień Zero” i „Korona”.Uwydatnia różnice w czasach renderowania i wartościach FLIP. Wersja ulepszona charakteryzuje się krótszymi czasami i lepszą jakością obrazu.
Źródło obrazu: NVIDIA

Ulepszone algorytmy śledzenia ścieżki firmy NVIDIA zbliżają się do poziomu, który firma uznaje za „gotowy do produkcji”, obniżając o połowę koszty związane z ponownym wykorzystaniem przestrzeni. Te udoskonalenia poprawiają również ogólną wydajność i jakość dzięki metodom integrującym oświetlenie bezpośrednie i globalne, a jednocześnie skutecznie redukującym szum barwny i szum disocclusion. Udoskonalenia algorytmu obejmują:

  • Obniżenie kosztów mapowania przesunięć związanych z ponownym wykorzystaniem przestrzeni osiągnięto poprzez selektywny wybór sąsiadów.
  • Dynamiczne progi zasięgu promienia, które dostosowują się do zmieniających się scen i materiałów.
  • Zminimalizowane artefakty korelacji dzięki wykorzystaniu map duplikacji próbek.
  • Dodatkowe optymalizacje, które zwiększają stabilność i wydajność poprzez ograniczenie szumu koloru i szumu disokluzji.
Z tabeli zatytułowanej „Koszty klatek i przejść (w milisekundach) uśrednione dla czterech scen” wynika, że ​​metoda „+Unify DI & GI (sekcja 6.1)” pozwala uzyskać najniższy całkowity koszt klatek wynoszący 13, 04 milisekundy.
Źródło obrazu: NVIDIA

Tabela 1 przedstawia wydajność naszych technik, gdzie każdy wiersz dodaje jedną nową funkcję/optymalizację na podstawie publicznego kodu źródłowego Lin i in.[2022].Najpierw mierzymy przyspieszenie uzyskane dzięki naszym technikom redukcji kosztów, które zapewniają średnio 2, 74-krotne przyspieszenie w czterech testowanych scenach. Sceny te wybrano tak, aby odzwierciedlały zakres złożoności geometrii i materiałów. Wyniki dla poszczególnych scen przedstawiono w materiale uzupełniającym.

Aby lepiej zrozumieć wpływ naszych niskopoziomowych optymalizacji GPU, wykonaliśmy profil Opera House za pomocą narzędzia NSight Graphics. Dane z profilera wskazują, że optymalizacje opisane w sekcjach 6.2.1–6.2.3 zmniejszają rozbieżność wątków i poprawiają wydajność obliczeń GPU. W szczególności:

  • Zajętość przestrzeni warp SM wzrasta z 22, 4% → 31, 1%
  • Liczba aktywnych wątków na osnowę wzrasta z 15, 3 → 19, 9
  • Opóźnienie warp zmniejsza się z 347 tys.cykli → 241 tys.cykli

Wszystko to dzieje się bez zmiany zachowania samplera. Zastosowanie rosyjskiej ruletki (sekcja 6.2.4) dodatkowo poprawia te wskaźniki, aby:

  • 34, 9% obłożenia
  • 20, 6 aktywnych wątków na osnowę
  • Opóźnienie 82 tys.cykli

Ponieważ każde przejście ReSTIR wymaga dwóch zestawów rezerwuarów do obsługi ponownego wykorzystania danych czasowych, te zmiany zmniejszają ilość pamięci przypadającą na piksel z 2 × (88 + 16) bajtów w implementacji bazowej (która wykorzystuje 16-bajtowe rezerwuary dla ReSTIR DI) do 2 × 64 bajtów. Przy rozdzielczości renderowania 1920×1080 zmniejsza to zużycie pamięci z 431 MB do 265 MB.

Wyniki optymalizacji GPU w porównaniu z Lin et al.[2022]

Techniczne / Staż Zajętość SM Warp (%) Aktywne wątki na osnowę Opóźnienie Warp (cykle) Przyspieszenie kontra linia bazowa Notatki
Linia bazowa (Lin i in.[2022]) 22.4 15.3 347 tys. 1, 0× Publiczny kod źródłowy
Optymalizacje GPU niskiego poziomu (sekcja 6.2.1–6.2.3) 31.1 19, 9 241 tys. 2, 74× (średnia z 4 scen) Zmniejszona rozbieżność nici, zwiększona wydajność
+ Ruletka rosyjska (sekcja 6.2.4) 34, 9 20.6 82 tys. Dalsze zwiększenie wydajności
+ Nowe progi (sekcje 4, 5, 6) Kryteria ponownego połączenia niezależne od sceny poprawiają jakość mapowania przesunięć
Wszystkie ulepszenia (dekorelacja, redukcja szumów) 2, 30× Kosztuje o 19% mniej niż najszybsza wersja, ale nadal jest szybsza niż

Postępy firmy NVIDIA zapowiadają znaczący skok w możliwościach Path Tracingu, zwłaszcza od czasu premiery serii kart graficznych RTX 40 i RTX 50. Patrząc w przyszłość, NVIDIA z entuzjazmem podchodzi do wdrażania technik renderowania neuronowego i algorytmów sztucznej inteligencji, aby jeszcze bardziej udoskonalić wydajność swojego sprzętu do gier, dążąc do radykalnej poprawy możliwości wizualnych nowej generacji.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *