A NVIDIA revelou uma melhoria revolucionária em seu algoritmo ReSTIR, que aumenta significativamente o desempenho do Path Tracing em 2 a 3 vezes, abrindo caminho para o futuro dos gráficos em jogos.
Ray Tracing: um divisor de águas para os avanços em traçado de raios pela NVIDIA
O Path Tracing está sendo cada vez mais adotado por jogos para PC para alcançar fidelidade visual incomparável, sinônimo de experiências de última geração. A NVIDIA, líder em tecnologia gráfica, está na vanguarda da implementação do Path Tracing na plataforma PC. No entanto, assim como nos primórdios do Ray Tracing, o Path Tracing atualmente exige hardware de alto desempenho. Por exemplo, mesmo a poderosa RTX 5090 tem dificuldades para oferecer taxas de quadros jogáveis, atingindo apenas 30-40 FPS em muitos títulos e dependendo fortemente do upscaling e da geração de quadros do DLSS.
O Ray Tracing começou sua trajetória no PC e tem se tornado progressivamente mais eficiente em hardware moderno. Os consoles também incorporaram o Ray Tracing de forma eficaz, embora principalmente em configurações de qualidade que ainda ficam aquém de 60 FPS na maioria dos casos.

Em um artigo de pesquisa inovador intitulado “ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing”, a NVIDIA descreve um conjunto de algoritmos ReSTIR projetados para elevar o desempenho do Path Tracing. Essas inovações podem oferecer uma melhoria notável de 2 a 3 vezes na velocidade, minimizando as inconsistências visuais prevalentes nas saídas atuais de Path Tracing e Ray Tracing.

Os algoritmos aprimorados de Path Tracing da NVIDIA estão se aproximando do que a empresa considera “prontos para produção”, reduzindo pela metade os custos associados à reutilização espacial. Esses avanços também melhoram o desempenho e a qualidade geral por meio de metodologias que integram iluminação direta e global, ao mesmo tempo que abordam com eficácia a redução de ruído de cor e ruído de desoclusão. Os avanços apresentados no algoritmo incluem:
- Redução nos custos de mapeamento de deslocamento associada à reutilização espacial, alcançada por meio da escolha seletiva de vizinhos.
- Limiares dinâmicos de projeção de raios que se ajustam de acordo com diferentes cenas e materiais.
- Artefatos de correlação minimizados utilizando mapas de duplicação de amostras.
- Otimizações adicionais que melhoram a estabilidade e o desempenho, reduzindo o ruído de cor e de oclusão.

A Tabela 1 mostra o desempenho de nossas técnicas, com cada linha adicionando um novo recurso/otimização em relação à base do código-fonte público de Lin et al.[2022].Primeiramente, medimos o ganho de velocidade obtido com nossas técnicas de redução de custos, que proporcionam um ganho médio de 2, 74× nas quatro cenas testadas. Essas cenas foram escolhidas para refletir uma variedade de geometrias e complexidades de materiais. Os resultados para cada cena individual são apresentados no material suplementar.
Para obter mais informações sobre o efeito de nossas otimizações de GPU de baixo nível, analisamos o desempenho do Opera House usando o NSight Graphics. Os dados do perfilador indicam que as otimizações nas Seções 6.2.1–6.2.3 reduzem a divergência de threads e melhoram a eficiência computacional da GPU. Especificamente:
- A ocupação de dobra SM aumenta de 22, 4% para 31, 1%.
- Aumento do número de fios ativos por urdidura de 15, 3 para 19, 9.
- A latência de warp diminui de 347k → 241k ciclos.
Tudo isso ocorre sem alterar o comportamento do amostrador. A aplicação da roleta russa (Seção 6.2.4) aprimora ainda mais essas métricas para:
- Taxa de ocupação de 34, 9%.
- 20, 6 fios ativos por urdidura
- Latência de 82 mil ciclos
Como cada passe ReSTIR requer dois conjuntos de reservatórios para suportar a reutilização temporal, essas alterações reduzem o armazenamento por pixel de 2 × (88 + 16) bytes na implementação base (que usa reservatórios de 16 bytes para injeção de dependência ReSTIR) para 2 × 64 bytes. Com uma resolução de renderização de 1920×1080, isso reduz o consumo de memória de 431 MB para 265 MB.
Resultados de otimização de GPU comparados a Lin et al.[2022]
Técnico / Estágio Ocupação de dobra espacial (%) Fios ativos por urdidura Latência de dobra (ciclos) Aceleração vs. Linha de Base Notas Linha de base (Lin et al.[2022]) 22, 4 15.3 347 mil 1, 0× Linha de base do código-fonte público Otimizações de GPU de baixo nível (Seções 6.2.1–6.2.3) 31.1 19, 9 241 mil 2, 74× (média em 4 cenas) Divergência de rosca reduzida, eficiência aprimorada + Roleta russa (Seção 6.2.4) 34, 9 20, 6 82 mil — Ganhos adicionais de eficiência + Novos limiares (Seções 4, 5 e 6) — — — — Critérios de reconexão independentes de cena melhoram a qualidade do mapeamento de deslocamento. Todas as melhorias (descorrelação, redução de ruído) — — — 2, 30× Aumenta o custo em 19% em comparação com a versão mais rápida, mas ainda assim é mais rápido que
Os avanços da NVIDIA prometem um salto significativo nas capacidades de Path Tracing, especialmente desde o lançamento das séries de GPUs RTX 40 e RTX 50. Olhando para o futuro, a NVIDIA está entusiasmada em incorporar técnicas de Neural Rendering e algoritmos de IA para refinar ainda mais o desempenho de seu hardware para jogos, visando aprimorar drasticamente as capacidades visuais da próxima geração.
Deixe um comentário