A NVIDIA triplica o desempenho do Path Tracing com algoritmos ReSTIR avançados para jogos da próxima geração.

A NVIDIA triplica o desempenho do Path Tracing com algoritmos ReSTIR avançados para jogos da próxima geração.

A NVIDIA revelou uma melhoria revolucionária em seu algoritmo ReSTIR, que aumenta significativamente o desempenho do Path Tracing em 2 a 3 vezes, abrindo caminho para o futuro dos gráficos em jogos.

Ray Tracing: um divisor de águas para os avanços em traçado de raios pela NVIDIA

O Path Tracing está sendo cada vez mais adotado por jogos para PC para alcançar fidelidade visual incomparável, sinônimo de experiências de última geração. A NVIDIA, líder em tecnologia gráfica, está na vanguarda da implementação do Path Tracing na plataforma PC. No entanto, assim como nos primórdios do Ray Tracing, o Path Tracing atualmente exige hardware de alto desempenho. Por exemplo, mesmo a poderosa RTX 5090 tem dificuldades para oferecer taxas de quadros jogáveis, atingindo apenas 30-40 FPS em muitos títulos e dependendo fortemente do upscaling e da geração de quadros do DLSS.

O Ray Tracing começou sua trajetória no PC e tem se tornado progressivamente mais eficiente em hardware moderno. Os consoles também incorporaram o Ray Tracing de forma eficaz, embora principalmente em configurações de qualidade que ainda ficam aquém de 60 FPS na maioria dos casos.

Uma imagem comparativa mostrando 'ReSTIR PT original (37, 1 ms) FLIP: 0, 321' à esquerda e 'ReSTIR PT aprimorado (12, 6 ms) FLIP: 0, 263' à direita, destacando as diferenças no tempo de renderização e na redução do ruído visual.
Fonte da imagem: NVIDIA

Em um artigo de pesquisa inovador intitulado “ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing”, a NVIDIA descreve um conjunto de algoritmos ReSTIR projetados para elevar o desempenho do Path Tracing. Essas inovações podem oferecer uma melhoria notável de 2 a 3 vezes na velocidade, minimizando as inconsistências visuais prevalentes nas saídas atuais de Path Tracing e Ray Tracing.

Uma colagem compara o 'ReSTIR PT Original' com o 'ReSTIR PT Aprimorado' em três cenas: 'Aquarela', 'Dia Zero' e 'Coroa', destacando as diferenças nos tempos de renderização e nos valores FLIP, com a versão aprimorada apresentando tempos mais rápidos e melhor qualidade de imagem.
Fonte da imagem: NVIDIA

Os algoritmos aprimorados de Path Tracing da NVIDIA estão se aproximando do que a empresa considera “prontos para produção”, reduzindo pela metade os custos associados à reutilização espacial. Esses avanços também melhoram o desempenho e a qualidade geral por meio de metodologias que integram iluminação direta e global, ao mesmo tempo que abordam com eficácia a redução de ruído de cor e ruído de desoclusão. Os avanços apresentados no algoritmo incluem:

  • Redução nos custos de mapeamento de deslocamento associada à reutilização espacial, alcançada por meio da escolha seletiva de vizinhos.
  • Limiares dinâmicos de projeção de raios que se ajustam de acordo com diferentes cenas e materiais.
  • Artefatos de correlação minimizados utilizando mapas de duplicação de amostras.
  • Otimizações adicionais que melhoram a estabilidade e o desempenho, reduzindo o ruído de cor e de oclusão.
Uma tabela intitulada 'Custos de quadro e passe (em milissegundos) com média em quatro cenas' mostra que o método '+Unificar DI e GI (Seção 6.1)' atinge o menor custo total de quadro, de 13, 04 milissegundos.
Fonte da imagem: NVIDIA

A Tabela 1 mostra o desempenho de nossas técnicas, com cada linha adicionando um novo recurso/otimização em relação à base do código-fonte público de Lin et al.[2022].Primeiramente, medimos o ganho de velocidade obtido com nossas técnicas de redução de custos, que proporcionam um ganho médio de 2, 74× nas quatro cenas testadas. Essas cenas foram escolhidas para refletir uma variedade de geometrias e complexidades de materiais. Os resultados para cada cena individual são apresentados no material suplementar.

Para obter mais informações sobre o efeito de nossas otimizações de GPU de baixo nível, analisamos o desempenho do Opera House usando o NSight Graphics. Os dados do perfilador indicam que as otimizações nas Seções 6.2.1–6.2.3 reduzem a divergência de threads e melhoram a eficiência computacional da GPU. Especificamente:

  • A ocupação de dobra SM aumenta de 22, 4% para 31, 1%.
  • Aumento do número de fios ativos por urdidura de 15, 3 para 19, 9.
  • A latência de warp diminui de 347k → 241k ciclos.

Tudo isso ocorre sem alterar o comportamento do amostrador. A aplicação da roleta russa (Seção 6.2.4) aprimora ainda mais essas métricas para:

  • Taxa de ocupação de 34, 9%.
  • 20, 6 fios ativos por urdidura
  • Latência de 82 mil ciclos

Como cada passe ReSTIR requer dois conjuntos de reservatórios para suportar a reutilização temporal, essas alterações reduzem o armazenamento por pixel de 2 × (88 + 16) bytes na implementação base (que usa reservatórios de 16 bytes para injeção de dependência ReSTIR) para 2 × 64 bytes. Com uma resolução de renderização de 1920×1080, isso reduz o consumo de memória de 431 MB para 265 MB.

Resultados de otimização de GPU comparados a Lin et al.[2022]

Técnico / Estágio Ocupação de dobra espacial (%) Fios ativos por urdidura Latência de dobra (ciclos) Aceleração vs. Linha de Base Notas
Linha de base (Lin et al.[2022]) 22, 4 15.3 347 mil 1, 0× Linha de base do código-fonte público
Otimizações de GPU de baixo nível (Seções 6.2.1–6.2.3) 31.1 19, 9 241 mil 2, 74× (média em 4 cenas) Divergência de rosca reduzida, eficiência aprimorada
+ Roleta russa (Seção 6.2.4) 34, 9 20, 6 82 mil Ganhos adicionais de eficiência
+ Novos limiares (Seções 4, 5 e 6) Critérios de reconexão independentes de cena melhoram a qualidade do mapeamento de deslocamento.
Todas as melhorias (descorrelação, redução de ruído) 2, 30× Aumenta o custo em 19% em comparação com a versão mais rápida, mas ainda assim é mais rápido que

Os avanços da NVIDIA prometem um salto significativo nas capacidades de Path Tracing, especialmente desde o lançamento das séries de GPUs RTX 40 e RTX 50. Olhando para o futuro, a NVIDIA está entusiasmada em incorporar técnicas de Neural Rendering e algoritmos de IA para refinar ainda mais o desempenho de seu hardware para jogos, visando aprimorar drasticamente as capacidades visuais da próxima geração.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *