NVIDIA triple les performances du lancer de rayons grâce à des algorithmes ReSTIR avancés pour les jeux de nouvelle génération.

NVIDIA a dévoilé une amélioration révolutionnaire de son algorithme ReSTIR, qui augmente considérablement les performances du Path Tracing de 2 à 3 fois, ouvrant la voie à l’avenir des graphismes de jeux vidéo.

Ray Tracing : une technologie pionnière pour les avancées en matière de lancer de rayons par NVIDIA

Le ray tracing est de plus en plus utilisé dans les jeux PC pour atteindre une fidélité visuelle inégalée, synonyme d’expériences nouvelle génération. NVIDIA, leader des technologies graphiques, est à la pointe du développement du ray tracing sur PC. Cependant, comme à ses débuts, le ray tracing exige actuellement un matériel très performant. Par exemple, même la puissante RTX 5090 peine à offrir une fréquence d’images jouable, n’atteignant que 30 à 40 FPS dans de nombreux titres et s’appuyant fortement sur la mise à l’échelle DLSS et la génération d’images.

Le ray tracing a fait ses débuts sur PC et est devenu progressivement plus performant sur les configurations modernes. Les consoles l’ont également intégré avec succès, mais principalement avec des paramètres graphiques qui restent inférieurs à 60 images par seconde dans la plupart des situations.

Une image comparative montrant « Original ReSTIR PT (37, 1 ms) FLIP : 0, 321 » à gauche et « ReSTIR PT Enhanced (12, 6 ms) FLIP : 0, 263 » à droite, mettant en évidence les différences de temps de rendu et de réduction du bruit visuel. — Source de l’image : NVIDIA

Dans un article de recherche novateur intitulé « ReSTIR PT Enhanced : des avancées algorithmiques pour un rendu ReSTIR plus rapide et plus robuste », NVIDIA présente une série d’algorithmes ReSTIR conçus pour optimiser les performances du rendu. Ces innovations permettent un gain de vitesse remarquable de 2 à 3 fois, tout en minimisant les incohérences visuelles fréquentes dans les rendus actuels de rendu et de lancer de rayons.

Un collage compare « Original ReSTIR PT » à « ReSTIR PT Enhanced » sur trois scènes : « Aquarelle », « Jour zéro » et « Couronne », mettant en évidence les différences de temps de rendu et de valeurs FLIP, la version améliorée affichant des temps plus rapides et une meilleure qualité d'image. — Source de l’image : NVIDIA

Les algorithmes de lancer de rayons améliorés de NVIDIA sont presque prêts pour la production, ce qui permet de réduire de moitié les coûts liés à la réutilisation spatiale. Ces avancées améliorent également les performances et la qualité globales grâce à des méthodologies intégrant l’éclairage direct et global, tout en réduisant efficacement le bruit de couleur et le bruit de désocclusion. Parmi les améliorations apportées à l’algorithme, on peut citer :

Une réduction des coûts de cartographie des déplacements liée à la réutilisation spatiale obtenue grâce à un choix sélectif des voisins.
Seuils d’empreinte de rayons dynamiques qui s’ajustent en fonction des différentes scènes et matériaux.
Artefacts de corrélation minimisés grâce à l’utilisation de cartes de duplication d’échantillons.
Des optimisations supplémentaires améliorent la stabilité et les performances en réduisant le bruit de couleur et de désocclusion.

Un tableau intitulé « Coûts d'image et de passe (en millisecondes) moyennés sur quatre scènes » montre que la méthode « +Unifier DI & GI (Section 6.1) » atteint le coût total d'image le plus bas de 13, 04 millisecondes. — Source de l’image : NVIDIA

Le tableau 1 présente les performances de nos techniques, chaque ligne ajoutant une nouvelle fonctionnalité/optimisation à la version de référence du code source public de Lin et al.[2022].Nous mesurons d’abord le gain de vitesse apporté par nos techniques de réduction des coûts, qui offrent une accélération moyenne de 2, 74× sur les quatre scènes testées. Ces scènes ont été choisies pour refléter une gamme de complexité géométrique et matérielle. Les résultats pour chaque scène sont fournis dans les documents supplémentaires.

Pour mieux comprendre l’effet de nos optimisations GPU de bas niveau, nous avons analysé le comportement d’Opera House à l’aide de NSight Graphics. Les données du profileur indiquent que les optimisations décrites dans les sections 6.2.1 à 6.2.3 réduisent la divergence des threads et améliorent l’efficacité des calculs GPU. Plus précisément :

Le taux d’occupation des vaisseaux SM augmente de 22, 4 % à 31, 1 %.

Le nombre de threads actifs par warp passe de 15, 3 à 19, 9.

La latence de distorsion diminue de 347 000 à 241 000 cycles

Tout ceci se produit sans modifier le comportement de l’échantillonneur. L’application de la roulette russe (section 6.2.4) améliore encore ces indicateurs :

34, 9 % d’occupation

20, 6 fils actifs par chaîne

Latence de 82 000 cycles

Chaque passe ReSTIR nécessitant deux ensembles de réservoirs pour la réutilisation temporelle, ces modifications réduisent le stockage par pixel de 2 × (88 + 16) octets dans l’implémentation de base (qui utilise des réservoirs de 16 octets pour l’injection de dépendances ReSTIR) à 2 × 64 octets. Avec une résolution de rendu de 1920 × 1080, la consommation de mémoire passe ainsi de 431 Mo à 265 Mo.

Résultats d’optimisation GPU comparés à ceux de Lin et al.[2022]

Technique / Stage Taux d’occupation du SM Warp (%) Fils actifs par chaîne Latence de distorsion (cycles) Accélération par rapport à la ligne de base Notes

Ligne de base (Lin et al.[2022]) 22.4 15.3 347k 1, 0× ligne de base du code source public

Optimisations GPU de bas niveau (Sec.6.2.1–6.2.3) 31.1 19.9 241k 2, 74× (moyenne sur 4 scènes) Divergence des fils réduite, efficacité améliorée

+ Roulette russe (Sec.6.2.4) 34, 9 20.6 82k — gains d’efficacité supplémentaires

+ Nouveaux seuils (art.4, 5, 6) — — — — Les critères de reconnexion indépendants de la scène améliorent la qualité du mappage des changements de scène

Toutes les améliorations (décorrélation, réduction du bruit) — — — 2, 30× Augmente le coût de 19 % par rapport à la version la plus rapide, mais reste plus rapide que

Technique / Stage	Taux d’occupation du SM Warp (%)	Fils actifs par chaîne	Latence de distorsion (cycles)	Accélération par rapport à la ligne de base	Notes
Ligne de base (Lin et al.[2022])	22.4	15.3	347k	1, 0×	ligne de base du code source public
Optimisations GPU de bas niveau (Sec.6.2.1–6.2.3)	31.1	19.9	241k	2, 74× (moyenne sur 4 scènes)	Divergence des fils réduite, efficacité améliorée
+ Roulette russe (Sec.6.2.4)	34, 9	20.6	82k	—	gains d’efficacité supplémentaires
+ Nouveaux seuils (art.4, 5, 6)	—	—	—	—	Les critères de reconnexion indépendants de la scène améliorent la qualité du mappage des changements de scène
Toutes les améliorations (décorrélation, réduction du bruit)	—	—	—	2, 30×	Augmente le coût de 19 % par rapport à la version la plus rapide, mais reste plus rapide que

Les avancées d’NVIDIA promettent un bond en avant significatif en matière de rendu par lancer de rayons, notamment depuis la sortie des GPU RTX 40 et RTX 50.À l’avenir, NVIDIA souhaite intégrer avec enthousiasme des techniques de rendu neuronal et des algorithmes d’IA afin d’optimiser encore davantage les performances de son matériel de jeu, dans le but d’améliorer considérablement les capacités visuelles de nouvelle génération.

Source et images

NVIDIA triple les performances du lancer de rayons grâce à des algorithmes ReSTIR avancés pour les jeux de nouvelle génération.

Ray Tracing : une technologie pionnière pour les avancées en matière de lancer de rayons par NVIDIA

Résultats d’optimisation GPU comparés à ceux de Lin et al.[2022]

Microsoft cible les éléments d'interface utilisateur hérités dans une importante mise à jour de conception de Windows 11

Le film Elden Ring, produit par Alex Garland et A24, sortira en mars 2028 avec Nick Offerman, Kit O'Connor et Cailee Spaeny.