L’architecture GPU NVIDIA Blackwell RTX 50 dévoilée : détails clés sur les cœurs avancés, DLSS 4 et les technologies de jeu de nouvelle génération

L’architecture GPU NVIDIA Blackwell RTX 50 dévoilée : détails clés sur les cœurs avancés, DLSS 4 et les technologies de jeu de nouvelle génération

Au CES 2025, NVIDIA a présenté en détail son architecture GPU Blackwell de nouvelle génération, qui équipera les prochaines cartes graphiques de jeu RTX 50. Cette conception innovante promet des avancées significatives par rapport à l’architecture Ada précédente, améliorant les performances, l’efficacité et les capacités graphiques pour les joueurs et les créateurs de contenu.

Découverte de l’architecture GPU NVIDIA GeForce RTX 50 « Blackwell »

L’architecture Blackwell est conçue pour les environnements de jeu à forte demande et les applications créatives, avec des composants révolutionnaires qui facilitent des performances supérieures. Le lancement de la série RTX 50 est prévu plus tard ce mois-ci, avec une architecture conçue sur le nœud de processus 4 nm de TSMC. Cette conception de GPU de pointe intègre un nombre impressionnant de 92 milliards de transistors, offrant jusqu’à 4000 TOPS AI, 380 TFLOP RT et 125 TFLOPS de puissance de calcul FP32. De plus, il dispose de l’interface mémoire GDDR7 la plus rapide, atteignant des bandes passantes allant jusqu’à 1,8 To/s, le tout dans une esthétique Founders Edition repensée.

Présentation du GPU Blackwell

Présentation détaillée de l’architecture Blackwell

L’architecture Blackwell de NVIDIA vise à améliorer les prouesses graphiques de la prochaine génération de jeux en se concentrant sur des capacités neuronales et des charges de travail avancées. Cela comprend une réduction substantielle de l’empreinte mémoire, une efficacité énergétique améliorée et des fonctionnalités de qualité de service innovantes. Les principales améliorations comprennent :

  • Introduction des cœurs Tensor de 5e génération, offrant un calcul FP4 à grande vitesse avec jusqu’à 4 000 AI TOPS.
  • Cœurs Ray Tracing (RT) de 4e génération avec un nombre impressionnant de 360 ​​RT TFLOPs, conçus spécifiquement pour Mega Geometry.
  • Un processeur de gestion d’IA de nouvelle génération qui permet l’exécution simultanée de modèles d’IA et de charges de travail graphiques.
  • Nouveaux multiprocesseurs de streaming Blackwell (SM) capables de fournir 125 TFLOPS de puissance de calcul FP32 de pointe.
  • L’inclusion de la mémoire GDDR7, offrant les vitesses les plus rapides à ce jour jusqu’à 30 Gbps sur la RTX 5080.
Domaines architecturaux de Blackwell

Les fonctionnalités supplémentaires de l’architecture RTX Blackwell englobent DisplayPort 2.1, la compatibilité PCIe Gen5 et les capacités 4K NVDEC/NVENC avec une profondeur de couleur améliorée.

Améliorations des performances et avancées technologiques

En comparant les multiprocesseurs de streaming (SM) de Blackwell à ceux de l’architecture Ada, il est évident que NVIDIA a effectivement doublé le débit du GPU INT32, améliorant ainsi les performances des charges de travail telles que les graphes de travail et l’exécution des shaders. La nouvelle architecture permet également une exécution plus efficace de plusieurs charges de travail, améliorant considérablement la réorganisation de l’exécution des shaders (SER) d’un facteur deux.

Performances graphiques

De plus, la mémoire GDDR7 surpasse l’ancienne mémoire GDDR6/X en termes de performances, offrant une bande passante et des débits de données deux fois plus élevés tout en étant plus économe en énergie. Cette technologie de mémoire innovante prend en charge la signalisation PAM4, positionnant la série RTX 50 comme la première architecture capable d’exploiter pleinement la GDDR7 et le PCIe 5.0.

Technologies avancées de traçage de rayons

Les avancées architecturales s’étendent également au ray tracing. L’introduction des cœurs RT de 4e génération intègre le moteur d’intersection de clusters triangulaires, spécialement optimisé pour le traitement Mega Geometry. Cette mise à niveau permet une meilleure gestion des scènes complexes tout en conservant une empreinte mémoire plus faible.

De plus, le moteur innovant Mega Geometry intègre un format de compression de cluster triangulaire, qui gère efficacement les données requises pour les tâches de traçage de rayons étendues. Cela se traduit par un taux d’intersection de triangles de rayons 8x tout en minimisant l’utilisation de la mémoire.

Améliorations du lancer de rayons

L’introduction du format FP4 sur les cœurs Tensor de 5e génération de Blackwell offre une augmentation spectaculaire du débit, offrant un avantage de performance de 32x par rapport aux GPU Pascal et de 2x par rapport aux GPU de génération Ada. Cette amélioration prend en charge les techniques avancées de Neural Shading utilisées dans les titres de jeu de nouvelle génération.

Améliorations du format FP4

Planification et gestion de l’énergie innovantes

Une introduction importante à l’architecture Blackwell est le coprocesseur programmable connu sous le nom d’Amp. Ce composant facilite l’interaction efficace et la répartition de la charge de travail entre les différents cœurs GPU, garantissant des performances optimales.

Blackwell propose également des modes de gestion de l’alimentation sophistiqués, permettant à l’arbre d’horloge du GPU de se désactiver pendant les états d’inactivité. Cette capacité permet des économies d’énergie importantes, particulièrement avantageuses pour les conceptions mobiles, telles que la série « Max-Q ». L’architecture améliore les performances tout en optimisant la consommation d’énergie grâce à un rail secondaire qui permet des opérations de tension différentes pour les cœurs et les systèmes de mémoire.

De plus, Blackwell améliore sa réactivité en fréquence d’un remarquable facteur 1000, ce qui permet une allocation efficace des fréquences en fonction du type de charge de travail. Cela conduit à une amélioration de la fréquence d’horloge allant jusqu’à 300 MHz par rapport aux GPU Ada.

Capacités d’affichage et de vidéo

L’architecture Blackwell renforce également les capacités d’affichage et de traitement vidéo. Elle introduit la prise en charge de DisplayPort 2.1b, améliorant la diffusion des images via des techniques avancées de mesure par retournement matériel. L’architecture comprend l’encodeur de 9e génération et le décodeur de 6e génération, compatibles avec les codecs avancés tels que AV1 et HEVC, garantissant une qualité vidéo et des performances de premier ordre.

Progrès dans DLSS : DLSS 4

Poursuivant l’évolution de la technologie d’apprentissage profond, DLSS 4 représente un bond en avant significatif depuis sa création en 2018. Cette itération voit NVIDIA exploiter des supercalculateurs avancés pour améliorer en permanence le modèle DLSS, ce qui se traduit par des améliorations substantielles de la qualité d’image et de la réactivité.

Avec DLSS 4, NVIDIA passe à une nouvelle architecture neuronale robuste, dotée d’un moteur de transformation capable de gérer plusieurs ensembles de données plus efficacement. Le nouveau mode Multi-Frame Generation (MFG) permet de générer jusqu’à cinq modèles par image, améliorant ainsi considérablement la qualité du rendu.

Cette approche innovante ouvre la voie à la disponibilité de DLSS 4 avec un support initial de 75 jeux, soit la plus grande bibliothèque de titres optimisés par DLSS lancés simultanément. Les développeurs qui utilisent déjà DLSS 3 ou 3.5 trouveront l’intégration simple, garantissant un support robuste pour les lignes de titres nouvelles et existantes.

Réduire la latence avec Reflex 2

La technologie Reflex 2 de NVIDIA vise à améliorer la réactivité des joueurs, notamment dans les environnements compétitifs. En utilisant la technologie Frame Warp, Reflex 2 réduit la latence du système de 75 %, améliorant ainsi l’expérience de jeu globale.

Cette amélioration permet d’échantillonner en temps réel les positions de la souris avant le rendu des images, optimisant ainsi considérablement la réactivité. Reflex 2 sera pris en charge nativement dans divers titres hautes performances, garantissant que tous les utilisateurs de GPU RTX pourront bénéficier de cette avancée.

Révolutionner le jeu avec RTX AI

L’architecture Blackwell de NVIDIA met l’accent sur l’intégration de l’IA dans les jeux. En collaborant avec Microsoft pour accéder aux capacités de rendu neuronal de DirectX, NVIDIA est sur le point de libérer des performances inégalées des GPU RTX 50. Les innovations incluent les Neural Shaders et la gestion avancée des matériaux, promettant une transition transformatrice des graphiques traditionnels vers des graphiques pilotés par l’IA.

Grâce à de nouvelles technologies telles que Neural Radiance Cache (NRC) et RTX Mega Geometry, NVIDIA redéfinit la manière dont la lumière interagit avec les objets d’une scène, offrant un réalisme et une interactivité inégalés dans les environnements de jeu. L’introduction de fonctionnalités améliorées par l’IA pour le rendu des personnages souligne encore davantage l’engagement de NVIDIA à apporter des détails réalistes aux mondes virtuels.

L’avenir du jeu vidéo est propulsé par les capacités de Blackwell, avec des applications avancées dans les matériaux neuronaux et l’optimisation de l’éclairage qui devraient augmenter considérablement la fidélité visuelle et l’efficacité. Alors que NVIDIA continue d’aller de l’avant, la communauté des joueurs peut s’attendre à des avancées sans précédent en matière de performances graphiques et d’intégration de l’IA.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *