
NVIDIA continue de faire des vagues dans l’industrie technologique avec ses dernières avancées en matière de rendu neuronal et de jeu, notamment grâce à sa série de GPU Blackwell RTX, qui comprend les RTX 5090 et RTX PRO 6000.
NVIDIA présente les innovations Blackwell RTX au Hot Chips 2025
Lancée en janvier 2023, l’architecture Blackwell RTX a dévoilé des fonctionnalités révolutionnaires axées principalement sur l’intelligence artificielle (IA).Cette innovation n’est pas nouvelle pour NVIDIA, puisque son parcours a débuté avec le lancement de CUDA en 2006, marquant une avancée significative dans le calcul accéléré et l’IA.

NVIDIA affirme que les progrès en matière de densité de calcul ont dépassé la loi de Moore, grâce à des techniques telles que la parcimonie, une nouvelle architecture de jeu d’instructions (ISA) et des formats optimisés de faible précision. L’introduction du lancer de rayons en temps réel en 2018 et le lancement du DLSS l’année suivante constituent des étapes cruciales de cette évolution.

Ces innovations ont été réalisées grâce à des technologies avancées, notamment des cœurs RT et des cœurs Tensor, et Blackwell amplifie désormais ces capacités à un nouveau niveau.

Dans le domaine des centres de données, NVIDIA a lancé la technologie FP4 Precision, qui multiplie par quatre les charges de travail nécessitant une évolutivité élevée. Jensen Huang, PDG de NVIDIA, souhaite réaffirmer le rôle essentiel de l’IA dans le graphisme, facilitant ainsi l’émergence de l’ère du rendu neuronal avec Blackwell RTX. La marque RTX est synonyme d’innovation dans les domaines de la simulation, de la création de contenu et des jeux vidéo, ouvrant la voie à l’extension des technologies des centres de données aux GPU RTX grand public.

Alors, quel est l’apport de l’architecture Blackwell ? Elle bénéficie d’avancées comme DLSS 4, MFG, ACE et un Path Tracing amélioré, tous conçus pour accélérer les performances et améliorer la fidélité visuelle. NVIDIA affirme que Blackwell RTX peut « multiplier par 10 les performances, l’encombrement et le cycle de conception ».DLSS 4 utilise stratégiquement l’IA pour restituer 100 % des pixels suivant l’image initiale, ce qui se traduit par des temps de rendu plus rapides et une autonomie prolongée pour les appareils mobiles.

Les principes de conception clés du GPU RTX Blackwell incluent :
- Optimisation pour les nouvelles charges de travail neuronales
- Minimiser l’empreinte mémoire
- Assurer un service de qualité pour les tâches neuronales et graphiques
- Efficacité énergétique évolutive

Sur le plan technique, RTX Blackwell est une véritable machine d’ingénierie, offrant 4 000 téra-opérations par seconde (TOPS) et un support FP4 haute vitesse basé sur des cœurs Tensor de 5e génération. Il fournit jusqu’à 360 TFLOP RT ciblés sur la méga-géométrie avec les cœurs RT de 4e génération, tandis que le processus de gestion de l’IA (AMP) gère efficacement les modèles d’IA parallèlement au traitement graphique.

L’architecture du multiprocesseur de streaming RTX Blackwell (SM) diffère considérablement de celle de son homologue pour centre de données. Une amélioration notable réside dans l’intégration des unités FP32 et INT32, auparavant séparées, améliorant ainsi l’efficacité du traitement.

De plus, RTX Blackwell améliore la réorganisation de l’exécution des shaders (SER), doublant ainsi l’efficacité de l’exécution des shaders.

Le Tensor Core de 5e génération introduit la prise en charge FP4 et inclut le mode MFG dans DLSS 4, permettant au GPU d’utiliser l’IA pour restituer quatre images simultanément.

Par conséquent, l’utilisation du DLSS 4 et de la génération d’images réduit considérablement le temps de rendu des images individuelles en décuplant la vitesse de déclenchement du rail central, tout en atteignant des taux de rafraîchissement automatique de la DRAM 100 fois plus rapides. Les plateformes mobiles peuvent ainsi bénéficier d’une réduction jusqu’à deux fois supérieure de la consommation énergétique du GPU, améliorant ainsi considérablement l’autonomie de la batterie.

L’introduction de la GDDR7 permet à la RTX Blackwell d’atteindre des débits allant jusqu’à 30 Gbit/s, doublant ainsi le débit de données de son prédécesseur, la GDDR6. Cette nouvelle norme mémoire améliore encore l’efficacité sur les plateformes mobiles.
Grâce à l’unité AMP de NVIDIA, l’exécution simultanée des charges de travail d’IA et graphiques est une réalité, ce qui conduit à une livraison d’images plus fluide et à des réponses de modèle plus rapides.

Pour passer des applications gaming aux usages professionnels, NVIDIA intègre de nouvelles fonctionnalités à la RTX PRO 6000, comme l’Universal MIG. Celle-ci permet à jusqu’à quatre instances de GPU RTX PRO, chacune équipée de 24 Go de VRAM, de fonctionner simultanément avec une latence et un débit constants.
Une démonstration impressionnante a mis en valeur les capacités de la RTX PRO 6000 en exécutant quatre instances de Cyberpunk 2077 à 1080p avec les paramètres maximum, une tâche gérable pour ce puissant GPU.

En utilisant une instance standard à découpage temporel comme référence, les comparaisons avec les modes MIG 2x et 4x ont révélé une augmentation remarquable de 60 % de l’évolutivité. Le GPU RTX PRO 6000 Blackwell est parfaitement adapté à la gestion de plusieurs instances d’applications exigeantes comme Cyberpunk 2077.

Globalement, l’architecture GPU Blackwell de NVIDIA a progressé depuis sa sortie, évoluant continuellement pour les applications grand public et professionnelles. Alors que de plus en plus de jeux et d’outils de création de contenu intègrent les avancées majeures en matière d’IA et de neurones offertes par Blackwell, l’attente des développements futurs dans ce domaine est palpable.
Laisser un commentaire