Auf der CES 2025 gab NVIDIA einen detaillierten Einblick in die Blackwell-GPU-Architektur der nächsten Generation, die die kommenden RTX 50-Gaming-Grafikkarten antreiben soll. Dieses innovative Design verspricht erhebliche Fortschritte gegenüber der vorherigen Ada-Architektur und verbessert Leistung, Effizienz und Grafikfunktionen sowohl für Gamer als auch für Content-Ersteller.
Erkundung der NVIDIA GeForce RTX 50 „Blackwell“-GPU-Architektur
Die Blackwell-Architektur ist auf anspruchsvolle Gaming-Umgebungen und kreative Anwendungen zugeschnitten und verfügt über bahnbrechende Komponenten, die eine überragende Leistung ermöglichen. Die Markteinführung der RTX 50-Serie wird für Ende dieses Monats erwartet und bringt eine Architektur mit sich, die auf dem 4-nm-Prozessknoten von TSMC basiert. Dieses hochmoderne GPU-Design umfasst beeindruckende 92 Milliarden Transistoren und liefert bis zu 4000 AI TOPS, 380 RT TFLOPs und 125 TFLOPS FP32-Rechenleistung. Darüber hinaus verfügt es über die schnellste GDDR7-Speicherschnittstelle und erreicht Bandbreiten von bis zu 1,8 TB/s, und das alles in einem neu gestalteten Founders Edition-Design.
Detaillierter Überblick über die Blackwell-Architektur
Die Blackwell-Architektur von NVIDIA zielt darauf ab, die grafische Leistung der nächsten Gaming-Generation zu steigern, indem sie sich auf erweiterte neuronale Fähigkeiten und Workloads konzentriert. Dazu gehören eine erhebliche Reduzierung des Speicherbedarfs, verbesserte Energieeffizienz und innovative Quality-of-Service-Funktionen. Zu den wichtigsten Verbesserungen gehören:
- Einführung von Tensor Cores der 5. Generation, die Hochgeschwindigkeits-FP4-Berechnungen mit bis zu 4000 AI TOPS ermöglichen.
- Raytracing-Kerne (RT) der 4. Generation mit unglaublichen 360 RT-TFLOPs, speziell für Mega Geometry entwickelt.
- Ein KI-Managementprozessor der nächsten Generation, der die nahtlose gleichzeitige Ausführung von KI-Modellen und Grafik-Workloads ermöglicht.
- Neue Blackwell-Streaming-Multiprozessoren (SM) mit einer maximalen FP32-Rechenleistung von 125 TFLOPS.
- Die Integration von GDDR7-Speicher bietet die bislang schnellsten Geschwindigkeiten von bis zu 30 Gbit/s auf der RTX 5080.
Zu den zusätzlichen Funktionen der RTX-Blackwell-Architektur gehören DisplayPort 2.1, PCIe Gen5-Kompatibilität und 4K NVDEC/NVENC-Funktionen mit verbesserter Farbtiefe.
Leistungsverbesserungen und technologische Fortschritte
Beim Vergleich der Streaming Multiprocessors (SM) von Blackwell mit denen der Ada-Architektur ist es offensichtlich, dass NVIDIA den INT32-GPU-Durchsatz effektiv verdoppelt hat, was die Leistung von Workloads wie Work Graphs und Shader Execution verbessert. Die neue Architektur ermöglicht auch eine effizientere Ausführung mehrerer Workloads und verbessert die Shader Execution Reordering (SER) um den Faktor zwei.
Darüber hinaus übertrifft GDDR7 den älteren GDDR6/X-Speicher in der Leistung und bietet die doppelte Bandbreite und Datenrate bei gleichzeitig höherer Energieeffizienz. Diese innovative Speichertechnologie unterstützt PAM4-Signalisierung und positioniert die RTX 50-Serie als erste Architektur, die sowohl GDDR7 als auch PCIe 5.0 voll ausnutzen kann.
Fortschrittliche Raytracing-Technologien
Die architektonischen Fortschritte erstrecken sich auch auf Raytracing. Die Einführung der RT-Cores der 4. Generation umfasst die Triangle Cluster Intersection Engine, die speziell für die Verarbeitung von Megageometrie optimiert ist. Dieses Upgrade ermöglicht eine bessere Handhabung komplexer Szenen bei gleichzeitig geringerem Speicherbedarf.
Darüber hinaus verfügt die innovative Mega Geometry-Engine über ein Triangle Cluster Compression-Format, das die für umfangreiche Raytracing-Aufgaben erforderlichen Daten effizient verwaltet. Dies führt zu einer 8-fachen Schnittmenge von Strahlendreiecken bei minimaler Speichernutzung.
Die Einführung des FP4-Formats auf Blackwells Tensor-Cores der 5. Generation bietet eine dramatische Steigerung des Durchsatzes und einen 32-fachen Leistungsvorteil gegenüber Pascal-GPUs und eine 2-fache Steigerung gegenüber GPUs der Ada-Generation. Diese Verbesserung unterstützt fortschrittliche Neural-Shading-Techniken, die in Gaming-Titeln der nächsten Generation verwendet werden.
Innovative Zeitplanung und Energieverwaltung
Eine wichtige Neuerung innerhalb der Blackwell-Architektur ist der programmierbare Coprozessor namens Amp. Diese Komponente ermöglicht die effiziente Interaktion und Arbeitslastverteilung zwischen verschiedenen GPU-Kernen und sorgt so für optimale Leistung.
Blackwell verfügt außerdem über ausgefeilte Energieverwaltungsmodi, die es ermöglichen, den Taktbaum der GPU im Leerlauf zu deaktivieren. Diese Funktion ermöglicht erhebliche Stromeinsparungen, was insbesondere für mobile Designs wie die „Max-Q“-Serie von Vorteil ist. Die Architektur verbessert die Leistung und optimiert gleichzeitig den Stromverbrauch durch eine sekundäre Schiene, die unterschiedliche Spannungsoperationen für Kerne und Speichersysteme ermöglicht.
Darüber hinaus verbessert Blackwell seine Frequenzreaktion um das bemerkenswerte 1000-fache und ermöglicht so eine effiziente Frequenzzuweisung je nach Arbeitslasttyp. Dies führt zu einer Verbesserung der Taktfrequenz um bis zu 300 MHz im Vergleich zu Ada-GPUs.
Anzeige- und Videofunktionen
Die Blackwell-Architektur erweitert außerdem die Anzeige- und Videoverarbeitungsfunktionen. Sie bietet Unterstützung für DisplayPort 2.1b und verbessert die Bildübertragung durch fortschrittliche Hardware-Flip-Metering-Techniken. Die Architektur umfasst den Encoder der 9. Generation und den Decoder der 6. Generation, die mit fortschrittlichen Codecs wie AV1 und HEVC kompatibel sind und so erstklassige Videoqualität und Leistung gewährleisten.
Fortschritte bei DLSS: DLSS 4
DLSS 4 setzt die Entwicklung der Deep-Learning-Technologie fort und stellt seit seiner Einführung im Jahr 2018 einen bedeutenden Fortschritt dar. In dieser Version nutzt NVIDIA fortschrittliche Supercomputer, um das DLSS-Modell kontinuierlich zu verbessern, was zu erheblichen Verbesserungen der Bildqualität und Reaktionsfähigkeit führt.
Mit DLSS 4 geht NVIDIA zu einer robusten neuen neuronalen Architektur über, komplett mit einer Transformer-Engine, die mehrere Datensätze effektiver verarbeiten kann. Der neue Multi-Frame Generation (MFG)-Modus ermöglicht die Generierung von bis zu fünf Modellen pro Frame, was die Rendering-Qualität deutlich verbessert.
Dieser bahnbrechende Ansatz schafft die Voraussetzungen dafür, dass DLSS 4 mit anfänglicher Unterstützung für 75 Spiele verfügbar sein wird, die größte Bibliothek von DLSS-erweiterten Titeln, die gleichzeitig veröffentlicht werden. Entwickler, die bereits DLSS 3 oder 3.5 verwenden, werden die Integration als unkompliziert empfinden, was eine robuste Unterstützung sowohl für neue als auch für bestehende Titelreihen gewährleistet.
Reduzieren der Latenz mit Reflex 2
Die Reflex 2-Technologie von NVIDIA zielt darauf ab, die Reaktionsfähigkeit von Gamern zu verbessern, insbesondere in Wettkampfumgebungen. Durch die Nutzung der Frame Warp-Technologie verringert Reflex 2 die Systemlatenz um 75 % und verbessert so das gesamte Spielerlebnis.
Diese Verbesserung ermöglicht die Echtzeitabtastung der Mauspositionen vor dem Frame-Rendering und optimiert so die Reaktionsfähigkeit erheblich. Reflex 2 wird in verschiedenen Hochleistungstiteln nativ unterstützt, sodass alle RTX-GPU-Benutzer von dieser Weiterentwicklung profitieren können.
Revolutionäres Gaming mit RTX AI
Die Blackwell-Architektur von NVIDIA betont die KI-Integration beim Gaming. Durch die Zusammenarbeit mit Microsoft, um auf die Neural-Rendering-Funktionen von DirectX zuzugreifen, kann NVIDIA eine beispiellose Leistung aus den RTX 50-GPUs herausholen. Zu den Innovationen gehören Neural Shader und erweitertes Materialhandling, was einen transformativen Wechsel von traditioneller zu KI-gesteuerter Grafik verspricht.
Durch neue Technologien wie Neural Radiance Cache (NRC) und RTX Mega Geometry definiert NVIDIA die Art und Weise neu, wie Licht mit Objekten in einer Szene interagiert, und bietet beispiellosen Realismus und Interaktivität in Gaming-Umgebungen. Die Einführung von KI-gestützten Funktionen für die Charakterdarstellung unterstreicht das Engagement, lebensechte Details in virtuelle Welten zu bringen.
Die Fähigkeiten von Blackwell bereichern die Zukunft des Gamings, denn fortschrittliche Anwendungen für neuronale Materialien und Lichtoptimierung werden die Bildtreue und Effizienz drastisch steigern. Während NVIDIA weiter voranschreitet, kann sich die Gaming-Community auf beispiellose Fortschritte bei der Grafikleistung und KI-Integration freuen.
Schreibe einen Kommentar