
NVIDIA sorgt mit seinen neuesten Fortschritten im Bereich neuronales Rendering und Gaming weiterhin für Aufsehen in der Technologiebranche, insbesondere durch seine Blackwell RTX-GPU-Serie, zu der die RTX 5090 und RTX PRO 6000 gehören.
NVIDIA präsentiert Blackwell RTX-Innovationen auf der Hot Chips 2025
Die im Januar 2023 eingeführte Blackwell RTX-Architektur bietet bahnbrechende Funktionen, die sich vor allem auf künstliche Intelligenz (KI) konzentrieren. Diese Innovation ist für NVIDIA kein neues Unterfangen, denn ihre Reise begann mit der Einführung von CUDA im Jahr 2006, einem bedeutenden Fortschritt im Bereich beschleunigtes Computing und KI.

NVIDIA behauptet, dass die Fortschritte bei der Rechendichte die Skalierung nach Moores Gesetz übertroffen haben. Dies sei durch Techniken wie Sparsity, eine neue Befehlssatzarchitektur (ISA) und optimierte Formate mit geringerer Präzision erreicht worden. Die Einführung von Echtzeit-Raytracing im Jahr 2018 und die anschließende Einführung von DLSS im darauffolgenden Jahr stellen entscheidende Meilensteine in dieser Entwicklung dar.

Diese Innovationen wurden durch den Einsatz fortschrittlicher Technologien wie RT-Kernen und Tensor-Kernen erreicht, und Blackwell erweitert diese Fähigkeiten nun auf ein neues Niveau.

Im Rechenzentrumsbereich hat NVIDIA die FP4-Präzision eingeführt, die eine vierfache Steigerung für Workloads mit hoher Skalierung ermöglicht. Jensen Huang, CEO von NVIDIA, möchte die zentrale Rolle von KI in der Grafik bekräftigen und mit Blackwell RTX den Beginn des neuronalen Rendering-Zeitalters ermöglichen. Die Marke RTX steht für Innovationen in den Bereichen Simulation, Content-Erstellung und Gaming und ebnet den Weg für die Ausweitung von Rechenzentrumstechnologien auf RTX-GPUs für Verbraucher.

Was leistet die Blackwell-Architektur? Sie bietet Neuerungen wie DLSS 4, MFG, ACE und verbessertes Path Tracing, die alle auf eine höhere Leistung und verbesserte Bildtreue ausgelegt sind. NVIDIA behauptet, dass Blackwell RTX eine „zehnfache Steigerung von Leistung, Platzbedarf und Designzyklus“ erreichen kann. DLSS 4 nutzt KI strategisch, um 100 % der Pixel nach dem ersten Frame zu rendern, was letztendlich zu schnelleren Renderzeiten und einer längeren Akkulaufzeit mobiler Geräte führt.

Zu den wichtigsten Designprinzipien der RTX Blackwell GPU gehören:
- Optimierung für neue neuronale Arbeitslasten
- Minimieren des Speicherbedarfs
- Sicherstellung eines hochwertigen Services für neuronale und grafische Aufgaben
- Skalierbare Energieeffizienz

Technisch gesehen ist RTX Blackwell ein wahres Kraftpaket und bietet 4000 AI Tera Operations Per Second (TOPS) und High-Speed FP4-Unterstützung auf Basis von Tensor-Cores der 5. Generation. Mit den RT-Cores der 4. Generation bietet es bis zu 360 RT TFLOPs für Mega-Geometrie, während der AI Management Process (AMP) neben der Grafikverarbeitung auch KI-Modelle effektiv verwaltet.

Die Architektur des RTX Blackwell Streaming Multiprocessor (SM) unterscheidet sich deutlich von der seines Data Center-Pendants. Eine bemerkenswerte Verbesserung ist die Integration der zuvor getrennten FP32- und INT32-Einheiten, wodurch die Verarbeitungseffizienz gesteigert wird.

Darüber hinaus verbessert RTX Blackwell die Shader Execution Reordering (SER) und verdoppelt so die Effizienz der Shader-Ausführung.

Der Tensor Core der 5. Generation führt FP4-Unterstützung ein und umfasst den MFG-Modus in DLSS 4, wodurch die GPU mithilfe von KI vier Frames gleichzeitig rendern kann.

Die Nutzung von DLSS 4 in Kombination mit Frame Generation reduziert die Renderzeit einzelner Frames deutlich, da die Core-Rail-Gating-Geschwindigkeit verzehnfacht wird und gleichzeitig eine 100-mal schnellere DRAM-Selbstaktualisierungsrate erreicht wird. Mobile Plattformen können den GPU-Stromverbrauch um bis zu das Zweifache reduzieren, was die Akkulaufzeit deutlich verlängert.

Durch die Einführung von GDDR7 erreicht die RTX Blackwell Geschwindigkeiten von bis zu 30 Gbit/s und verdoppelt damit effektiv die Datenrate ihres Vorgängers GDDR6. Dieser neue Speicherstandard steigert die Effizienz auf mobilen Plattformen weiter.
Dank der AMP-Einheit von NVIDIA ist die gleichzeitige Ausführung von KI- und Grafik-Workloads Realität, was zu einer reibungsloseren Frame-Bereitstellung und schnelleren Modellreaktionen führt.

NVIDIA erweitert die RTX PRO 6000 um neue Funktionen wie Universal MIG, um den Übergang von Gaming-Anwendungen zu professionellen Anwendungen zu ermöglichen. Dadurch können bis zu vier Instanzen der RTX PRO-GPUs, jede mit 24 GB VRAM ausgestattet, gleichzeitig mit konstanter Latenz und Durchsatz betrieben werden.
Eine beeindruckende Demonstration demonstrierte die Leistungsfähigkeit des RTX PRO 6000, indem vier Instanzen von Cyberpunk 2077 mit 1080p und maximalen Einstellungen ausgeführt wurden, eine Aufgabe, die für diese leistungsstarke GPU machbar ist.

Unter Verwendung einer standardmäßigen Time-Slice-Instanz als Basislinie ergaben Vergleiche mit den MIG-Modi 2x und 4x eine bemerkenswerte Steigerung der Skalierbarkeit um 60 %.Die RTX PRO 6000 Blackwell GPU eignet sich tatsächlich gut für die Verwaltung mehrerer Instanzen anspruchsvoller Anwendungen wie Cyberpunk 2077.

Insgesamt hat NVIDIAs Blackwell-GPU-Architektur seit ihrer Veröffentlichung große Fortschritte gemacht und sich kontinuierlich für private und professionelle Anwendungen weiterentwickelt. Da immer mehr Spiele und Tools zur Inhaltserstellung die umfangreichen KI- und neuronalen Verbesserungen von Blackwell nutzen, ist die Vorfreude auf zukünftige Entwicklungen in diesem Bereich spürbar.
Schreibe einen Kommentar