Microsoft veröffentlicht Shader Model 6.9-, DXR 1.2- und DX12-Upgrades im Agility SDK 1.619 mit umfassender NVIDIA-Unterstützung

Microsoft veröffentlicht Shader Model 6.9-, DXR 1.2- und DX12-Upgrades im Agility SDK 1.619 mit umfassender NVIDIA-Unterstützung

Microsoft hat offiziell das Agility SDK 1.619 veröffentlicht, das bedeutende Verbesserungen in DirectX 12 mit sich bringt, darunter Shader Model 6.9 und DXR 1.2-Erweiterungen.

Wichtige Aktualisierungen im Microsoft Agility SDK: Shader Model 6.9, DXR 1.2 und verbesserte DX12-Funktionen für NVIDIA RTX-, AMD Radeon- und Intel Arc-GPUs

Das neu veröffentlichte Agility SDK 1.619 bringt drei wichtige Neuerungen: Shader Model 6.9, DXR 1.2 und diverse DX12-Verbesserungen. Im Folgenden die wichtigsten Highlights:

  • Shader-Modell 6.9 (über DXC 1.9.2602.16):
    • Unterstützung für Operationen mit langen Vektoren.
    • Einführung der 16-Bit-Gleitkomma-Sonderbefehle.
    • Obligatorische Einbeziehung von 16-Bit- und 64-Bit-Shader-Operationen sowie Wave-Operationen.
    • HLSL-Belichtung für Features in DXR 1.2.
  • DXR 1.2:
    • Opazitäts-Mikrokarten (bereits veröffentlicht, jetzt mit aktivierten neuen SM 6.9-Funktionen).
    • Shader Execution Reordering (SER).
  • D3D-Kundenwünsche:
    • Aktualisierte APIs zur Erstellung von Ressourcenansichten.
    • Regelmäßige Trimmbenachrichtigungen.
    • Erweiterte Dispatch-Grenzwerte.
    • CPU-Timeline-Abfrage wird aufgelöst.

Ein herausragendes Merkmal dieser Version ist das Shader-Modell 6.9, das wichtige Funktionen wie lange Vektoren einführt und es HLSL ermöglicht, Vektoren mit Längen zwischen 4 und 1024 Elementen zu verarbeiten. Darüber hinaus sind sowohl 16-Bit- als auch 64-Bit-Shader-Operationen nun Standard.

Eine Präsentationsfolie mit dem Titel „DXR 1.2: Shader Execution Reordering (SER)“ zeigt eine bis zu 2-fache Leistungssteigerung in Path-Tracing-Szenarien.

Die Aktualisierungen für DXR (DirectX Raytracing) umfassen wichtige Funktionen wie Opacity Micromaps und Shader Execution Reordering. Die Integration von OMM verbessert die Hardware-Verarbeitung von Geometrie in der Alpha-Phase und bietet potenziell bemerkenswerte Leistungssteigerungen im Vergleich zu herkömmlichen Methoden mit AnyHit-Shaderaufrufen.

Diagramm zur Leistungsverbesserung, das den Effekt von Opacity Micromaps auf die Rendering-Leistung veranschaulicht.

Microsoft berichtete bereits von bis zu 2, 3-facher Leistungssteigerung in Path-Tracing-Spielen durch den Einsatz von OMM. Spezielle Demos von NVIDIA zeigten Verbesserungen von über 60 %.Beispielsweise lief eine Szene ohne OMM mit 55 FPS, während die Aktivierung dieser Funktion die Leistung auf 90 FPS steigerte. Derzeit ist die umfassende Unterstützung für OMM exklusiv für NVIDIA RTX-GPUs verfügbar.

Beispiel für Performance-Rendering unter Verwendung von Shader Execution Reordering und Opacity Micromaps.

Ein bedeutendes Beispiel für die Nutzung dieser Funktionen ist Alan Wake, bekannt für seine umfangreiche, auf Alpha-Tests basierende Geometrie. Das Spiel kann eine enorme Anzahl an Dreiecken und Eckpunkten verarbeiten und erzeugt dank hoher Raytracing-Einstellungen bis zu 36, 9 Millionen Strahlen pro Frame. Bemerkenswert ist, dass die RTX 4090 mit SER und OMM eine Szene in nur etwa 10, 2 ms rendern kann, im Vergleich zu 16, 8 ms zuvor.

Opazitäts-Mikrokarten

Opacity Micromaps (OMMs) verbessern die Effizienz der Geometrieverarbeitung in Alpha-Tests, indem sie die Abhängigkeit von ressourcenintensiven AnyHit-Shaderaufrufen reduzieren. Diese Funktion wurde bereits früher eingeführt und durch ein kürzliches Update um eine erweiterte HLSL-Unterstützung ergänzt.

Shader-Ausführungsreihenfolge

Die Shader-Ausführungsreihenfolge (SER) optimiert die Shader-Ausführung, indem sie Anwendungen ermöglicht, Shader-Code für eine verbesserte Parallelverarbeitung zu organisieren. Diese Funktion befindet sich nun nicht mehr in der Vorschauphase, und Anwendungen können die Geräteunterstützung für die Neuanordnung abfragen.

über Microsoft

Darüber hinaus bietet das Agility SDK 1.619 wichtige Verbesserungen für die DirectX 12 Ultimate API und behebt bisherige Einschränkungen bei Pufferansichten. Mit dieser Version können Entwickler Pufferansichten mithilfe von Byte-Offsets und -Größen spezifizieren, was die Benutzerfreundlichkeit der API erheblich verbessert.

Mit der Weiterentwicklung von GPU-Architekturen traten Probleme mit dem View-Erstellungsmodell von D3D12 auf, insbesondere hinsichtlich Pufferzugriffsmustern und Deskriptorverwaltung. Die neuen Aktualisierungen modernisieren diesen Aspekt der API, um sicherzustellen, dass sie den heutigen Anforderungen entspricht.

Das aktualisierte Modell ermöglicht die Messung von Pufferansichten in Byte-Offsets und -Größen, verbunden mit einer verbesserten Fehlerbehandlung, indem HRESULTes sich nicht ausschließlich auf die Validierung der Debug-Schicht verlässt.

Regelmäßige Trimmbenachrichtigungen

Neue Trim-Benachrichtigungen auf Kernel-Ebene sind in die D3D12-Laufzeitumgebung integriert, wodurch Anwendungen Warnungen erhalten, wann die Residenz gekürzt werden muss, ohne dass neue Treiberunterstützung erforderlich ist.

Erhöhtes 1D-Dispatch-Limit

Dieses Update erhöht die maximale Größe von 1-Dimensional Dispatch/Dispatch Mesh über das bisherige Limit von 65535 hinaus und trägt so den Möglichkeiten moderner Hardware Rechnung.

  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchSize
  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchMeshSize

CPU-Timeline-Abfrage wird aufgelöst

Ein neu eingeführter Query Heap ermöglicht die Auflösung von Anfragen auf der CPU-Zeitachse und minimiert so unnötigen Overhead bei GPU-Operationen. Diese Funktion führt ID3D12Device15::CreateQueryHeap1Folgendes ein:ID3D12Device15::ResolveQueryData.

über Microsoft

GPU-Herstellerunterstützung für Microsoft Agility SDK 1.619

Die Unterstützung für das Agility SDK 1.619 ist jetzt bei allen drei großen GPU-Herstellern verfügbar, allerdings mit unterschiedlichem Kompatibilitätsgrad je nach Produktarchitektur.

Übersicht zur Hardwareunterstützung

Unabhängiger Lieferant (IHV) Fahrerverbindungen
AMD AMD-Software: Adrenalin Edition 26.2.1 AMD-Software: AgilitySDK Developer Preview Edition 25.30.21.01
Intel Intel Arc Graphics – Windows
NVIDIA Offizielle NVIDIA-Treiber | NVIDIA oder über die NVIDIA-App für automatische Updates.

NVIDIA gibt an, dass die gesamte RTX-GPU-Reihe mit den neuesten SDK-Erweiterungen kompatibel ist. Bei DXR 1.2 steht die Hardwarebeschleunigung von OMM ab der RTX-40-Serie zur Verfügung, während SER ebenfalls ab dieser Generation unterstützt wird.Ältere GPUs bieten für OMM-Funktionen lediglich eine Softwareemulation.

Im AMD-Bereich umfasst die Unterstützung die Serien RX 7000, RX 900 und Ryzen AI 300/400, was auf Kompatibilität mit RDNA-Architekturen hindeutet. Die vollständige Unterstützung von DXR 1.2 und Shader Model 6.9 ist jedoch RDNA 4-GPUs (Radeon RX 9000) vorbehalten.

Intel gibt an, dass seine Arc B-Serie (Battlemage) alle SDK-Funktionen unterstützt. Darüber hinaus sind bestimmte D3D-Funktionen, wie VPblit 3DLUT, auch für Lunar Lake-CPUs verfügbar.

Bemerkenswert ist, dass OMMs exklusiv für die RTX 40-Serie und höher verfügbar sind, SER jedoch auf NVIDIA RTX 40+ und Intel Arc B-Series über eine Neuanordnungsfunktion verfügt, während auf GPUs der RX 9000-Serie keine Neuanordnungsfunktionalität verfügbar ist.

AMD Intel NVIDIA
Langer Vektor AMD Radeon RX 9000-Serie Intel Arc B-Series Grafik Alle RTX-Hardware
16-Bit-Gleitkomma-Spezialfunktionen AMD Radeon RX 9000-Serie Intel Arc B-Series Grafik Alle RTX-Hardware
Opazitäts-Mikrokarten (OMM) N / A N / A Alle RTX-Hardware. Hardwarebeschleunigt auf RTX 4xxx+, emuliert auf älteren Modellen.
Shader Execution Reordering (SER) Die AMD Radeon RX 9000-Serie unterstützt die API, implementiert aber keine Neuanordnung. RTX 4xxx+ GPUs unterstützen die API und führen eine Neuanordnung durch. Intel Arc B-Series Grafik. Derzeitiges Limit von 64k, wird mit zukünftigen Treibern erhöht.
Überarbeitete APIs zur Erstellung von Ressourcenansichten AMD Radeon RX 7000 und 9000 Serien Intel Arc B-Series Grafik Alle RTX-Hardware
Regelmäßige Trimmbenachrichtigungen N / A Intel Arc B-Series Grafik Alle RTX-Hardware
Erhöhtes Dispatch-Grenzwert AMD Radeon RX 7000 und 9000 Serie. UINT_MAX Rechenleistung, 64k Mesh. Intel Arc B-Series Grafik. Aktuell 64k Limit, Erhöhungen in zukünftigen Treibern geplant. Alle RTX-Hardware. Bestehende Beschränkung auf 64k, Erhöhungen in zukünftigen Treibern geplant.
CPU-Timeline-Abfrage wird aufgelöst AMD Radeon RX 7000 und 9000 Serien Intel Arc B-Series Grafik Alle RTX-Hardware
Zaunbarrieren (Vorschau) AMD Radeon RX 7000 und 9000 Serien Intel Arc B-Series Grafik Wenden Sie sich an die Entwicklerbetreuung, um Zugriff auf Treiber in der Entwicklungsphase zu erhalten.
VPblit 3DLUT (Vorschau) Grafikkarten der AMD Radeon RX 7000-Serie und Prozessoren der Ryzen AI 300/400-Serie mit integrierter Grafik Intel Core Ultra Prozessoren, Lunar Lake und Panther Lake Plattformen Für detaillierte Zugangsdaten wenden Sie sich bitte an die Entwicklerbetreuung.

Quellen & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert