Microsoft hat offiziell das Agility SDK 1.619 veröffentlicht, das bedeutende Verbesserungen in DirectX 12 mit sich bringt, darunter Shader Model 6.9 und DXR 1.2-Erweiterungen.
Wichtige Aktualisierungen im Microsoft Agility SDK: Shader Model 6.9, DXR 1.2 und verbesserte DX12-Funktionen für NVIDIA RTX-, AMD Radeon- und Intel Arc-GPUs
Das neu veröffentlichte Agility SDK 1.619 bringt drei wichtige Neuerungen: Shader Model 6.9, DXR 1.2 und diverse DX12-Verbesserungen. Im Folgenden die wichtigsten Highlights:
- Shader-Modell 6.9 (über DXC 1.9.2602.16):
- Unterstützung für Operationen mit langen Vektoren.
- Einführung der 16-Bit-Gleitkomma-Sonderbefehle.
- Obligatorische Einbeziehung von 16-Bit- und 64-Bit-Shader-Operationen sowie Wave-Operationen.
- HLSL-Belichtung für Features in DXR 1.2.
- DXR 1.2:
- Opazitäts-Mikrokarten (bereits veröffentlicht, jetzt mit aktivierten neuen SM 6.9-Funktionen).
- Shader Execution Reordering (SER).
- D3D-Kundenwünsche:
- Aktualisierte APIs zur Erstellung von Ressourcenansichten.
- Regelmäßige Trimmbenachrichtigungen.
- Erweiterte Dispatch-Grenzwerte.
- CPU-Timeline-Abfrage wird aufgelöst.
Ein herausragendes Merkmal dieser Version ist das Shader-Modell 6.9, das wichtige Funktionen wie lange Vektoren einführt und es HLSL ermöglicht, Vektoren mit Längen zwischen 4 und 1024 Elementen zu verarbeiten. Darüber hinaus sind sowohl 16-Bit- als auch 64-Bit-Shader-Operationen nun Standard.

Die Aktualisierungen für DXR (DirectX Raytracing) umfassen wichtige Funktionen wie Opacity Micromaps und Shader Execution Reordering. Die Integration von OMM verbessert die Hardware-Verarbeitung von Geometrie in der Alpha-Phase und bietet potenziell bemerkenswerte Leistungssteigerungen im Vergleich zu herkömmlichen Methoden mit AnyHit-Shaderaufrufen.

Microsoft berichtete bereits von bis zu 2, 3-facher Leistungssteigerung in Path-Tracing-Spielen durch den Einsatz von OMM. Spezielle Demos von NVIDIA zeigten Verbesserungen von über 60 %.Beispielsweise lief eine Szene ohne OMM mit 55 FPS, während die Aktivierung dieser Funktion die Leistung auf 90 FPS steigerte. Derzeit ist die umfassende Unterstützung für OMM exklusiv für NVIDIA RTX-GPUs verfügbar.

Ein bedeutendes Beispiel für die Nutzung dieser Funktionen ist Alan Wake, bekannt für seine umfangreiche, auf Alpha-Tests basierende Geometrie. Das Spiel kann eine enorme Anzahl an Dreiecken und Eckpunkten verarbeiten und erzeugt dank hoher Raytracing-Einstellungen bis zu 36, 9 Millionen Strahlen pro Frame. Bemerkenswert ist, dass die RTX 4090 mit SER und OMM eine Szene in nur etwa 10, 2 ms rendern kann, im Vergleich zu 16, 8 ms zuvor.
Opazitäts-Mikrokarten
Opacity Micromaps (OMMs) verbessern die Effizienz der Geometrieverarbeitung in Alpha-Tests, indem sie die Abhängigkeit von ressourcenintensiven AnyHit-Shaderaufrufen reduzieren. Diese Funktion wurde bereits früher eingeführt und durch ein kürzliches Update um eine erweiterte HLSL-Unterstützung ergänzt.
Shader-Ausführungsreihenfolge
Die Shader-Ausführungsreihenfolge (SER) optimiert die Shader-Ausführung, indem sie Anwendungen ermöglicht, Shader-Code für eine verbesserte Parallelverarbeitung zu organisieren. Diese Funktion befindet sich nun nicht mehr in der Vorschauphase, und Anwendungen können die Geräteunterstützung für die Neuanordnung abfragen.
Darüber hinaus bietet das Agility SDK 1.619 wichtige Verbesserungen für die DirectX 12 Ultimate API und behebt bisherige Einschränkungen bei Pufferansichten. Mit dieser Version können Entwickler Pufferansichten mithilfe von Byte-Offsets und -Größen spezifizieren, was die Benutzerfreundlichkeit der API erheblich verbessert.
Mit der Weiterentwicklung von GPU-Architekturen traten Probleme mit dem View-Erstellungsmodell von D3D12 auf, insbesondere hinsichtlich Pufferzugriffsmustern und Deskriptorverwaltung. Die neuen Aktualisierungen modernisieren diesen Aspekt der API, um sicherzustellen, dass sie den heutigen Anforderungen entspricht.
Das aktualisierte Modell ermöglicht die Messung von Pufferansichten in Byte-Offsets und -Größen, verbunden mit einer verbesserten Fehlerbehandlung, indem
HRESULTes sich nicht ausschließlich auf die Validierung der Debug-Schicht verlässt.Regelmäßige Trimmbenachrichtigungen
Neue Trim-Benachrichtigungen auf Kernel-Ebene sind in die D3D12-Laufzeitumgebung integriert, wodurch Anwendungen Warnungen erhalten, wann die Residenz gekürzt werden muss, ohne dass neue Treiberunterstützung erforderlich ist.
Erhöhtes 1D-Dispatch-Limit
Dieses Update erhöht die maximale Größe von 1-Dimensional Dispatch/Dispatch Mesh über das bisherige Limit von 65535 hinaus und trägt so den Möglichkeiten moderner Hardware Rechnung.
D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchSizeD3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchMeshSizeCPU-Timeline-Abfrage wird aufgelöst
Ein neu eingeführter Query Heap ermöglicht die Auflösung von Anfragen auf der CPU-Zeitachse und minimiert so unnötigen Overhead bei GPU-Operationen. Diese Funktion führt
ID3D12Device15::CreateQueryHeap1Folgendes ein:ID3D12Device15::ResolveQueryData.
GPU-Herstellerunterstützung für Microsoft Agility SDK 1.619
Die Unterstützung für das Agility SDK 1.619 ist jetzt bei allen drei großen GPU-Herstellern verfügbar, allerdings mit unterschiedlichem Kompatibilitätsgrad je nach Produktarchitektur.
Übersicht zur Hardwareunterstützung
| Unabhängiger Lieferant (IHV) | Fahrerverbindungen |
| AMD | AMD-Software: Adrenalin Edition 26.2.1 AMD-Software: AgilitySDK Developer Preview Edition 25.30.21.01 |
| Intel | Intel Arc Graphics – Windows |
| NVIDIA | Offizielle NVIDIA-Treiber | NVIDIA oder über die NVIDIA-App für automatische Updates. |
NVIDIA gibt an, dass die gesamte RTX-GPU-Reihe mit den neuesten SDK-Erweiterungen kompatibel ist. Bei DXR 1.2 steht die Hardwarebeschleunigung von OMM ab der RTX-40-Serie zur Verfügung, während SER ebenfalls ab dieser Generation unterstützt wird.Ältere GPUs bieten für OMM-Funktionen lediglich eine Softwareemulation.
Im AMD-Bereich umfasst die Unterstützung die Serien RX 7000, RX 900 und Ryzen AI 300/400, was auf Kompatibilität mit RDNA-Architekturen hindeutet. Die vollständige Unterstützung von DXR 1.2 und Shader Model 6.9 ist jedoch RDNA 4-GPUs (Radeon RX 9000) vorbehalten.
Intel gibt an, dass seine Arc B-Serie (Battlemage) alle SDK-Funktionen unterstützt. Darüber hinaus sind bestimmte D3D-Funktionen, wie VPblit 3DLUT, auch für Lunar Lake-CPUs verfügbar.
Bemerkenswert ist, dass OMMs exklusiv für die RTX 40-Serie und höher verfügbar sind, SER jedoch auf NVIDIA RTX 40+ und Intel Arc B-Series über eine Neuanordnungsfunktion verfügt, während auf GPUs der RX 9000-Serie keine Neuanordnungsfunktionalität verfügbar ist.
| AMD | Intel | NVIDIA | |
| Langer Vektor | AMD Radeon RX 9000-Serie | Intel Arc B-Series Grafik | Alle RTX-Hardware |
| 16-Bit-Gleitkomma-Spezialfunktionen | AMD Radeon RX 9000-Serie | Intel Arc B-Series Grafik | Alle RTX-Hardware |
| Opazitäts-Mikrokarten (OMM) | N / A | N / A | Alle RTX-Hardware. Hardwarebeschleunigt auf RTX 4xxx+, emuliert auf älteren Modellen. |
| Shader Execution Reordering (SER) | Die AMD Radeon RX 9000-Serie unterstützt die API, implementiert aber keine Neuanordnung. | RTX 4xxx+ GPUs unterstützen die API und führen eine Neuanordnung durch. | Intel Arc B-Series Grafik. Derzeitiges Limit von 64k, wird mit zukünftigen Treibern erhöht. |
| Überarbeitete APIs zur Erstellung von Ressourcenansichten | AMD Radeon RX 7000 und 9000 Serien | Intel Arc B-Series Grafik | Alle RTX-Hardware |
| Regelmäßige Trimmbenachrichtigungen | N / A | Intel Arc B-Series Grafik | Alle RTX-Hardware |
| Erhöhtes Dispatch-Grenzwert | AMD Radeon RX 7000 und 9000 Serie. UINT_MAX Rechenleistung, 64k Mesh. | Intel Arc B-Series Grafik. Aktuell 64k Limit, Erhöhungen in zukünftigen Treibern geplant. | Alle RTX-Hardware. Bestehende Beschränkung auf 64k, Erhöhungen in zukünftigen Treibern geplant. |
| CPU-Timeline-Abfrage wird aufgelöst | AMD Radeon RX 7000 und 9000 Serien | Intel Arc B-Series Grafik | Alle RTX-Hardware |
| Zaunbarrieren (Vorschau) | AMD Radeon RX 7000 und 9000 Serien | Intel Arc B-Series Grafik | Wenden Sie sich an die Entwicklerbetreuung, um Zugriff auf Treiber in der Entwicklungsphase zu erhalten. |
| VPblit 3DLUT (Vorschau) | Grafikkarten der AMD Radeon RX 7000-Serie und Prozessoren der Ryzen AI 300/400-Serie mit integrierter Grafik | Intel Core Ultra Prozessoren, Lunar Lake und Panther Lake Plattformen | Für detaillierte Zugangsdaten wenden Sie sich bitte an die Entwicklerbetreuung. |
Schreibe einen Kommentar