Microsoft wprowadza ulepszenia Shader Model 6.9, DXR 1.2 i DX12 w pakiecie Agility SDK 1.619 z rozbudowanym wsparciem NVIDIA

Microsoft wprowadza ulepszenia Shader Model 6.9, DXR 1.2 i DX12 w pakiecie Agility SDK 1.619 z rozbudowanym wsparciem NVIDIA

Firma Microsoft oficjalnie wydała pakiet Agility SDK 1.619, wprowadzający znaczące udoskonalenia w DirectX 12, w tym ulepszenia Shader Model 6.9 i DXR 1.2.

Główne aktualizacje w pakiecie Microsoft Agility SDK: Shader Model 6.9, DXR 1.2 i ulepszone funkcje DX12 dla kart graficznych NVIDIA RTX, AMD Radeon i Intel Arc

Nowo wydany pakiet Agility SDK 1.619 wprowadza trzy kluczowe aktualizacje: Shader Model 6.9, DXR 1.2 oraz różne usprawnienia DX12. Poniżej przedstawiamy najważniejsze zmiany:

  • Model cieniowania 6.9 (poprzez DXC 1.9.2602.16):
    • Obsługa operacji Long Vector.
    • Wprowadzenie do 16-bitowej zmiennej float. Instrukcje specjalne.
    • Obowiązkowe jest uwzględnienie 16-bitowych i 64-bitowych operacji cieniowania i operacji falowych.
    • Ekspozycja HLSL dla funkcji w DXR 1.2.
  • DXR 1.2:
    • Mikromapy krycia (wydane wcześniej, teraz z nowymi funkcjami SM 6.9).
    • Zmiana kolejności wykonywania shaderów (SER).
  • Funkcje D3D zgłoszone przez klientów:
    • Zaktualizowane interfejsy API tworzenia widoków zasobów.
    • Okresowe powiadomienia o przycinaniu.
    • Rozszerzone limity siatki wysyłkowej.
    • Rozwiązuje zapytanie osi czasu procesora.

Wyróżniającym się elementem tej wersji jest Shader Model 6.9, który wprowadza niezbędne funkcje, w tym Long Vectors, umożliwiając HLSL zarządzanie wektorami o długości od 4 do 1024 elementów. Co więcej, zarówno 16-bitowe, jak i 64-bitowe operacje shaderów są teraz standardem.

Slajd prezentacji zatytułowany „DXR 1.2: Shader Execution Reordering (SER)” pokazuje „dwukrotny wzrost wydajności” w scenariuszach śledzenia ścieżki.

Aktualizacje dla DXR (DirectX Ray Tracing) obejmują istotne funkcje, takie jak mikromapy opacity i reordering wykonywania shaderów. Wprowadzenie OMM usprawnia sposób, w jaki sprzęt zarządza geometrią poddaną testom alfa, potencjalnie oferując znaczący wzrost wydajności w porównaniu z tradycyjnymi metodami wykorzystującymi wywołania shaderów AnyHit.

Wykres poprawy wydajności obrazujący wpływ mikromap krycia na wydajność renderowania.

Firma Microsoft informowała wcześniej o nawet 2, 3-krotnym wzroście wydajności w grach opartych na śledzeniu ścieżki, wykorzystujących technologię OMM, a konkretne wersje demonstracyjne firmy NVIDIA pokazywały poprawę o ponad 60%.Na przykład, demonstracja pokazywała scenę odtwarzaną z szybkością 55 kl./s bez technologii OMM, a po włączeniu tej funkcji wydajność wzrosła do 90 kl./s. Obecnie kompleksowe wsparcie dla technologii OMM jest dostępne wyłącznie dla kart graficznych NVIDIA RTX.

Przykład renderowania wydajnościowego wykorzystujący Shader Execution Reordering i Opacity Micromaps.

Jednym z ważnych tytułów wykorzystujących te funkcje jest Alan Wake, znany z silnego oparcia na geometrii poddanej testom alfa. Gra obsługuje oszałamiającą liczbę trójkątów i wierzchołków, a dzięki wysokim ustawieniom ray tracingu, generując do 36, 9 miliona promieni na klatkę. Co ciekawe, dzięki SER i OMM, RTX 4090 może renderować scenę w około 10, 2 ms, w porównaniu z 16, 8 ms.

Mikromapy krycia

Mikromapy krycia (OMM) zwiększają wydajność przetwarzania geometrii w testach alfa, zmniejszając konieczność korzystania z kosztownych wywołań shaderów AnyHit. Funkcja ta została wprowadzona wcześniej, a niedawna aktualizacja rozszerza jej możliwości w zakresie HLSL.

Zmiana kolejności wykonywania shaderów

Funkcja SER (Shader Execution Reordering) usprawnia wykonywanie shaderów, umożliwiając aplikacjom uporządkowanie kodu shaderów w celu usprawnienia przetwarzania równoległego. Funkcja ta wyszła już z wersji zapoznawczej, a aplikacje mogą teraz zwracać się do obsługi urządzeń o zmianę kolejności.

za pośrednictwem Microsoftu

Co więcej, pakiet Agility SDK 1.619 wprowadza istotne ulepszenia do API DirectX 12 Ultimate, usuwając wcześniejsze ograniczenia w widokach bufora. Ta wersja pozwala programistom określać widoki bufora za pomocą przesunięć bajtów i rozmiarów, co znacznie poprawia użyteczność API.

Wraz z rozwojem architektur GPU pojawiły się problemy z modelem tworzenia widoków w D3D12, szczególnie w zakresie wzorców dostępu do bufora i zarządzania deskryptorami. Nowe aktualizacje unowocześniają ten aspekt API, aby zapewnić jego zgodność ze współczesnymi potrzebami.

Zaktualizowany model pozwala na pomiar widoków bufora w przesunięciach bajtów i rozmiarach, a także na ulepszoną obsługę błędów, HRESULTzamiast polegać wyłącznie na walidacji warstwy debugowania.

Okresowe powiadomienia o przycinaniu

Nowe powiadomienia o przycinaniu na poziomie jądra zostały zintegrowane ze środowiskiem wykonawczym D3D12, dzięki czemu aplikacje mogą otrzymywać alerty o konieczności przycinania rezydencji, bez konieczności instalowania nowej obsługi sterowników.

Zwiększony limit wysyłki 1D

Aktualizacja ta zwiększa maksymalny rozmiar siatki 1-Dimensional Dispatch/Dispatch Mesh ponad poprzedni limit 65535, dostosowując się do możliwości współczesnego sprzętu.

  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchSize
  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchMeshSize

Rozwiązuje zapytanie osi czasu procesora

Nowo wprowadzony stos zapytań umożliwia rozwiązywanie zadań na osi czasu procesora, minimalizując niepotrzebne obciążenie podczas operacji GPU. Ta funkcja wprowadza ID3D12Device15::CreateQueryHeap1iID3D12Device15::ResolveQueryData.

za pośrednictwem Microsoftu

Wsparcie dostawców GPU dla pakietu Microsoft Agility SDK 1.619

Wsparcie dla pakietu Agility SDK 1.619 jest teraz dostępne u wszystkich trzech głównych dostawców procesorów graficznych, choć poziom kompatybilności może się różnić w zależności od architektury produktu.

Przegląd wsparcia sprzętowego

Niezależny Dostawca (IHV) Linki do sterowników
AMD Oprogramowanie AMD: Adrenalin Edition 26.2.1 Oprogramowanie AMD: AgilitySDK Developer Preview Edition 25.30.21.01
Intel Grafika Intel Arc – Windows
NVIDIA Oficjalne sterowniki NVIDIA | NVIDIA lub za pośrednictwem aplikacji NVIDIA w celu przeprowadzenia automatycznych aktualizacji.

Firma NVIDIA informuje, że cała jej linia procesorów graficznych RTX jest zgodna z najnowszymi ulepszeniami pakietu SDK. W przypadku DXR 1.2 akceleracja sprzętowa OMM dotyczy serii RTX 40 i nowszych, natomiast SER jest obsługiwany przez tę samą generację. Starsze procesory graficzne zapewniają jedynie programową emulację funkcji OMM.

Jeśli chodzi o AMD, wsparcie obejmuje serie RX 7000, RX 900 oraz Ryzen AI 300/400, co wskazuje na kompatybilność z architekturą RDNA. Jednak pełne wsparcie dla DXR 1.2 i Shader Model 6.9 jest specyficzne dla układów GPU RDNA 4 (Radeon RX 9000).

Intel twierdzi, że jego seria Arc B (Battlemage) będzie obsługiwać wszystkie funkcje SDK. Co więcej, niektóre funkcjonalności D3D, takie jak VPblit 3DLUT, będą dostępne dla procesorów Lunar Lake.

Warto zauważyć, że podczas gdy OMM-y są przeznaczone wyłącznie dla serii RTX 40 i wyższych, SER oferuje możliwość zmiany kolejności na kartach NVIDIA RTX 40+ i Intel Arc B-Series, a nie oferuje takiej możliwości na kartach GPU serii RX 9000.

AMD Intel NVIDIA
Długi wektor Seria AMD Radeon RX 9000 Karta graficzna Intel Arc serii B Cały sprzęt RTX
16-bitowe zmiennoprzecinkowe Seria AMD Radeon RX 9000 Karta graficzna Intel Arc serii B Cały sprzęt RTX
Mikromapy krycia (OMM) Nie dotyczy Nie dotyczy Cały sprzęt RTX. Przyspieszenie sprzętowe na RTX 4xxx+, emulowane na starszych modelach.
Zmiana kolejności wykonywania shaderów (SER) Seria AMD Radeon RX 9000 obsługuje API, ale nie umożliwia zmiany kolejności. Procesory graficzne RTX 4xxx+ obsługują API i umożliwiają zmianę kolejności. Karta graficzna Intel Arc serii B. Obecny limit 64 kB zostanie zwiększony po zainstalowaniu przyszłych sterowników.
Zmienione interfejsy API tworzenia widoków zasobów AMD Radeon RX serii 7000 i 9000 Karta graficzna Intel Arc serii B Cały sprzęt RTX
Okresowe powiadomienia o przycinaniu Nie dotyczy Karta graficzna Intel Arc serii B Cały sprzęt RTX
Zwiększony limit siatki wysyłkowej AMD Radeon RX serii 7000 i 9000. Obliczenia UINT_MAX, siatka 64k. Karta graficzna Intel Arc serii B. Obecny limit 64k, planowane zwiększenie w przyszłych sterownikach. Cały sprzęt RTX. Obecny limit 64k, planowane zwiększenie w przyszłych sterownikach.
Rozwiązuje zapytanie osi czasu procesora AMD Radeon RX serii 7000 i 9000 Karta graficzna Intel Arc serii B Cały sprzęt RTX
Bariery ogrodzeniowe (zapowiedź) AMD Radeon RX serii 7000 i 9000 Karta graficzna Intel Arc serii B Aby uzyskać dostęp do sterowników będących w fazie rozwoju, skontaktuj się z działem ds.relacji z deweloperami.
VPblit 3DLUT (wersja zapoznawcza) Karty graficzne AMD Radeon serii RX 7000 i procesory Ryzen AI serii 300/400 ze zintegrowaną kartą graficzną Procesory Intel Core Ultra, platformy Lunar Lake i Panther Lake Aby uzyskać szczegółowy dostęp, skontaktuj się z działem relacji z deweloperami.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *