
Firma Microsoft zaprezentowała znaczące udoskonalenia swojego pakietu Agility SDK wraz z wydaniem DirectX, wprowadzając niezwykłe udoskonalenia w zakresie możliwości śledzenia promieni za pośrednictwem Shader Execution Reordering (SER) i Opacity Micromaps (OMM).
Funkcje transformacyjnego śledzenia promieni zintegrowane z pakietem SDK DirectX Agility
Ostatnie aktualizacje w Microsoft Agility SDK DirectX oznaczają skok naprzód w wydajności graficznej, szczególnie w ray tracingu. Dzięki nowym funkcjom, takim jak SER i OMM, deweloperzy mogą wykorzystać te ulepszenia, aby osiągnąć niezwykłą wierność wizualną i wydajność w swoich aplikacjach. Poniżej szczegółowo opisujemy kluczowe funkcje w wersjach zapoznawczej i detalicznej Agility SDK:
Kluczowe funkcje wersji zapoznawczej Agility SDK 1.717
- Cooperative Vectors: Ta funkcja wprowadza solidne przyspieszenie sprzętowe dla obliczeń wektorowych i macierzowych. Upraszcza integrację technik renderowania neuronowego z potokami graficznymi w czasie rzeczywistym, zwiększając wydajność i efektywność.
- Shader Execution Reordering (SER): Ten innowacyjny element w śledzeniu promieni DirectX umożliwia aplikacjom optymalizację wykonywania wątków GPU. Dzięki zmniejszeniu rozbieżności wątków i ulepszeniu przetwarzania równoległego sprzęt obsługujący SER może osiągnąć nawet dwukrotnie większą wydajność w grach z śledzeniem ścieżek. Aby uzyskać szczegółowe informacje na temat SER, zobacz nasz kompleksowy wpis na blogu lub obejrzyj nagranie GDC DirectX State of the Union.
- Ulepszenia kodowania wideo Direct3D: Ta aktualizacja zawiera kilka nowych funkcji:
- Rozszerzenie listy referencyjnej HEVC dla złożonych, długoterminowych scenariuszy referencyjnych.
- Kodowanie dwuprzebiegowe, wykorzystujące niższą rozdzielczość w pierwszym przejściu.
- Uwzględnienie wskaźników szczytowego stosunku sygnału do szumu (PSNR) w statystykach wyjściowych zakodowanych ramek.
Najważniejsze informacje o pakiecie Agility SDK 1.616 Retail
- Opacity Micromaps (OMM): Potężny dodatek do DirectX Raytracing, OMM wykorzystują sprzętowo przyspieszane testy alfa w celu usprawnienia zadań śledzenia promieni. Znacznie minimalizując lub nawet eliminując wywołania shaderów AnyHit, OMM zwiększają wydajność bez uszczerbku dla jakości wizualnej. W grach z wykorzystaniem path traced może to przełożyć się na poprawę wydajności nawet o 2, 3 raza, umożliwiając sprzętowi lepsze zarządzanie złożoną przezroczystością. Aby dowiedzieć się więcej na temat OMM, zapoznaj się z naszym szczegółowym wpisem na blogu lub sprawdź nagranie GDC DirectX State of the Union.
- D3D12 Tiled Resource Tier 4: Ta aktualizacja wprowadza obsługę tablic tekstur kafelkowych z kompletnym łańcuchem mip, przezwyciężając poprzednie ograniczenia dotyczące spakowanych zasobów mip. To ulepszenie umożliwia bardziej wydajne przesyłanie strumieniowe tekstur i większą elastyczność układu. Szczegółowe specyfikacje można znaleźć w Tiled Resource Tier 4. Obsługiwane sterowniki obejmują:
- AMD: Oczekuje się, że wsparcie dla Tiled Resource Tier 4 nastąpi na początku czerwca 2025 r.
- Intel: Firma Intel udostępniła obsługę Tiled Resource Tier 4 za pośrednictwem najnowszego sterownika.
- NVIDIA: Potwierdzono pełne wsparcie dla tej wersji zestawu SDK. Aby uzyskać więcej informacji, skontaktuj się z przedstawicielem ds.kontaktów z deweloperami.
Więcej informacji można znaleźć na blogach deweloperów firmy Microsoft.
Skupiając się na mikromapach opalności D3D12 (OMM), Microsoft podkreśla, że ta funkcja umożliwia sprzętowi wydajne przetwarzanie geometrii poddanej testom alfa, znacznie zmniejszając konieczność stosowania kosztownych wywołań shaderów AnyHit.

Firma Microsoft wcześniej podkreślała wzrost wydajności do 2, 3x w tytułach z wykorzystaniem śledzenia ścieżki przy użyciu OMM. Uderzająca demonstracja firmy NVIDIA wykazała ponad 60% poprawę wydajności, a scena referencyjna osiągnęła 55 FPS w porównaniu z 90 FPS, gdy włączono OMM. Obecnie NVIDIA jest jedynym dostawcą obsługi sterowników dla OMM na procesorach graficznych RTX, a inni producenci mają pójść w jej ślady w niedalekiej przyszłości.

Co ciekawe, gra „Alan Wake” firmy Remedy jest przykładem zalet geometrii poddanej testom alfa, prezentując sceny z ponad 9, 3 milionami trójkątów, 5, 2 milionami wierzchołków ze skórą i 2, 2 tysiącami wystąpień ze skórą. Ten tytuł jest znany ze swojej intensywności wizualnej, wykorzystując śledzenie ścieżki z wysokimi ustawieniami, które wymagają generowania 10 promieni na piksel — łącznie około 36, 9 miliona promieni na klatkę. W tych wymagających warunkach RTX 4090 bez optymalizacji renderuje scenę w około 16, 8 milisekundy, ale z ulepszeniami SER i OMM może to spaść do około 10, 2 milisekundy.
Postępy zaprezentowane przez te technologie nowej generacji są obiecujące. Gdy deweloperzy przyjmują i wdrażają te innowacje w nadchodzących tytułach, gracze mogą spodziewać się najnowocześniejszych udoskonaleń, które umożliwia nowoczesny sprzęt GPU.
Dodaj komentarz