
Microsoft는 DirectX 출시와 함께 Agility SDK에 대한 상당한 개선 사항을 공개했으며, 셰이더 실행 재정렬(SER) 및 불투명도 마이크로맵(OMM)을 통해 레이 트레이싱 기능이 획기적으로 향상되었습니다.
DirectX Agility SDK에 통합된 혁신적인 레이 트레이싱 기능
Microsoft Agility SDK DirectX의 최근 업데이트는 그래픽 성능, 특히 레이 트레이싱의 비약적인 발전을 의미합니다. SER 및 OMM과 같은 새로운 기능을 통해 개발자는 이러한 개선 사항을 활용하여 애플리케이션에서 놀라운 시각적 충실도와 효율성을 달성할 수 있습니다.아래에서 Agility SDK의 미리보기 버전과 정식 버전 모두의 주요 기능을 자세히 살펴보겠습니다.
Agility SDK 1.717 Preview의 주요 기능
- 협력 벡터: 이 기능은 벡터 및 행렬 계산을 위한 강력한 하드웨어 가속 기능을 제공합니다.신경망 렌더링 기술을 실시간 그래픽 파이프라인에 통합하는 과정을 간소화하여 성능과 효율성을 향상시킵니다.
- 셰이더 실행 재정렬(SER): DirectX 레이 트레이싱의 이 혁신적인 요소는 애플리케이션이 GPU 스레드 실행을 최적화할 수 있도록 합니다.스레드 분산을 줄이고 병렬 처리를 향상시킴으로써 SER을 지원하는 하드웨어는 경로 추적 게임에서 최대 두 배의 성능을 달성할 수 있습니다. SER에 대한 자세한 내용은 당사의 블로그 게시물을 참조하거나 GDC DirectX State of the Union 녹화 영상을 시청하십시오.
- Direct3D 비디오 인코딩 개선 사항: 이 업데이트에는 여러 가지 새로운 기능이 포함되어 있습니다.
- 복잡한 장기 참조 시나리오를 위한 HEVC 참조 목록 확장.
- 2단계 인코딩은 초기 단계에 더 낮은 해상도를 적용합니다.
- 인코딩된 프레임 출력 통계에 피크 신호 대 잡음비(PSNR) 메트릭을 포함합니다.
Agility SDK 1.616 Retail의 주요 특징
- 불투명도 마이크로맵(OMM): DirectX 레이트레이싱에 강력한 기능을 제공하는 OMM은 하드웨어 가속 알파 테스트를 활용하여 레이트레이싱 작업을 간소화합니다. AnyHit 셰이더 호출을 크게 최소화하거나 아예 없애는 OMM은 시각적 품질 저하 없이 효율성을 향상시킵니다.경로 추적 게임에서는 최대 2.3배의 성능 향상을 통해 하드웨어가 복잡한 투명도를 더 효과적으로 관리할 수 있도록 지원합니다. OMM에 대한 자세한 내용은 자세한 블로그 게시물을 참조하거나 GDC DirectX State of the Union 녹화 영상을 확인하세요.
- D3D12 타일드 리소스 티어 4: 이 업데이트는 완전한 밉 체인을 갖춘 타일드 텍스처 배열을 지원하여 기존 패킹된 밉 리소스의 제약을 극복합니다.이러한 향상된 기능을 통해 더욱 효율적인 텍스처 스트리밍과 향상된 레이아웃 유연성을 제공합니다.자세한 사양은 타일드 리소스 티어 4 에서 확인할 수 있습니다.지원되는 드라이버는 다음과 같습니다.
- AMD: Tiled Resource Tier 4에 대한 지원은 2025년 6월 초로 예정되어 있습니다.
- Intel: Intel은 최신 드라이버 를 통해 Tiled Resource Tier 4에 대한 지원을 제공했습니다.
- NVIDIA: 이 SDK 릴리스에 대한 전체 지원이 확인되었습니다.자세한 내용은 개발자 관계 담당자에게 문의하세요.
자세한 내용은 Microsoft Dev Blogs를 방문하세요.
Microsoft는 D3D12 OMM(불투명도 마이크로맵)에 초점을 맞춰 이 기능을 통해 하드웨어가 알파 테스트된 지오메트리를 효율적으로 처리하고 비용이 많이 드는 AnyHit 셰이더 호출에 대한 의존도를 크게 줄일 수 있다고 강조했습니다.

Microsoft는 이전에 OMM을 활용한 패스 트레이싱 타이틀의 성능 향상을 최대 2.3배까지 강조한 바 있습니다. NVIDIA의 놀라운 시연은 60% 이상의 성능 향상을 보여주었으며, 참조 장면에서는 OMM을 활성화했을 때 90FPS였던 반면, 55FPS를 달성했습니다.현재 RTX GPU에서 OMM 드라이버 지원을 제공하는 유일한 업체는 NVIDIA이며, 다른 제조업체들도 조만간 이를 따를 것으로 예상됩니다.

특히, 레메디(Remedy)의 게임 “앨런 웨이크(Alan Wake)”는 알파 테스트된 지오메트리의 장점을 잘 보여주는데, 930만 개 이상의 삼각형, 520만 개의 스키닝된 정점, 그리고 2200개의 스키닝된 인스턴스로 구성된 장면들을 보여줍니다.이 게임은 높은 설정의 패스 트레이싱을 사용하여 픽셀당 10개의 광선(프레임당 총 약 3, 690만 개의 광선)을 생성하는 시각적 강도로 유명합니다.이러한 까다로운 조건에서 최적화되지 않은 RTX 4090은 약 16.8밀리초 만에 장면을 렌더링하지만, SER 및 OMM의 향상된 기능을 사용하면 이 시간이 약 10.2밀리초로 단축될 수 있습니다.
차세대 기술을 통해 구현되는 발전은 매우 고무적입니다.개발자들이 이러한 혁신을 수용하고 향후 출시될 게임에 적용함에 따라, 게이머들은 최신 GPU 하드웨어가 제공하는 최첨단 성능 향상을 경험할 수 있을 것입니다.
답글 남기기 ▼