A Microsoft lança atualizações para Shader Model 6.9, DXR 1.2 e DX12 no Agility SDK 1.619, com amplo suporte da NVIDIA.

A Microsoft lança atualizações para Shader Model 6.9, DXR 1.2 e DX12 no Agility SDK 1.619, com amplo suporte da NVIDIA.

A Microsoft lançou oficialmente o Agility SDK 1.619, que introduz avanços significativos no DirectX 12, incluindo melhorias no Shader Model 6.9 e no DXR 1.2.

Principais atualizações no Microsoft Agility SDK: Shader Model 6.9, DXR 1.2 e recursos aprimorados do DX12 para GPUs NVIDIA RTX, AMD Radeon e Intel Arc.

A nova versão do SDK Agility 1.619 traz três atualizações cruciais: Shader Model 6.9, DXR 1.2 e diversas melhorias para o DX12. Abaixo, os principais destaques:

  • Modelo de Shader 6.9 (via DXC 1.9.2602.16):
    • Suporte para operações com vetores longos.
    • Introdução às instruções especiais de ponto flutuante de 16 bits.
    • Inclusão obrigatória de operações de shader de 16 bits e 64 bits e operações de onda.
    • Exposição HLSL para recursos no DXR 1.2.
  • DXR 1.2:
    • Micromapas de opacidade (lançados anteriormente, com os novos recursos do SM 6.9 agora ativados).
    • Reordenação da Execução de Shaders (SER).
  • Funcionalidades solicitadas pelos clientes do D3D:
    • APIs de criação de visualizações de recursos atualizadas.
    • Notificações periódicas de corte.
    • Limites da rede de despacho expandidos.
    • Consulta da linha do tempo da CPU resolvida.

Um dos destaques desta versão é o Shader Model 6.9, que introduz recursos essenciais, incluindo vetores longos, permitindo que o HLSL gerencie vetores com comprimentos entre 4 e 1024 elementos. Além disso, as operações de shader de 16 e 64 bits agora são requisitos padrão.

Um slide de apresentação intitulado 'DXR 1.2: Reordenação da Execução de Shaders (SER)' mostra um 'ganho de desempenho de até 2x' em cenários com traçado de raios.

As atualizações para DXR (DirectX Ray Tracing) incluem recursos importantes como Opacity Micromaps e Shader Execution Reordering. A inclusão do OMM aprimora a forma como o hardware gerencia a geometria testada em alfa, oferecendo ganhos de desempenho potencialmente notáveis ​​em comparação com os métodos tradicionais que envolvem invocações de shaders AnyHit.

Gráfico de melhoria de desempenho demonstrando o efeito dos Micromapas de Opacidade no desempenho de renderização.

A Microsoft já havia relatado aumentos de desempenho de até 2, 3 vezes em jogos com traçado de raios utilizando OMM, com demonstrações específicas da NVIDIA exibindo melhorias de mais de 60%.Por exemplo, uma demonstração mostrou uma cena rodando a 55 FPS sem OMM, enquanto habilitar esse recurso aumentou o desempenho para 90 FPS. Atualmente, o suporte completo para OMM está disponível exclusivamente para GPUs NVIDIA RTX.

Exemplo de renderização de alto desempenho utilizando Reordenação de Execução de Shader e Micromapas de Opacidade.

Um título importante que utiliza esses recursos é Alan Wake, conhecido por sua forte dependência de geometria testada em versão alfa. O jogo consegue lidar com um número impressionante de triângulos e vértices, com suas configurações de ray tracing avançadas capazes de produzir até 36, 9 milhões de raios por quadro. Notavelmente, usando SER e OMM, a RTX 4090 consegue renderizar uma cena em aproximadamente 10, 2 ms, uma redução em relação aos 16, 8 ms anteriores.

Micromapas de opacidade

Os Micromapas de Opacidade (OMMs) melhoram a eficiência do processamento de geometria com teste alfa, reduzindo a dependência de invocações dispendiosas do shader AnyHit. Esse recurso foi introduzido anteriormente e uma atualização recente expandiu sua exposição ao HLSL.

Reordenação da execução de shaders

A Reordenação da Execução de Shaders (SER) aprimora a execução de shaders, permitindo que os aplicativos organizem o código de shaders para um melhor processamento paralelo. Esse recurso saiu da fase de pré-visualização e os aplicativos podem consultar a compatibilidade do dispositivo com a reordenação.

via Microsoft

Além disso, o SDK Agility 1.619 traz melhorias essenciais para a API DirectX 12 Ultimate, corrigindo limitações anteriores nas visualizações de buffer. Esta versão permite que os desenvolvedores especifiquem visualizações de buffer usando deslocamentos e tamanhos em bytes, melhorando significativamente a usabilidade da API.

Com o avanço das arquiteturas de GPU, surgiram problemas com o modelo de criação de visualizações do D3D12, principalmente em relação aos padrões de acesso a buffers e ao gerenciamento de descritores. As novas atualizações modernizam esse aspecto da API para garantir que ela atenda às necessidades atuais.

O modelo atualizado permite a medição de visualizações de buffer em deslocamentos e tamanhos de bytes, juntamente com um tratamento de erros aprimorado, HRESULTem vez de depender exclusivamente da validação da camada de depuração.

Notificações periódicas de corte

Novas notificações de otimização em nível de kernel foram integradas ao ambiente de execução D3D12, permitindo que os aplicativos recebam alertas sobre quando otimizar a residência de memória sem a necessidade de suporte a novos drivers.

Aumento do limite de despacho 1D

Esta atualização aumenta o tamanho máximo da malha de despacho unidimensional além do limite anterior de 65535, adequando-se às capacidades do hardware contemporâneo.

  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchSize
  • D3D12_FEATURE_DATA_D3D12_OPTIONS22. Max1DDispatchMeshSize

Consulta de linha do tempo da CPU resolvida

Um novo recurso, o Query Heap, permite a resolução na linha do tempo da CPU, minimizando a sobrecarga desnecessária durante as operações da GPU. Este recurso introduz ID3D12Device15::CreateQueryHeap1eID3D12Device15::ResolveQueryData.

via Microsoft

Suporte de fornecedores de GPU para o Microsoft Agility SDK 1.619

O suporte para o SDK Agility 1.619 já está disponível nos três principais fornecedores de GPUs, embora com diferentes níveis de compatibilidade dependendo da arquitetura do produto.

Visão geral do suporte de hardware

Fornecedor Independente (IHV) Links de motorista
AMD Software AMD: Adrenalin Edition 26.2.1; Software AMD: AgilitySDK Developer Preview Edition 25.30.21.01
Intel Gráficos Intel Arc – Windows
NVIDIA Drivers oficiais da NVIDIA | NVIDIA ou através do aplicativo NVIDIA para atualizações automáticas.

A NVIDIA informa que toda a sua linha de GPUs RTX é compatível com os aprimoramentos mais recentes do SDK. Para o DXR 1.2, a aceleração de hardware do OMM se aplica à série RTX 40 e posteriores, enquanto o SER é compatível com a mesma geração. GPUs mais antigas oferecem apenas emulação de software para os recursos do OMM.

No que diz respeito à AMD, o suporte abrange as séries RX 7000, RX 900 e Ryzen AI 300/400, indicando compatibilidade com as arquiteturas RDNA. No entanto, o suporte completo aos recursos do DXR 1.2 e do Shader Model 6.9 é específico para GPUs RDNA 4 (Radeon RX 9000).

A Intel afirma que sua série Arc B (Battlemage) será compatível com todos os recursos do SDK. Além disso, certas funcionalidades do D3D, como VPblit 3DLUT, também se aplicam às CPUs Lunar Lake.

Vale ressaltar que, embora os OMMs sejam exclusivos da série RTX 40 e superiores, o SER apresenta recursos de reordenação nas placas NVIDIA RTX 40+ e Intel Arc Série B, sem nenhuma funcionalidade de reordenação disponível nas GPUs da série RX 9000.

AMD Intel NVIDIA
Vetor longo Série AMD Radeon RX 9000 Gráficos Intel Arc Série B Todo o hardware RTX
Especiais de ponto flutuante de 16 bits Série AMD Radeon RX 9000 Gráficos Intel Arc Série B Todo o hardware RTX
Micromapas de Opacidade (OMM) N / D N / D Todo o hardware RTX. Aceleração por hardware em placas RTX 4xxx e superiores, emulação em modelos mais antigos.
Reordenação da Execução de Shaders (SER) A série AMD Radeon RX 9000 suporta a API, mas não implementa a reordenação. As GPUs RTX 4xxx+ suportam a API e executam a reordenação. Placa gráfica Intel Arc Série B. Limite atual de 64k, com previsão de aumento em drivers futuros.
APIs revisadas para criação de visualizações de recursos Séries AMD Radeon RX 7000 e 9000 Gráficos Intel Arc Série B Todo o hardware RTX
Notificações periódicas de corte N / D Gráficos Intel Arc Série B Todo o hardware RTX
Aumento do limite da grade de despacho Placas de vídeo AMD Radeon RX séries 7000 e 9000. Computação UINT_MAX, malha de 64k. Placa gráfica Intel Arc Série B. Limite atual de 64k, com aumentos planejados em drivers futuros. Todo o hardware RTX. Limite atual de 64k, com aumentos planejados em drivers futuros.
Consulta de linha do tempo da CPU resolvida Séries AMD Radeon RX 7000 e 9000 Gráficos Intel Arc Série B Todo o hardware RTX
Barreiras de cerca (prévia) Séries AMD Radeon RX 7000 e 9000 Gráficos Intel Arc Série B Entre em contato com o departamento de relações com desenvolvedores para obter acesso aos drivers em desenvolvimento.
VPblit 3DLUT (prévia) Placas gráficas AMD Radeon RX série 7000 e processadores Ryzen AI série 300/400 com gráficos integrados. Processadores Intel Core Ultra, plataformas Lunar Lake e Panther Lake Para obter acesso detalhado, entre em contato com o departamento de relações com desenvolvedores.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *