
A Intel anunciou oficialmente sua arquitetura gráfica Xe3, que será lançada na GPU integrada dos próximos processadores Panther Lake, com planos para uma variante Xe3P em um futuro próximo.
Intel revela arquitetura Xe3 para iGPU da Panther Lake: prometendo aumento de desempenho de até 50%
O Xe3 da Intel sucede a arquitetura Xe2 do ano passado, que aprimorou significativamente sua oferta de produtos ao se integrar a dois lançamentos importantes: as CPUs Lunar Lake “Core Ultra 200” e as placas de vídeo dedicadas Arc Série B “Battlemage”.A arquitetura Xe2 capitalizou as lições aprendidas com seu antecessor, o Xe1, e com a família inicial Arc Alchemist Série A, resultando em um lançamento bem-sucedido em ambas as plataformas.



Aprimoramentos recentes em software também reforçaram as ofertas da Intel em suporte a drivers, beneficiando não apenas os jogos, mas também a criação de conteúdo, renderização e processos de IA. A recém-lançada série Arc Pro integrou-se perfeitamente ao ecossistema de drivers existente, juntamente com as GPUs Battlemage.

Os últimos meses da Intel mostraram avanços substanciais em tecnologia gráfica, destacados pela próxima série Panther Lake “Core Ultra 300”, que apresenta a arquitetura de ponta Xe3.
Xe3 iGPUs: a próxima geração da série Arc B e insights sobre o Xe3P
A arquitetura Xe3 se baseia na Xe2, expandindo os recursos gráficos para configurações maiores e otimizando a taxa de transferência. Notavelmente, as iGPUs equipadas com a Xe3 serão denominadas Arc B-Series.
Curiosamente, enquanto as GPUs dedicadas Battlemage são baseadas na arquitetura Xe2, as iGPUs Panther Lake migram para a arquitetura Xe3. Esse alinhamento reflete a decisão estratégica da Intel de unificar sua linha de produtos entre opções integradas e dedicadas.

Desenvolvimentos futuros indicam que uma família Arc usando uma arquitetura Xe3 atualizada, chamada Xe3P, está em desenvolvimento, pronta para oferecer mais otimizações em vez de migrar diretamente para o Xe4. Essa mudança estratégica sugere que o Xe3P pode ser empregado tanto em soluções de GPU discretas quanto em configurações aprimoradas de iGPU para as futuras CPUs Nova Lake.
Embora o Xe3P não faça parte da atual Série B do Arc, juntamente com as dGPUs Battlemage ou as iGPUs Panther Lake, a expectativa aumenta em relação ao que provavelmente será o próximo da família Arc — talvez o Arc Série C. Com esses elementos esclarecidos, vamos nos aprofundar nos detalhes da arquitetura do Xe3.
Xe3 – Elevando o desempenho e a eficiência energética da iGPU
A arquitetura Xe3 marca um avanço significativo nas capacidades de renderização. A Xe2 anterior contava com 4 núcleos Xe e 4 unidades de ray tracing dedicadas por fatia de renderização.

Em contraste, o Xe3 apresenta um número robusto de 6 núcleos Xe e 6 unidades de ray tracing por fatia de renderização, o que representa um aumento de 50%.Essa melhoria permite que a Intel implante com eficiência diversas configurações de blocos de GPU em seus SoCs Panther Lake.

As configurações disponíveis incluem uma matriz de 4 núcleos Xe para WeUs 8C e 16C e uma configuração mais avançada de 12 núcleos Xe destinada à matriz 16C superior, prometendo uma evolução na dinâmica de desempenho em comparação com concorrentes como Arrow Lake e Lunar Lake.

As especificações para as duas configurações são as seguintes:
- Configuração do núcleo 4 Xe:
- 4 núcleos Xe (arquitetura Xe3)
- 1 fatia de renderização
- 32 motores XMX
- Cache L2 de 4 MB
- 1 Geo Pipeline
- 4 Amostradores
- 4 unidades de traçado de raios
- 2 backends de pixel
- Configuração do núcleo 12 Xe:
- 12 núcleos Xe (arquitetura Xe3)
- 2 fatias de renderização
- 96 motores XMX
- Cache L2 de 16 MB
- 2 Geo Pipelines
- 12 Amostradores
- 12 unidades de traçado de raios
- 4 backends de pixel

Apesar de representar uma redução no cache L2 para a configuração 4Xe, o modelo 12Xe se destaca com seu cache L2 de 16 MB, reduzindo efetivamente o tráfego na malha SoC, resultando em uma redução de até 36% no tráfego durante cenários de jogos.

As atualizações arquitetônicas dentro da estrutura Xe3 incluem recursos principais aprimorados, como oito mecanismos vetoriais de 512 bits e oito mecanismos XMX de 2048 bits, além de um aumento de +33% no cache L1/SLM compartilhado.

Essa arquitetura inovadora garante que o Xe Vector Engine agora possa aproveitar até 25% mais threads, ao mesmo tempo em que fornece suporte para alocação de registros variáveis, o que melhora o desempenho, especialmente em tarefas focadas em IA.

Além disso, os motores XMX são projetados para aceleração por IA, com uma iGPU 12Xe capaz de fornecer até 120 TOPs, enquanto uma iGPU 4Xe pode atingir cerca de 40 TOPs. Para contextualizar, a arquitetura Xe2 anterior produzia um máximo de 67 TOPs, tornando a transição para a Xe3 um salto notável em desempenho.

As operações por Xe-core da arquitetura Xe3 por clock são detalhadas como:
- XMX TF32: 1024 operações/clique
- XMX FP16: 2048 operações/clique
- XMX BF16: 2048 operações/clique
- XMX INT8: 4096 operações/clique
- XMX INT4: 8192 operações/clique
- XMX INT2: 8192 operações/clique

Além disso, a Intel lançou uma unidade de ray tracing de última geração com gerenciamento dinâmico de raios, projetada para ray tracing assíncrono. Esta unidade é equipada com múltiplos pipelines de travessia, unidades de interseção triangular e um cache BVH, aprimorando o desempenho geral.

O novo gerenciador URB facilita atualizações parciais, melhorando significativamente a eficiência do gerenciamento de dados na GPU. Além disso, as melhorias incluem filtragem anisotrópica de até 2x e taxas de teste de estêncil, diferenciando ainda mais a Xe3.
Em termos de mídia, a arquitetura inclui recursos avançados como codificação/decodificação AV1, decodificação VVC e suporte a eDP 1.5. Funções adicionais incluem suporte a AVC de 10 bits e compatibilidade com vários formatos XAVC da Sony, enriquecendo os recursos de processamento multimídia do Xe3 no Panther Lake.
A Intel continua a escalar e aprimorar o desempenho da GPU com o Xe3
A Intel revelou avaliações preliminares de desempenho para suas GPUs Xe3, com foco em microbenchmarks que avaliam segmentos individuais da microarquitetura da GPU em comparação com iterações anteriores.

Os resultados iniciais para o desempenho de blend e backend indicam flutuações mínimas, visto que as alocações de recursos permanecem constantes no Xe3. No entanto, um aumento impressionante de 50% nas métricas FP16 para GEMM reflete a vantagem de escalabilidade da GPU. Com o Xe3 superando o Xe2 em tamanho, esses benchmarks utilizam plenamente seus recursos, apresentando melhorias arquitetônicas impressionantes, como melhorias na taxa anisotrópica, taxa de renderização de malha, leituras dispersas e interseção de traçado de raios, que variam de 2x a 2, 7x.

Ganhos significativos em áreas como testes de profundidade e aplicações com uso intenso de registros apresentaram melhorias superiores a 7x em comparação à geração anterior, ilustrando o salto nos padrões de desempenho.

Para uma representação visual, um quadro renderizado usando Xe3 versus Xe2 revela os avanços feitos em relação às melhorias de desempenho.

Além disso, a Intel está aprimorando seu Windows Graphics Software Stack, introduzindo atualizações úteis, incluindo melhorias no compilador por meio do Intel Graphics Compiler (IGC) e alocação de registro variável para otimizar ainda mais o desempenho.

A Intel está introduzindo recursos de agendamento mais rápidos por meio de preempção direta, que permite troca rápida de contexto sem necessidade de descarga. Além disso, as atualizações mais recentes incluem suporte para Vetores Cooperativos DirectX, demonstrados na demonstração “Neural Radiance Field” da Intel, que utiliza esses vetores.

Em resumo, a arquitetura Intel Xe3 representa uma melhoria notável em relação à Xe2, que atualmente compete com as principais iGPUs RDNA 3.5, como a Radeon 880M e a 890M, em laptops convencionais. Embora a Xe2 possa não corresponder completamente aos níveis mais altos, como as implementações RDNA 3.5, como o Strix Halo, as colaborações entre a Intel e as parcerias de SoCs personalizados da NVIDIA podem preencher essa lacuna.
Deixe um comentário