
Intel a officiellement annoncé son architecture graphique Xe3, qui devrait faire ses débuts dans le GPU intégré des prochains processeurs Panther Lake, avec des projets pour une variante Xe3P dans un avenir proche.
Intel dévoile l’architecture Xe3 pour l’iGPU de Panther Lake : jusqu’à 50 % d’amélioration des performances sont promis
L’architecture Xe3 d’Intel succède à l’architecture Xe2 de l’année dernière, qui a considérablement enrichi son offre produit en l’intégrant à deux nouveautés clés : les processeurs Lunar Lake « Core Ultra 200 » et les cartes graphiques dédiées Arc série B « Battlemage ».L’architecture Xe2 a capitalisé sur les enseignements tirés de son prédécesseur, le Xe1, et de la famille Arc Alchemist série A, ce qui a permis un lancement réussi sur les deux plateformes.



Les récentes améliorations logicielles ont également renforcé l’offre Intel en matière de prise en charge des pilotes, bénéficiant non seulement aux jeux, mais aussi à la création de contenu, au rendu et aux processus d’IA. La nouvelle série Arc Pro s’intègre parfaitement à l’écosystème de pilotes existant, aux côtés des GPU Battlemage.

Ces derniers mois, Intel a mis en évidence des avancées substantielles dans la technologie graphique, notamment la prochaine série Panther Lake « Core Ultra 300 », qui introduit l’architecture de pointe Xe3.
iGPU Xe3 : la nouvelle génération d’Arc série B et aperçu du Xe3P
L’architecture Xe3 s’appuie sur l’architecture Xe2 en étendant les capacités graphiques aux configurations plus importantes et en optimisant le débit. Les iGPU équipés de Xe3 seront notamment commercialisés sous la marque Arc B-Series.
Il est intéressant de noter que, si les GPU discrets Battlemage sont basés sur l’architecture Xe2, les iGPU Panther Lake adoptent l’architecture Xe3. Cet alignement reflète la décision stratégique d’Intel d’unifier sa gamme de produits, tant sur les cartes intégrées que sur les cartes discrètes.

Les développements futurs indiquent qu’une famille Arc utilisant une architecture Xe3 améliorée, baptisée Xe3P, est en préparation. Elle permettra d’obtenir de nouvelles optimisations plutôt qu’un passage direct à Xe4. Cette évolution stratégique suggère que Xe3P pourrait être utilisé à la fois dans des solutions GPU discrètes et dans des configurations iGPU améliorées pour les futurs processeurs Nova Lake.
Bien que le Xe3P ne fasse pas partie de l’actuelle série B d’Arc, au même titre que les dGPU Battlemage ou les iGPU Panther Lake, l’attente grandit pour ce qui sera probablement le prochain modèle de la famille Arc, peut-être l’Arc série C. Ces éléments étant clarifiés, examinons les spécificités de l’architecture Xe3.
Xe3 – Amélioration des performances et de l’efficacité énergétique des iGPU
L’architecture Xe3 marque une avancée significative en termes de capacités de rendu. Le précédent Xe2 comportait 4 cœurs Xe et 4 unités de ray tracing dédiées à chaque tranche de rendu.

En revanche, le Xe3 introduit un chiffre robuste de 6 cœurs Xe et 6 unités de ray tracing par tranche de rendu, soit une augmentation de 50 %.Cette amélioration permet à Intel de déployer efficacement diverses configurations de tuiles GPU dans ses SoC Panther Lake.

Les configurations disponibles incluent une matrice à 4 cœurs Xe pour les WeU 8C et 16C et une configuration à 12 cœurs Xe plus avancée destinée à la matrice 16C supérieure, promettant une évolution de la dynamique des performances par rapport à des concurrents comme Arrow Lake et Lunar Lake.

Les spécifications des deux configurations sont les suivantes :
- Configuration à 4 cœurs Xe :
- 4 cœurs Xe (architecture Xe3)
- 1 tranche de rendu
- 32 moteurs XMX
- 4 MB L2 Cache
- 1 pipeline géo
- 4 échantillonneurs
- 4 unités de lancer de rayons
- Backends 2 pixels
- Configuration du cœur 12 Xe :
- 12 cœurs Xe (architecture Xe3)
- 2 tranches de rendu
- 96 moteurs XMX
- 16 MB L2 Cache
- 2 pipelines géothermiques
- 12 échantillonneurs
- 12 unités de lancer de rayons
- Backends 4 Pixel

Malgré une diminution du cache L2 pour la configuration 4Xe, le modèle 12Xe excelle avec son cache L2 de 16 Mo, réduisant efficacement le trafic sur la structure SoC, ce qui entraîne une réduction du trafic jusqu’à 36 % pendant les scénarios de jeu.

Les mises à niveau architecturales au sein du framework Xe3 incluent des fonctionnalités de base améliorées telles que huit moteurs vectoriels 512 bits et huit moteurs XMX 2048 bits, ainsi qu’une augmentation de +33 % du cache L1/SLM partagé.

Cette architecture innovante garantit que le moteur vectoriel Xe peut désormais exploiter jusqu’à 25 % de threads supplémentaires tout en prenant en charge l’allocation de registres variables, ce qui améliore les performances, en particulier dans les tâches axées sur l’IA.

De plus, les moteurs XMX sont conçus pour l’accélération de l’IA, avec un iGPU 12Xe capable de fournir jusqu’à 120 TOP, tandis qu’un iGPU 4Xe peut atteindre environ 40 TOP.À titre de comparaison, l’ancienne architecture Xe2 produisait un maximum de 67 TOP, ce qui fait du passage à Xe3 un bond en avant notable en termes de performances.

Les opérations par cœur Xe de l’architecture Xe3 par horloge sont détaillées comme suit :
- XMX TF32 : 1 024 opérations/horloge
- XMX FP16 : 2 048 opérations/horloge
- XMX BF16 : 2 048 opérations/horloge
- XMX INT8 : 4 096 opérations/horloge
- XMX INT4 : 8 192 opérations/horloge
- XMX INT2 : 8 192 opérations/horloge

De plus, Intel a introduit une unité de ray tracing de pointe, dotée d’une gestion dynamique des rayons, conçue pour le ray tracing asynchrone. Cette unité est équipée de plusieurs pipelines de traversée, d’unités d’intersection de triangles et d’un cache BVH, améliorant ainsi les performances globales.

Le nouveau gestionnaire URB facilite les mises à jour partielles, améliorant considérablement l’efficacité de la gestion des données sur le GPU. De plus, les améliorations incluent un filtrage anisotrope jusqu’à deux fois plus rapide et des taux de test de stencil, ce qui distingue encore davantage le Xe3.
Côté multimédia, l’architecture intègre des fonctionnalités avancées telles que l’encodage/décodage AV1, le décodage VVC et la prise en charge d’eDP 1.5. Parmi les autres fonctionnalités, on compte la prise en charge d’AVC 10 bits et la compatibilité avec divers formats Sony XAVC, enrichissant ainsi les capacités de traitement multimédia du Xe3 dans Panther Lake.
Intel continue d’améliorer les performances de son GPU avec le Xe3
Intel a révélé des évaluations préliminaires des performances de ses GPU Xe3, en se concentrant sur des microbenchmarks qui évaluent les segments individuels de la microarchitecture du GPU par rapport aux itérations précédentes.

Les premiers résultats concernant les performances de blending et de backend indiquent des fluctuations minimes, l’allocation des ressources restant constante dans Xe3. Cependant, une augmentation spectaculaire de 50 % des métriques FP16 pour GEMM reflète l’avantage de scalabilité du GPU. Xe3 étant plus volumineux que Xe2, ces benchmarks exploitent pleinement ses capacités, mettant en évidence des améliorations architecturales impressionnantes, telles que des gains de taux d’anisotropie, de taux de rendu de maillage, de lectures dispersées et d’intersection de lancer de rayons, avec des augmentations allant de 2x à 2, 7x.

Des gains significatifs dans des domaines tels que les tests de profondeur et les applications à registres lourds ont enregistré des améliorations dépassant 7x par rapport à la génération précédente, illustrant le bond en avant des normes de performance.

Pour une représentation visuelle, une image rendue à l’aide de Xe3 par rapport à Xe2 dévoile les progrès réalisés en matière d’amélioration des performances.

De plus, Intel améliore sa pile logicielle graphique Windows, en introduisant des mises à jour utiles, notamment des améliorations du compilateur via le compilateur graphique Intel (IGC) et l’allocation de registres variables pour optimiser davantage les performances.

Intel introduit des capacités de planification plus rapides grâce à la préemption directe, permettant un changement de contexte rapide sans vidage. De plus, les dernières mises à jour incluent la prise en charge des vecteurs coopératifs DirectX, présentés dans la démonstration « Neural Radiance Field » d’Intel utilisant ces vecteurs.

En résumé, l’architecture Intel Xe3 représente une amélioration notable par rapport à la Xe2, qui concurrence actuellement les principaux iGPU RDNA 3.5 comme les Radeon 880M et 890M sur les ordinateurs portables grand public. Si la Xe2 n’atteint pas totalement les niveaux supérieurs, comme les implémentations RDNA 3.5 comme le Strix Halo, les collaborations entre Intel et NVIDIA sur les SoC personnalisés pourraient combler cet écart.
Laisser un commentaire