Les extensions de calcul pour l’IA (ACE) sont sur le point de révolutionner le paysage de l’intelligence artificielle en améliorant les performances de la multiplication matricielle. Intel et AMD collaborent pour harmoniser leurs stratégies autour d’une architecture x86 unifiée, afin de fournir des capacités de calcul supérieures pour les applications d’IA.
ACE : un catalyseur pour la stratégie x86 unifiée d’Intel et d’AMD à l’ère de l’IA
Afin de renforcer l’écosystème x86, Intel et AMD ont créé l’an dernier le « Groupe consultatif sur l’écosystème x86 ».Cette initiative vise à standardiser les fonctionnalités entre les différentes architectures, rendant ainsi x86 plus accessible, évolutif et adapté aux évolutions futures. Le groupe a présenté quatre fonctionnalités essentielles : FRED, AVX10, ChkTag et ACE.
La récente publication du livre blanc ACE par AMD et Intel met en lumière les avancées et le potentiel de cette nouvelle fonctionnalité conçue pour les puces x86.
Les contributions de l’EAG ont facilité la collaboration entre AMD et Intel pour affiner l’architecture du jeu d’instructions ACE (ISA).Cet effort collectif a permis de réaliser plusieurs avancées positives, intégrant les contributions des deux entreprises et tirant parti des connaissances de la vaste communauté de l’EAG. AMD et Intel souhaitent désormais harmoniser leurs efforts futurs concernant ACE et AVX10 afin de créer de nouvelles opportunités dans le domaine de l’IA et pour divers secteurs d’activité. Compte tenu de l’adoption généralisée et de la haute efficacité de l’architecture x86, l’ajout d’ACE à l’ISA renforce considérablement les capacités de l’écosystème x86.
Cet article présente les extensions de calcul pour l’IA (ACE) pour l’architecture x86, en soulignant les améliorations notables apportées aux performances de multiplication matricielle, à l’évolutivité et à l’efficacité énergétique. ACE s’intègre parfaitement à AVX10, offrant ainsi une solution d’accélération matricielle simple et largement applicable à l’environnement x86.
De nombreux réseaux neuronaux et modèles de langage complexes reposent sur la multiplication matricielle. Si les extensions SIMD existantes, comme AVX10, peuvent exécuter ces opérations, leurs limitations en termes d’évolutivité et de densité de calcul posent problème. Bien que des techniques telles que la multiplication matricielle accélérée (AMM) offrent des performances accrues, elles ne constituent pas toujours la solution la plus efficace.

L’objectif d’EAG avec ACE est d’améliorer les capacités de multiplication matricielle tout en offrant une flexibilité et une évolutivité accrues. Ce développement permet la réutilisation des optimisations AVX10 existantes, aboutissant à un framework d’accélération matricielle polyvalent, applicable aussi bien aux ordinateurs portables qu’aux environnements de calcul haute performance. Cette évolutivité réduit considérablement les contraintes pour les développeurs par rapport à l’utilisation de matériel dédié à l’IA.
Comme indiqué dans le livre blanc, AMD et Intel désignent ACE comme « l’architecture d’accélération matricielle standard pour x86 ».
Sur le plan technique, ACE prend en charge la multiplication matricielle native de divers formats de données d’IA, tels que INT8, OCP FP8, OCP MXFP8, OCP MXINT8 et BF16. De plus, ACE accélère les calculs matriciels grâce aux opérations de produit extérieur, optimisées pour AVX10. Cette approche offre une densité de calcul nettement supérieure (16 fois plus élevée) à celle d’une opération de multiplication-accumulation AVX10 standard, tout en utilisant le même nombre de vecteurs d’entrée.
Dans le prolongement du jeu d’instructions AVX10, l’intégration logicielle d’ACE est déjà en cours et couvre plusieurs domaines importants, notamment :
- Bibliothèques d’apprentissage profond et de calcul haute performance (par exemple, GEMM de précision inférieure, primitives LLM)
- Des bibliothèques Python largement utilisées comme NumPy et SciPy
- Les frameworks d’apprentissage automatique, notamment PyTorch et TensorFlow
ACE représente une avancée majeure pour l’avenir de l’architecture x86.À noter que le PDG de NVIDIA lui-même a souligné l’importance de l’alliance entre Intel et AMD pour la pérennité de cette architecture. Grâce à ce partenariat, l’écosystème x86 semble promis à un bel avenir.
Source : @G_melo_ding
Laisser un commentaire