Le AI Compute Extensions (ACE) sono destinate a trasformare il panorama dell’intelligenza artificiale migliorando le prestazioni della moltiplicazione di matrici. Intel e AMD stanno collaborando per allineare le proprie strategie sotto un’architettura x86 unificata, concentrandosi sulla fornitura di capacità di calcolo superiori per le applicazioni di intelligenza artificiale.
ACE: Un catalizzatore per la strategia unificata x86 di Intel e AMD nell’era dell’intelligenza artificiale
Nel tentativo di potenziare l’ecosistema x86, Intel e AMD hanno istituito lo scorso anno l'”x86 Ecosystem Advisory Group”.Questa iniziativa mira a standardizzare le funzionalità tra le diverse architetture, rendendo x86 più accessibile, scalabile e pronto per il futuro. Il gruppo ha introdotto quattro funzionalità chiave: FRED, AVX10, ChkTag e ACE.
La recente pubblicazione del white paper ACE da parte di AMD e Intel fa luce sui progressi e sulle potenzialità di questa nuova funzionalità progettata per i chip x86.
Il contributo dell’EAG ha facilitato la collaborazione tra AMD e Intel per perfezionare l’architettura del set di istruzioni ACE (ISA).Questo sforzo congiunto ha portato a diversi sviluppi positivi, integrando i contributi di entrambe le organizzazioni e sfruttando le conoscenze della vasta community dell’EAG. Insieme, AMD e Intel puntano ad allineare i loro futuri progetti per ACE e AVX10 al fine di sbloccare nuove opportunità nell’ambito dell’intelligenza artificiale e in diversi domini di carico di lavoro. Data l’ampia diffusione e l’elevata efficienza dell’architettura x86, l’aggiunta di ACE all’ISA migliora significativamente le capacità dell’ecosistema x86.
Questo documento presenta le estensioni AI Compute Extensions per l’architettura x86, evidenziando i notevoli miglioramenti in termini di prestazioni, scalabilità ed efficienza energetica nella moltiplicazione di matrici. ACE si integra perfettamente con AVX10, fornendo una soluzione di accelerazione di matrici semplice e ampiamente applicabile per l’architettura x86.
Il cuore di numerose reti neurali e di grandi modelli linguistici si basa sulla moltiplicazione di matrici. Sebbene le estensioni SIMD esistenti, come AVX10, siano in grado di eseguire queste operazioni, i loro limiti in termini di scalabilità e densità computazionale rappresentano una sfida. Anche se tecniche come la moltiplicazione di matrici accelerata offrono prestazioni migliori, spesso non rappresentano la soluzione più efficiente.

L’obiettivo dell’EAG con ACE è quello di migliorare le capacità di moltiplicazione di matrici, offrendo al contempo maggiore flessibilità e scalabilità. Questo sviluppo consente il riutilizzo delle ottimizzazioni AVX10 esistenti, dando vita a un framework versatile per l’accelerazione di matrici, applicabile dai laptop agli ambienti di calcolo ad alte prestazioni. Tale scalabilità riduce al minimo le difficoltà per gli sviluppatori rispetto all’utilizzo di hardware dedicato all’IA.
Come indicato nel white paper, AMD e Intel hanno designato ACE come “Architettura standard di accelerazione della matrice per x86”.
In termini di specifiche tecniche, ACE è progettato per supportare la moltiplicazione nativa di matrici di vari formati di dati AI, come INT8, OCP FP8, OCP MXFP8, OCP MXINT8 e BF16. Inoltre, ACE introduce l’accelerazione di matrici tramite operazioni di prodotto esterno, ottimizzate per l’uso con AVX10. Questo approccio offre un notevole miglioramento di 16 volte nella densità di calcolo rispetto a una normale operazione di moltiplicazione-accumulazione AVX10, pur utilizzando la stessa quantità di vettori di input.
Come estensione del set di istruzioni AVX10, l’integrazione software di ACE è già in corso e comprende diverse aree importanti, tra cui:
- Librerie per il Deep Learning e l’HPC (ad esempio, GEMM a bassa precisione, primitive LLM)
- Librerie basate su Python ampiamente utilizzate come NumPy e SciPy
- Framework di apprendimento automatico, tra cui PyTorch e TensorFlow
ACE rappresenta un passo avanti fondamentale per il futuro dell’architettura x86. In particolare, anche il CEO di NVIDIA ha sottolineato l’importanza dell’alleanza tra Intel e AMD per mantenere la rilevanza dell’architettura x86. Grazie a questa partnership, l’ecosistema x86 sembra essere su una solida traiettoria.
Fonte della notizia: @G_melo_ding
Lascia un commento