As extensões de computação de IA (ACE) estão prestes a transformar o cenário da inteligência artificial, aprimorando o desempenho da multiplicação de matrizes. Tanto a Intel quanto a AMD estão colaborando para alinhar suas estratégias sob uma arquitetura x86 unificada, com foco em fornecer recursos computacionais superiores para aplicações de IA.
ACE: Um catalisador para a estratégia unificada x86 da Intel e da AMD na era da IA
Com o objetivo de aprimorar o ecossistema x86, a Intel e a AMD criaram o “Grupo Consultivo do Ecossistema x86” no ano passado. Essa iniciativa visa padronizar recursos em diferentes arquiteturas, tornando o x86 mais acessível, escalável e preparado para o futuro. O grupo apresentou quatro recursos fundamentais: FRED, AVX10, ChkTag e ACE.
A recente publicação do white paper ACE pela AMD e Intel esclarece os avanços e o potencial desse novo recurso projetado para chips x86.
As contribuições do EAG facilitaram a colaboração entre a AMD e a Intel para aprimorar a Arquitetura de Conjunto de Instruções (ISA) ACE. Esse esforço conjunto gerou diversos avanços positivos, incorporando contribuições de ambas as organizações e aproveitando insights da ampla comunidade do EAG. Juntas, a AMD e a Intel buscam alinhar seus esforços futuros para ACE e AVX10, a fim de desbloquear novas oportunidades em IA e em diversos domínios de cargas de trabalho. Dada a ampla adoção e a alta eficiência do x86, a adição do ACE à ISA aprimora significativamente as capacidades do ecossistema x86.
Este artigo apresenta as extensões de computação de IA para a ISA x86, destacando melhorias notáveis no desempenho da multiplicação de matrizes, escalabilidade e eficiência energética. O ACE integra-se perfeitamente com o AVX10, fornecendo uma solução de aceleração de matrizes de fácil utilização e amplamente aplicável para o ambiente x86.
O núcleo de inúmeras redes neurais e grandes modelos de linguagem reside na multiplicação de matrizes. Embora extensões SIMD existentes, como AVX10, possam executar essas operações, suas limitações em termos de escalabilidade e densidade computacional representam desafios. Apesar de técnicas como a Multiplicação Acelerada de Matrizes oferecerem desempenho aprimorado, elas geralmente não representam o caminho mais eficiente.

O objetivo do EAG com o ACE é aprimorar os recursos de multiplicação de matrizes, proporcionando maior flexibilidade e escalabilidade. Esse desenvolvimento permite a reutilização de otimizações AVX10 existentes, resultando em uma estrutura versátil de aceleração de matrizes aplicável desde laptops até ambientes de computação de alto desempenho. Essa escalabilidade minimiza o atrito para desenvolvedores em comparação com a dependência de hardware de IA dedicado.
Conforme descrito no whitepaper, a AMD e a Intel estão designando a ACE como a “Arquitetura de Aceleração de Matriz Padrão para x86”.
Em termos de especificidades técnicas, o ACE foi projetado para suportar a multiplicação nativa de matrizes em diversos formatos de dados de IA, como INT8, OCP FP8, OCP MXFP8, OCP MXINT8 e BF16. Além disso, o ACE introduz aceleração de matrizes por meio de operações de produto externo, otimizadas para uso com AVX10. Essa abordagem proporciona um aumento notável de 16 vezes na densidade de computação em comparação com uma operação padrão de multiplicação e acumulação AVX10, utilizando a mesma quantidade de vetores de entrada.
Como uma extensão do conjunto de instruções AVX10, a integração de software da ACE já está em andamento, abrangendo diversas áreas importantes, incluindo:
- Bibliotecas de Aprendizado Profundo e HPC (por exemplo, GEMMs de menor precisão, primitivas LLM)
- Bibliotecas amplamente utilizadas baseadas em Python, como NumPy e SciPy
- Frameworks de aprendizado de máquina, incluindo PyTorch e TensorFlow.
O ACE representa um avanço crucial para o futuro da arquitetura x86. Notavelmente, até mesmo o CEO da NVIDIA enfatizou a importância da aliança entre Intel e AMD para manter a relevância da arquitetura x86. Com essa parceria, o ecossistema x86 parece estar em uma trajetória sólida.
Fonte da notícia: @G_melo_ding
Deixe um comentário