AI Compute Extensions(ACE)は、行列乗算性能を向上させることで、人工知能の分野を大きく変革する可能性を秘めています。インテルとAMDは、統一されたx86アーキテクチャの下で戦略を整合させるべく協力し、AIアプリケーション向けに優れた演算能力を提供することに注力しています。
ACE:AI時代におけるインテルとAMDの統合x86戦略の触媒
x86エコシステムの強化を目指し、インテルとAMDは昨年、「x86エコシステム諮問グループ」を設立しました。この取り組みは、異なるアーキテクチャ間で機能を標準化し、x86をより利用しやすく、拡張性が高く、将来性のあるものにすることを目的としています。同グループは、FRED、AVX10、ChkTag、ACEという4つの重要な機能を導入しました。
AMDとIntelが最近発表したACEホワイトペーパーは、x86チップ向けに設計されたこの新機能の進歩と可能性を明らかにしている。
EAGからの意見は、AMDとIntelがACE命令セットアーキテクチャ(ISA)を改良するための協業を促進しました。この共同作業は、両組織からの貢献を取り入れ、EAGの広範なコミュニティからの知見を活用することで、いくつかの肯定的な成果を生み出しました。AMDとIntelは、ACEとAVX10に関する今後の取り組みを連携させ、AIやさまざまなワークロード領域で新たな機会を切り開くことを目指しています。x86の普及率の高さと効率性を考慮すると、ISAにACEを追加することで、x86エコシステムの機能が大幅に向上します。
本稿では、x86 ISA向けAI Compute Extensions(ACE)について紹介し、行列乗算性能、スケーラビリティ、エネルギー効率における顕著な改善点を強調する。ACEはAVX10とシームレスに統合され、x86環境において、摩擦の少ない、幅広い用途に対応可能な行列高速化ソリューションを提供する。
数多くのニューラルネットワークや大規模言語モデルの中核は、行列乗算に依存しています。AVX10のような既存のSIMD拡張機能はこれらの演算を実行できますが、スケーラビリティと計算密度の限界が課題となっています。高速行列乗算などの技術はパフォーマンスを向上させますが、必ずしも最も効率的な方法とは限りません。

EAGがACEで目指すのは、行列乗算機能を強化すると同時に、柔軟性と拡張性を向上させることです。この開発により、既存のAVX10最適化を再利用できるようになり、ノートパソコンから高性能コンピューティング環境まで適用可能な汎用的な行列アクセラレーションフレームワークが実現します。このような拡張性により、専用のAIハードウェアに依存する場合と比べて、開発者の負担が最小限に抑えられます。
ホワイトペーパーに記載されているように、AMDとIntelはACEを「x86向け標準マトリックスアクセラレーションアーキテクチャ」として指定しています。
技術的な詳細について言えば、ACEはINT8、OCP FP8、OCP MXFP8、OCP MXINT8、BF16といった様々なAIデータ形式のネイティブ行列乗算をサポートするように設計されています。さらに、ACEはAVX10での使用に最適化された外積演算による行列アクセラレーションを導入しています。このアプローチにより、同じ入力ベクトル数を使用しながら、標準的なAVX10乗算累積演算と比較して、計算密度が16倍向上します。
AVX10命令セットの拡張として、ACEのソフトウェア統合は既に進行中であり、以下のようないくつかの重要な分野を網羅している。
- ディープラーニングおよびHPCライブラリ(例:低精度GEMM、LLMプリミティブ)
- NumPyやSciPyなど、広く使われているPythonベースのライブラリ
- PyTorchやTensorFlowなどの機械学習フレームワーク
ACEは、x86アーキテクチャの未来にとって極めて重要な進歩です。特に、NVIDIAのCEO自身も、x86アーキテクチャの存続においてIntelとAMDの提携が重要であることを強調しています。このパートナーシップにより、x86エコシステムは確固たる軌道に乗っていると言えるでしょう。
ニュースソース: @G_melo_ding
コメントを残す