Intel は、次期 Panther Lake プロセッサの統合 GPU に初搭載される予定の Xe3 グラフィックス アーキテクチャを正式に発表しました。近い将来には Xe3P バリアントも計画されています。
インテル、Panther LakeのiGPU向けXe3アーキテクチャを発表:最大50%の性能向上を約束
IntelのXe3は、昨年のXe2アーキテクチャを継承しています。Xe2アーキテクチャは、Lunar Lakeの「Core Ultra 200」CPUとArc Bシリーズの「Battlemage」ディスクリートグラフィックスカードという2つの主要リリースに統合することで、製品ラインナップを大幅に強化しました。Xe2アーキテクチャは、前身のXe1と初期のArc Alchemist Aシリーズファミリーから得られた教訓を活かし、両プラットフォームで成功を収めました。



最近のソフトウェアの強化により、Intelのドライバーサポートも強化され、ゲームだけでなく、コンテンツ制作、レンダリング、AIプロセスにもメリットをもたらしています。新たにリリースされたArc Proシリーズは、Battlemage GPUに加え、既存のドライバーエコシステムとシームレスに統合されています。

Intel はここ数か月、グラフィックス テクノロジーの大幅な進歩を披露してきましたが、そのハイライトは最先端の Xe3 アーキテクチャを導入した、近日発売予定の Panther Lake「Core Ultra 300」シリーズです。
Xe3 iGPU:次世代Arc BシリーズとXe3Pの洞察
Xe3アーキテクチャは、Xe2をベースに、より大規模な構成向けにグラフィックス機能を拡張し、スループットを最適化しています。注目すべきは、Xe3を搭載したiGPUがArc Bシリーズのブランド名で販売されることです。
興味深いことに、BattlemageのディスクリートGPUはXe2アーキテクチャをベースにしていますが、Panther LakeのiGPUはXe3アーキテクチャに移行しています。この移行は、統合型とディスクリートの両方のオプションにわたって製品スタックを統合するというIntelの戦略的決定を反映しています。

今後の開発状況から、Xe3アーキテクチャをアップグレードしたXe3Pを搭載したArcファミリーが開発中であることが示唆されています。Xe3Pは、Xe4に直接移行するのではなく、さらなる最適化を実現する予定です。この戦略的な動きは、Xe3Pが、今後のNova Lake CPUのディスクリートGPUソリューションと拡張iGPUセットアップの両方に採用される可能性を示唆しています。
Xe3Pは、Battlemage dGPUやPanther Lake iGPUと同様に、現行のArc Bシリーズには搭載されませんが、Arcファミリーの次期製品となるであろうArc Cシリーズへの期待が高まっています。これらの要素が明確になったところで、Xe3アーキテクチャの詳細を見ていきましょう。
Xe3 – iGPUパフォーマンスと電力効率の向上
Xe3アーキテクチャは、レンダリング能力の大幅な向上を実現します。前世代のXe2は、4つのXeコアと、レンダースライスごとに4つのレイトレーシングユニットを搭載していました。

対照的に、Xe3では、レンダースライスあたり6基のXeコアと6基のレイトレーシングユニットという強力な数値が導入され、50%の増加となります。この強化により、IntelはPanther Lake SoC内で多様なGPUタイル構成を効率的に展開できるようになります。

利用可能な構成には、8C および 16C WeU 用の 4 Xe コア ダイと、最上位の 16C ダイ用に割り当てられたより高度な 12 Xe コア セットアップが含まれており、Arrow Lake や Lunar Lake などの競合製品と比較してパフォーマンス ダイナミクスの進化が期待できます。

2 つの構成の仕様は次のとおりです。
- 4 Xeコア構成:
- 4 つの Xe コア (Xe3 アーキテクチャ)
- 1 レンダリングスライス
- 32基のXMXエンジン
- 4 MB L2キャッシュ
- 1 ジオパイプライン
- 4つのサンプラー
- 4つのレイトレーシングユニット
- 2つのピクセルバックエンド
- 12 Xe コア構成:
- 12 Xe コア (Xe3 アーキテクチャ)
- 2つのレンダリングスライス
- 96 XMXエンジン
- 16 MB L2キャッシュ
- 2つのジオパイプライン
- 12個のサンプラー
- 12個のレイトレーシングユニット
- 4つのピクセルバックエンド

4Xe 構成では L2 キャッシュが減少しているにもかかわらず、12Xe モデルは 16MB の L2 キャッシュを備えており、SoC ファブリック上のトラフィックを効果的に削減し、ゲーム シナリオ中にトラフィックを最大 36% 削減します。

Xe3 フレームワーク内のアーキテクチャのアップグレードには、8 つの 512 ビット ベクター エンジンや 8 つの 2048 ビット XMX エンジンなどの強化されたコア機能のほか、共有 L1/SLM キャッシュが 33% 増加しています。

この革新的なアーキテクチャにより、Xe Vector Engine は、可変レジスタ割り当てをサポートしながら最大 25% 多くのスレッドを活用できるようになり、特に AI に重点を置いたタスクでパフォーマンスが向上します。

さらに、XMXエンジンはAIアクセラレーション向けに設計されており、12Xe iGPUは最大120TOPS、4Xe iGPUは約40TOPSの性能を発揮します。ちなみに、従来のXe2アーキテクチャでは最大67TOPSの性能しか発揮できなかったため、Xe3への移行はパフォーマンスの大幅な飛躍をもたらしました。

Xe3 アーキテクチャのクロックあたりの Xe コアあたりの操作の詳細は次の通りです。
- XMX TF32: 1024 オペレーション/クロック
- XMX FP16: 2048 オペレーション/クロック
- XMX BF16: 2048 オペレーション/クロック
- XMX INT8: 4096 オペレーション/クロック
- XMX INT4: 8192 オペレーション/クロック
- XMX INT2: 8192 オペレーション/クロック

さらに、Intelは、非同期レイトレーシング向けに設計された、ダイナミックレイマネジメントを備えた最先端のレイトレーシングユニットを発表しました。このユニットは、複数のトラバーサルパイプライン、三角形交差ユニット、BVHキャッシュを備えており、全体的なパフォーマンスを向上させます。

新しいURBマネージャーは部分的な更新を容易にし、GPU上のデータ管理効率を大幅に向上させます。さらに、最大2倍の異方性フィルタリングとステンシルテストレートなどの機能強化により、Xe3はさらに際立った特徴を備えています。
メディア面では、このアーキテクチャにはAV1エンコード/デコード、VVCデコード、eDP 1.5サポートといった高度な機能が搭載されています。さらに、AVC 10ビットサポートや、Sony XAVCの各種フォーマットとの互換性も備えており、Panther LakeにおけるXe3のマルチメディア処理能力をさらに強化しています。
インテルはXe3でGPUパフォーマンスの拡張と強化を継続
Intel は、GPU マイクロアーキテクチャの個々のセグメントを以前のバージョンと比較して評価するマイクロベンチマークに重点を置いた、Xe3 GPU の予備的なパフォーマンス評価を公開しました。

Xe3ではリソース割り当てが一定であるため、ブレンドとバックエンドのパフォーマンスの初期結果は、わずかな変動を示しています。しかし、GEMMのFP16メトリックが50%という驚異的な増加を見せており、GPUのスケーリング優位性を反映しています。Xe3はXe2よりもサイズが大きくなるため、これらのベンチマークではその能力を最大限に活用し、異方性レート、メッシュレンダリングレート、分散読み取り、レイトレーシングインターセクトの改善など、2倍から2.7倍の向上といった、目覚ましいアーキテクチャ強化が示されています。

深度テストやレジスタを多用するアプリケーションなどの分野では、前世代と比較して 7 倍を超える大幅な改善が見られ、パフォーマンス基準の飛躍的な向上が示されました。

視覚的な表現としては、Xe3 と Xe2 を使用してレンダリングされたフレームを比較すると、パフォーマンスの向上が明らかになります。

さらに、Intel は Windows グラフィックス ソフトウェア スタックを強化し、Intel グラフィックス コンパイラ (IGC) によるコンパイラの改善や、パフォーマンスをさらに最適化するための可変レジスタ割り当てなどの便利なアップデートを導入しています。

Intelは、ダイレクトプリエンプションによる高速スケジューリング機能を導入しました。これにより、フラッシュなしで迅速なコンテキストスイッチが可能になります。さらに、最新のアップデートにはDirectX Cooperative Vectorsのサポートが含まれており、Intelの「Neural Radiance Field」デモではこれらのベクトルが紹介されています。

まとめると、Intel Xe3アーキテクチャは、現在主流のノートPCでRadeon 880Mや890Mといった主要なRDNA 3.5 iGPUと競合しているXe2と比べて、注目すべき改善点を示しています。Xe2は、Strix HaloのようなRDNA 3.5実装といった上位機種に完全に匹敵するものではないかもしれませんが、IntelとNVIDIAのカスタムSoCパートナーシップによる連携によって、このギャップを埋められる可能性があります。
コメントを残す