 
						英特爾已正式宣布其 Xe3 圖形架構,該架構將在即將推出的 Panther Lake 處理器的整合 GPU 中首次亮相,並計劃在不久的將來推出 Xe3P 版本。
英特爾發表 Panther Lake iGPU Xe3 架構:可望提升 50% 效能
英特爾 Xe3 架構延續了去年的 Xe2 架構,該架構透過整合兩大核心產品,顯著增強了產品線:Lunar Lake “Core Ultra 200” CPU 和 Arc B 系列 “Battlemage” 獨立顯示卡。 Xe2 架構借鑒了其前身 Xe1 和最初的 Arc Alchemist A 系列的經驗,成功地在兩個平台上發布。



軟體方面的最新改進也增強了英特爾在驅動程式支援方面的產品,不僅有利於遊戲,還有利於內容創作、渲染和 AI 流程。新發布的 Arc Pro 系列與 Battlemage GPU 一起與現有的驅動程式生態系統無縫整合。

英特爾最近幾個月在圖形技術方面取得了重大進展,即將推出的 Panther Lake「Core Ultra 300」系列就是一個亮點,它引入了尖端的 Xe3 架構。
Xe3 iGPU:下一代 Arc B 系列和 Xe3P 見解
Xe3 架構在 Xe2 的基礎上進行了擴展,以適應更大的配置,並優化了吞吐量。值得注意的是,搭載 Xe3 的 iGPU 將以 Arc B 系列為品牌。
有趣的是,Battlemage 獨立顯示卡基於 Xe2,而 Panther Lake 核顯則過渡到了 Xe3 架構。這種調整反映了英特爾的策略決策,即統一整合和獨立顯示卡的產品線。

未來的發展表明,基於升級版 Xe3 架構的 Arc 系列(名為 Xe3P)即將推出,該系列將提供進一步的優化,而不是直接升級到 Xe4。這項策略性舉措表明,Xe3P 既可用於獨立 GPU 解決方案,也可用於即將推出的 Nova Lake CPU 的增強型 iGPU 配置。
雖然 Xe3P 不會與 Battlemage dGPU 或 Panther Lake iGPU 一起成為當前 Arc B 系列的一部分,但人們對 Arc 家族的下一代產品——也許是 Arc C 系列——充滿期待。在明確了這些要素之後,讓我們深入了解 Xe3 架構的具體細節。
Xe3 – 提升 iGPU 效能與能源效率
Xe3 架構標誌著渲染能力的顯著提升。先前的 Xe2 架構配備了 4 個 Xe 核心,每個渲染切片配備 4 個光線追蹤單元。

相較之下,Xe3 在每個渲染切片中引入了 6 個 Xe 核心和 6 個光線追蹤單元,效能提升了 50%。這項增強功能使英特爾能夠在 Panther Lake SoC 中有效部署多種 GPU 模組配置。

可用的配置包括用於 8C 和 16C WeU 的 4 Xe 核心晶片,以及專用於頂級 16C 晶片的更先進的 12 Xe 核心設置,與 Arrow Lake 和 Lunar Lake 等競爭對手相比,性能動態有望有所提升。

兩種配置的規格如下:
- 4 Xe 核心配置:
- 4 個 Xe 核心(Xe3 架構)
- 1 個渲染切片
- 32 XMX 引擎
- 4 MB 二級緩存
- 1 地質管道
- 4個採樣器
- 4個光線追蹤單元
- 2 個像素後端
 
- 12 Xe 核心配置:
- 12 個 Xe 核心(Xe3 架構)
- 2 個渲染切片
- 96 XMX 引擎
- 16 MB 二級緩存
- 2條地質管道
- 12個採樣器
- 12 個光線追蹤單元
- 4 個像素後端
 

儘管 4Xe 配置的 L2 快取有所減少,但 12Xe 型號憑藉其 16MB L2 快取表現出色,有效減少了 SoC 結構上的流量,從而導致遊戲場景中的流量減少高達 36%。

Xe3 框架內的架構升級包括增強的核心功能,例如八個 512 位元向量引擎和八個 2048 位元 XMX 引擎,以及共享 L1/SLM 快取增加 +33%。

這種創新架構確保 Xe 向量引擎現在可以利用多達 25% 的線程,同時提供對變數寄存器分配的支持,從而提高效能 – 特別是在以 AI 為中心的任務中。

此外,XMX 引擎專為 AI 加速而設計,12Xe iGPU 能夠提供高達 120 TOPs 的性能,而 4Xe iGPU 則可達到約 40 TOPs。相較之下,先前的 Xe2 架構最多只能產生 67 TOPs,因此過渡到 Xe3 帶來了顯著的效能飛躍。

Xe3 架構每個 Xe 核心每個時脈的操作詳細如下:
- XMX TF32:1024 操作/時鐘
- XMX FP16:2048 操作/時鐘
- XMX BF16:2048 操作/時鐘
- XMX INT8:4096 操作/時鐘
- XMX INT4:8192 操作/時鐘
- XMX INT2:8192 操作/時鐘

此外,英特爾還推出了一款先進的光線追蹤單元,該單元具有動態光線管理功能,專為非同步光線追蹤而設計。該單元配備了多個遍歷管道、三角形相交單元和 BVH 緩存,從而提升了整體效能。

全新 URB 管理器支援局部更新,大幅提升 GPU 資料管理效率。此外,Xe3 的各項效能增強功能包括高達 2 倍的各向異性過濾和模板測試速率,進一步提升了其在 GPU 上的競爭力。
在媒體方面,此架構包含 AV1 編碼/解碼、VVC 解碼和 eDP 1.5 支援等進階功能。其他功能包括 AVC 10 位元支援以及與各種索尼 XAVC 格式的兼容性,從而豐富了 Panther Lake 中 Xe3 的多媒體處理能力。
英特爾透過 Xe3 繼續擴展並增強 GPU 效能
英特爾公佈了其 Xe3 GPU 的初步性能評估,重點關注與先前的版本相比對 GPU 微架構各個部分進行評估的微基準測試。

鑑於 Xe3 中的資源分配保持不變,混合和後端性能的初步結果表明波動很小。然而,GEMM 的 FP16 指標顯著提升了 50%,這體現了 GPU 的擴展優勢。由於 Xe3 的規模已超過 Xe2,這些基準測試充分利用了其功能,展示了令人印象深刻的架構增強,例如各向異性速率、網格渲染速率、散射讀取和光線追蹤交叉方面的改進,提升幅度從 2 倍到 2.7 倍不等。

在深度測試和寄存器密集型應用等領域取得了顯著的進步,與上一代相比,性能提高了 7 倍以上,體現了性能標準的飛躍。

從視覺上看,使用 Xe3 與 Xe2 渲染的畫面揭示了在性能增強方面的進步。

此外,英特爾正在增強其 Windows 圖形軟體堆疊,引入有用的更新,包括透過英特爾圖形編譯器 (IGC) 改進編譯器和變數暫存器分配,以進一步優化效能。

英特爾透過直接搶佔技術引入了更快的調度功能,該技術允許快速切換上下文而無需刷新。此外,最新更新還支援 DirectX 協作向量,並透過英特爾利用這些向量的「神經輻射場」演示進行了展示。

總而言之,英特爾 Xe3 架構相比 Xe2 有了顯著的改進,目前 Xe2 的競爭對手是主流筆記型電腦中搭載 RDNA 3.5 核心的 Radeon 880M 和 890M。雖然 Xe2 可能無法完全匹敵更高級別的 RDNA 3.5 核心,例如 Strix Halo,但英特爾與 NVIDIA 在定制 SoC 方面的合作或許可以彌補這一差距。
 
		   
		   
		   
		  
發佈留言