 
						英特尔已正式宣布其 Xe3 图形架构,该架构将在即将推出的 Panther Lake 处理器的集成 GPU 中首次亮相,并计划在不久的将来推出 Xe3P 版本。
英特尔发布 Panther Lake iGPU Xe3 架构:有望提升 50% 性能
英特尔 Xe3 架构延续了去年的 Xe2 架构,该架构通过集成两大核心产品,显著增强了产品线:Lunar Lake “Core Ultra 200” CPU 和 Arc B 系列 “Battlemage” 独立显卡。Xe2 架构借鉴了其前身 Xe1 和最初的 Arc Alchemist A 系列的经验,成功在两个平台上发布。



软件方面的最新改进也增强了英特尔在驱动程序支持方面的产品,不仅有利于游戏,还有利于内容创作、渲染和 AI 流程。新发布的 Arc Pro 系列与 Battlemage GPU 一起与现有的驱动程序生态系统无缝集成。

英特尔最近几个月在图形技术方面取得了重大进展,即将推出的 Panther Lake“Core Ultra 300”系列就是一个亮点,它引入了尖端的 Xe3 架构。
Xe3 iGPU:下一代 Arc B 系列和 Xe3P 见解
Xe3 架构在 Xe2 的基础上进行了扩展,以适应更大的配置,并优化了吞吐量。值得注意的是,搭载 Xe3 的 iGPU 将以 Arc B 系列为品牌。
有趣的是,Battlemage 独立显卡基于 Xe2,而 Panther Lake 核显则过渡到了 Xe3 架构。这种调整反映了英特尔的战略决策,即统一集成和独立显卡的产品线。

未来的发展表明,基于升级版 Xe3 架构的 Arc 系列(名为 Xe3P)即将推出,该系列将提供进一步的优化,而非直接升级到 Xe4。这一战略举措表明,Xe3P 既可以用于独立 GPU 解决方案,也可以用于即将推出的 Nova Lake CPU 的增强型 iGPU 配置。
虽然 Xe3P 不会与 Battlemage dGPU 或 Panther Lake iGPU 一起成为当前 Arc B 系列的一部分,但人们对 Arc 家族的下一代产品——也许是 Arc C 系列——充满期待。在明确了这些要素之后,让我们深入了解 Xe3 架构的具体细节。
Xe3 – 提升 iGPU 性能和能效
Xe3 架构标志着渲染能力的显著提升。之前的 Xe2 架构配备了 4 个 Xe 核心,每个渲染切片配备 4 个光线追踪单元。

相比之下,Xe3 在每个渲染切片中引入了 6 个 Xe 核心和 6 个光线追踪单元,性能提升了 50%。这项增强功能使英特尔能够在 Panther Lake SoC 中高效部署多种 GPU 模块配置。

可用的配置包括用于 8C 和 16C WeU 的 4 Xe 核心芯片,以及专用于顶级 16C 芯片的更先进的 12 Xe 核心设置,与 Arrow Lake 和 Lunar Lake 等竞争对手相比,性能动态有望有所提升。

两种配置的规格如下:
- 4 Xe 核心配置:
- 4 个 Xe 核心(Xe3 架构)
- 1 个渲染切片
- 32 XMX 引擎
- 4 MB 二级缓存
- 1 地质管道
- 4个采样器
- 4个光线追踪单元
- 2 个像素后端
 
- 12 Xe 核心配置:
- 12 个 Xe 核心(Xe3 架构)
- 2 个渲染切片
- 96 XMX 引擎
- 16 MB 二级缓存
- 2条地质管道
- 12个采样器
- 12 个光线追踪单元
- 4 个像素后端
 

尽管 4Xe 配置的 L2 缓存有所减少,但 12Xe 型号凭借其 16MB L2 缓存表现出色,有效减少了 SoC 结构上的流量,从而导致游戏场景中的流量减少高达 36%。

Xe3 框架内的架构升级包括增强的核心功能,例如八个 512 位矢量引擎和八个 2048 位 XMX 引擎,以及共享 L1/SLM 缓存增加 +33%。

这种创新架构确保 Xe 矢量引擎现在可以利用多达 25% 的线程,同时提供对变量寄存器分配的支持,从而提高性能 – 特别是在以 AI 为中心的任务中。

此外,XMX 引擎专为 AI 加速而设计,12Xe iGPU 能够提供高达 120 TOPs 的性能,而 4Xe iGPU 则可以达到约 40 TOPs。相比之下,之前的 Xe2 架构最多只能产生 67 TOPs,因此过渡到 Xe3 带来了显著的性能飞跃。

Xe3 架构每个 Xe 核心每个时钟的操作详细如下:
- XMX TF32:1024 操作/时钟
- XMX FP16:2048 操作/时钟
- XMX BF16:2048 操作/时钟
- XMX INT8:4096 操作/时钟
- XMX INT4:8192 操作/时钟
- XMX INT2:8192 操作/时钟

此外,英特尔还推出了一款先进的光线追踪单元,该单元具有动态光线管理功能,专为异步光线追踪而设计。该单元配备了多条遍历管道、三角形相交单元和 BVH 缓存,从而提升了整体性能。

全新 URB 管理器支持局部更新,大幅提升 GPU 数据管理效率。此外,Xe3 的各项性能增强功能包括高达 2 倍的各向异性过滤和模板测试速率,进一步提升了其在 GPU 上的竞争力。
在媒体方面,该架构包含 AV1 编码/解码、VVC 解码和 eDP 1.5 支持等高级功能。其他功能包括 AVC 10 位支持以及与各种索尼 XAVC 格式的兼容性,从而丰富了 Panther Lake 中 Xe3 的多媒体处理能力。
英特尔通过 Xe3 继续扩展和增强 GPU 性能
英特尔公布了其 Xe3 GPU 的初步性能评估,重点关注与之前的版本相比对 GPU 微架构各个部分进行评估的微基准测试。

鉴于 Xe3 中的资源分配保持不变,混合和后端性能的初步结果表明波动很小。然而,GEMM 的 FP16 指标显著提升了 50%,这体现了 GPU 的扩展优势。由于 Xe3 的规模已超过 Xe2,这些基准测试充分利用了其功能,展示了令人印象深刻的架构增强,例如各向异性速率、网格渲染速率、散射读取和光线追踪交叉方面的改进,提升幅度从 2 倍到 2.7 倍不等。

在深度测试和寄存器密集型应用等领域取得了显著的进步,与上一代相比,性能提高了 7 倍以上,体现了性能标准的飞跃。

从视觉上看,使用 Xe3 与 Xe2 渲染的帧揭示了性能增强方面取得的进步。

此外,英特尔正在增强其 Windows 图形软件堆栈,引入有用的更新,包括通过英特尔图形编译器 (IGC) 改进编译器和变量寄存器分配,以进一步优化性能。

英特尔通过直接抢占技术引入了更快的调度功能,该技术允许快速切换上下文而无需刷新。此外,最新更新还支持 DirectX 协作向量,并通过英特尔利用这些向量的“神经辐射场”演示进行了展示。

总而言之,英特尔 Xe3 架构相比 Xe2 有了显著的改进,目前 Xe2 的竞争对手是主流笔记本电脑中搭载 RDNA 3.5 核心的 Radeon 880M 和 890M。虽然 Xe2 可能无法完全匹敌更高级别的 RDNA 3.5 核心,例如 Strix Halo,但英特尔与 NVIDIA 在定制 SoC 方面的合作或许可以弥补这一差距。
 
		   
		   
		   
		  
发表回复