英特尔 Xe3 显卡发布:性能比 Xe2 提升 50%、升级的 RT 单元、适用于 Panther Lake“Arc B 系列”iGPU 的 12 个 Xe 核心以及即将推出的 Xe3P 继任者

英特尔 Xe3 显卡发布:性能比 Xe2 提升 50%、升级的 RT 单元、适用于 Panther Lake“Arc B 系列”iGPU 的 12 个 Xe 核心以及即将推出的 Xe3P 继任者

英特尔已正式宣布其 Xe3 图形架构,该架构将在即将推出的 Panther Lake 处理器的集成 GPU 中首次亮相,并计划在不久的将来推出 Xe3P 版本。

英特尔发布 Panther Lake iGPU Xe3 架构:有望提升 50% 性能

英特尔 Xe3 架构延续了去年的 Xe2 架构,该架构通过集成两大核心产品,显著增强了产品线:Lunar Lake “Core Ultra 200” CPU 和 Arc B 系列 “Battlemage” 独立显卡。Xe2 架构借鉴了其前身 Xe1 和最初的 Arc Alchemist A 系列的经验,成功在两个平台上发布。

我们为什么需要 XPU?带有英特尔徽标,展示设备和工作负载,包括 TECH TOUR US 下的笔记本电脑和游戏图形。英特尔 Panther Lake XPU 图形包含 GPU 和 NPU 优化细节,展示了扩展到更大配置和优化的效率。英特尔 Panther Lake NPU 概览幻灯片,标题为“扩展到更大的配置和效率优化”。

软件方面的最新改进也增强了英特尔在驱动程序支持方面的产品,不仅有利于游戏,还有利于内容创作、渲染和 AI 流程。新发布的 Arc Pro 系列与 Battlemage GPU 一起与现有的驱动程序生态系统无缝集成。

英特尔Xe3显卡官方:比Xe2快50%以上,增强RT单元,为Panther Lake提供12个Xe核心

英特尔最近几个月在图形技术方面取得了重大进展,即将推出的 Panther Lake“Core Ultra 300”系列就是一个亮点,它引入了尖端的 Xe3 架构。

Xe3 iGPU:下一代 Arc B 系列和 Xe3P 见解

Xe3 架构在 Xe2 的基础上进行了扩展,以适应更大的配置,并优化了吞吐量。值得注意的是,搭载 Xe3 的 iGPU 将以 Arc B 系列为品牌。

有趣的是,Battlemage 独立显卡基于 Xe2,而 Panther Lake 核显则过渡到了 Xe3 架构。这种调整反映了英特尔的战略决策,即统一集成和独立显卡的产品线。

英特尔Xe3显卡官方:比Xe2快50%以上,增强RT单元,为Panther Lake提供12个Xe核心

未来的发展表明,基于升级版 Xe3 架构的 Arc 系列(名为 Xe3P)即将推出,该系列将提供进一步的优化,而非直接升级到 Xe4。这一战略举措表明,Xe3P 既可以用于独立 GPU 解决方案,也可以用于即将推出的 Nova Lake CPU 的增强型 iGPU 配置。

虽然 Xe3P 不会与 Battlemage dGPU 或 Panther Lake iGPU 一起成为当前 Arc B 系列的一部分,但人们对 Arc 家族的下一代产品——也许是 Arc C 系列——充满期待。在明确了这些要素之后,让我们深入了解 Xe3 架构的具体细节。

Xe3 – 提升 iGPU 性能和能效

Xe3 架构标志着渲染能力的显著提升。之前的 Xe2 架构配备了 4 个 Xe 核心,每个渲染切片配备 4 个光线追踪单元。

英特尔Xe3显卡官方:比Xe2快50%以上,增强RT单元,为Panther Lake提供12个Xe核心

相比之下,Xe3 在每个渲染切片中引入了 6 个 Xe 核心和 6 个光线追踪单元,性能提升了 50%。这项增强功能使英特尔能够在 Panther Lake SoC 中高效部署多种 GPU 模块配置。

英特尔Xe3显卡官方:比Xe2快50%以上,增强RT单元,为Panther Lake提供12个Xe核心

可用的配置包括用于 8C 和 16C WeU 的 4 Xe 核心芯片,以及专用于顶级 16C 芯片的更先进的 12 Xe 核心设置,与 Arrow Lake 和 Lunar Lake 等竞争对手相比,性能动态有望有所提升。

英特尔Xe3显卡官方:比Xe2快50%以上,增强RT单元,为Panther Lake提供12个Xe核心

两种配置的规格如下:

  • 4 Xe 核心配置:
    • 4 个 Xe 核心(Xe3 架构)
    • 1 个渲染切片
    • 32 XMX 引擎
    • 4 MB 二级缓存
    • 1 地质管道
    • 4个采样器
    • 4个光线追踪单元
    • 2 个像素后端
  • 12 Xe 核心配置:
    • 12 个 Xe 核心(Xe3 架构)
    • 2 个渲染切片
    • 96 XMX 引擎
    • 16 MB 二级缓存
    • 2条地质管道
    • 12个采样器
    • 12 个光线追踪单元
    • 4 个像素后端
英特尔 Xe³ Panther Lake 4Xe GPU 配置图,屏幕上显示 4 个 Xe 核心和 32 个 XMX 引擎等详细信息。

尽管 4Xe 配置的 L2 缓存有所减少,但 12Xe 型号凭借其 16MB L2 缓存表现出色,有效减少了 SoC 结构上的流量,从而导致游戏场景中的流量减少高达 36%。

具有 16MB L2$ 的英特尔 SoC Fabric 的流量减少图表显示,四个基准测试的流量减少了 -17% 至 -36%。

Xe3 框架内的架构升级包括增强的核心功能,例如八个 512 位矢量引擎和八个 2048 位 XMX 引擎,以及共享 L1/SLM 缓存增加 +33%。

英特尔 Xe 3 技术概述,其中包括 Xe-core、增强型光线追踪单元和图形固定功能增强功能等部分。

这种创新架构确保 Xe 矢量引擎现在可以利用多达 25% 的线程,同时提供对变量寄存器分配的支持,从而提高性能 – 特别是在以 AI 为中心的任务中。

英特尔 Xe 矢量引擎图表具有更高的利用率和诸如线程增加高达 25% 和可变寄存器分配等功能。

此外,XMX 引擎专为 AI 加速而设计,12Xe iGPU 能够提供高达 120 TOPs 的性能,而 4Xe iGPU 则可以达到约 40 TOPs。相比之下,之前的 Xe2 架构最多只能产生 67 TOPs,因此过渡到 Xe3 带来了显著的性能飞跃。

基准测试屏幕上的英特尔 Xe3 XMX AI 加速引擎具有 Xe 矩阵扩展和高达 120 TOPS 文本。

Xe3 架构每个 Xe 核心每个时钟的操作详细如下:

  • XMX TF32:1024 操作/时钟
  • XMX FP16:2048 操作/时钟
  • XMX BF16:2048 操作/时钟
  • XMX INT8:4096 操作/时钟
  • XMX INT4:8192 操作/时钟
  • XMX INT2:8192 操作/时钟
Intel Xe^3 增强型光线追踪单元,屏幕上显示“动态光线管理”。

此外,英特尔还推出了一款先进的光线追踪单元,该单元具有动态光线管理功能,专为异步光线追踪而设计。该单元配备了多条遍历管道、三角形相交单元和 BVH 缓存,从而提升了整体性能。

Intel Xe³ GFX 固定功能特性包括全新 URB 管理器和演示幻灯片上高达 2 倍的各向异性过滤。

全新 URB 管理器支持局部更新,大幅提升 GPU 数据管理效率。此外,Xe3 的各项性能增强功能包括高达 2 倍的各向异性过滤和模板测试速率,进一步提升了其在 GPU 上的竞争力。

在媒体方面,该架构包含 AV1 编码/解码、VVC 解码和 eDP 1.5 支持等高级功能。其他功能包括 AVC 10 位支持以及与各种索尼 XAVC 格式的兼容性,从而丰富了 Panther Lake 中 Xe3 的多媒体处理能力。

英特尔通过 Xe3 继续扩展和增强 GPU 性能

英特尔公布了其 Xe3 GPU 的初步性能评估,重点关注与之前的版本相比对 GPU 微架构各个部分进行评估的微基准测试。

Intel Xe^3 Panther Lake Micro Benchmarks 图表显示了各项任务的性能提升,其中深度写入最高,为 7.4。

鉴于 Xe3 中的资源分配保持不变,混合和后端性能的初步结果表明波动很小。然而,GEMM 的 FP16 指标显著提升了 50%,这体现了 GPU 的扩展优势。由于 Xe3 的规模已超过 Xe2,这些基准测试充分利用了其功能,展示了令人印象深刻的架构增强,例如各向异性速率、网格渲染速率、散射读取和光线追踪交叉方面的改进,提升幅度从 2 倍到 2.7 倍不等。

英特尔 Xe3 Panther Lake 性能图显示了 Xe3、Xe2 Lunar Lake 和 Xe Arrow Lake H 趋势。

在深度测试和寄存器密集型应用等领域取得了显著的进步,与上一代相比,性能提高了 7 倍以上,体现了性能标准的飞跃。

Intel Xe^3 Panther Lake 性能图显示与 Lunar Lake 相比性能提升 50% 以上。” title=”Intel Xe^3 Panther Lake 性能图显示与 Lunar Lake 相比性能提升 50% 以上。” width=”728″ height=”410″ loading=”lazy” class=”wp-image” src=”https://cdn.thefilibusterblog.com/wp-content/uploads/2025/10/2025-10-09_0-26-28-728×410-1.webp”/></figure> <p>在比较实际性能指标时,Panther Lake 上的 Xe3 比 Lunar Lake iGPU 提高了 50% 以上,比 Arrow Lake-H 每瓦性能提高了 40% 以上。</p> <figure class=英特尔 Panther Lake Xe³ 性能图,比较了 Lunar Lake 和 Arrow Lake H。

从视觉上看,使用 Xe3 与 Xe2 渲染的帧揭示了性能增强方面取得的进步。

图表比较了英特尔 Panther Lake 12 Xe 核心和 Lunar Lake 8 Xe 核心在 Xe3 上的一帧性能,并附有时间细节。

此外,英特尔正在增强其 Windows 图形软件堆栈,引入有用的更新,包括通过英特尔图形编译器 (IGC) 改进编译器和变量寄存器分配,以进一步优化性能。

采用英特尔技术的 Windows GFX 软件堆栈图包括 Vulkan、XeSS 和 DirectX 集成框架、运行时和驱动程序。

英特尔通过直接抢占技术引入了更快的调度功能,该技术允许快速切换上下文而无需刷新。此外,最新更新还支持 DirectX 协作向量,并通过英特尔利用这些向量的“神经辐射场”演示进行了展示。

DirectX 功能称为“合作向量”,带有与微软合作的 XII Ultimate 和 XMX AI Engines 徽标,如技术图表所示。

总而言之,英特尔 Xe3 架构相比 Xe2 有了显著的改进,目前 Xe2 的竞争对手是主流笔记本电脑中搭载 RDNA 3.5 核心的 Radeon 880M 和 890M。虽然 Xe2 可能无法完全匹敌更高级别的 RDNA 3.5 核心,例如 Strix Halo,但英特尔与 NVIDIA 在定制 SoC 方面的合作或许可以弥补这一差距。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注