英特尔推出集成 GPU 的高保真视觉效果和增强性能:演示 Arc B580 上用于路径追踪的光线重建降噪器

英特尔推出集成 GPU 的高保真视觉效果和增强性能:演示 Arc B580 上用于路径追踪的光线重建降噪器

在 SIGGRAPH & HPG 2025 上,英特尔展示了集成和独立 GPU 在视觉保真度和性能增强方面的重大进步。

提升视觉质量:英特尔对集成 GPU 的战略重点

集成图形处理器 (iGPU) 的格局发生了翻天覆地的变化。十年前,iGPU 主要用于媒体播放,游戏体验大多不尽如人意。然而,近年来的技术进步已使许多集成解决方案的性能接近入门级独立 GPU 的水平。英特尔如今致力于进一步提升这些设备的视觉质量和性能。

为了实现未来几代 iGPU 及其独立显卡的这些目标,英特尔的战略举措包括:

  • 提高路径追踪效率
  • 探索神经图形技术
  • 引入创新的基于物理的效果,例如荧光

主要目标是提供高保真视觉效果,尤其是路径追踪,并针对利用 iGPU 的节能设备进行了优化。路径追踪因其在模拟中大量使用光子路径而以其计算需求而闻名,需要降噪才能生成清晰的图像。英特尔的方法涉及重采样重要性采样,可将视觉质量显著提升高达十倍。

以下创新有助于提高质量:

这项最新研究已被 SIGGRAPH 2025 大会录用,它通过改进重采样重要性采样技术,推进了实时路径追踪。该技术将样本组织成局部直方图,并利用具有对立模式的准蒙特卡洛采样有效地降低噪声。与蓝噪声结合使用时,该方法可显著增强视觉效果,使结果提升高达十倍。

这一进步建立在《赛博朋克 2077》等知名 AAA 游戏所采用的领先技术之上,弥合了高端游戏体验与低功耗硬件之间的差距。

尽管面临重重障碍,但技术的进步是显而易见的——从最初对简单场景的实验,到具有动态植被和灯光过渡等复杂元素的复杂动画丛林废墟场景,以每像素 1 个样本 (1 SPP) 进行完整路径追踪,在英特尔 B580 GPU 上以 1440p 实现稳定的每秒 30 帧。

通过英特尔

除了这些进展之外,英特尔还发布了第二版 Open Image Denoise,这是一款面向更广泛用户的 AI 加速光线追踪工具。该开源库的第一个版本在业界广受好评,此次更新承诺增强跨供应商支持,提高与所有主流 GPU 的兼容性,包括英特尔、NVIDIA 和 AMD 的 GPU。

英特尔正在积极开发降噪器的下一版本,该版本将集成神经网络架构,以进一步增强视觉效果并提升性能。最近的一次演示重点展示了英特尔 Arc B580 GPU 上以 1440p 分辨率进行的“万亿三角形路径追踪”,并实现了稳定的 30 FPS 帧率。

性能和图像质量与路径追踪每个阶段处理的光线数量直接相关。

为了最大限度地降低计算需求和内存占用,我们采用 1 个 SPP 和单条光线进行每次反射。然而,由于路径追踪固有的可变性,生成的图像可能会出现明显的噪点。每个像素的渲染基于一条随机光路,这会导致亮度和颜色出现显著波动,尤其是在间接照明和反射等复杂光照条件下。我们的解决方案涉及使用时空联合神经去噪和过采样模型来清除噪点并增强细节。

通过英特尔

此次令人印象深刻的演示的主要亮点包括:

  • 降低路径追踪的计算成本以实现实时性能是一项突出的挑战,也是当前业界和学术界研究的重点。在我们的系列博客文章中,我们分享了关于实时路径追踪的见解,该场景包含一万亿个三角形的丛林废墟动画,该场景使用英特尔 Arc B580 GPU 成功实现了 1440p 分辨率下 30 FPS 的帧率。
  • 本博客系列强调 1 SPP 去噪和超采样的实际应用,包括视觉质量评估指标、管理具有一万亿个实例三角形的高复杂度场景中的动画,以及内容创建和性能优化所涉及的权衡。

值得注意的是,英特尔旨在使用时空联合神经去噪和超采样模型来增强细节重建和降噪效果。这种方法与NVIDIA在DLSS 3.5中的光线重建技术以及AMD即将在其FSR Redstone技术中推出的光线再生功能相似。

  • 精细纹理细节:降噪器通常通过旨在降低噪声的优化来产生更平滑的结果。然而,这可能会丢失精细细节,尤其是在区分高频噪声和实际信号变得困难时。
  • 闪烁:虽然降噪后的单个帧看起来很清晰,但帧与帧之间的细微变化可能会导致随着时间的推移出现明显的闪烁,尤其是在光照或场景动态变化的情况下。平衡的时间损失可以稳定输出,但过度使用可能会导致重影伪影。
  • 莫尔条纹:莫尔条纹源于高频细节的欠采样,会在场景细节和像素网格之间造成视觉干扰。使用针对此类图案的多样化样本训练模型可以提升去噪性能。
  • 阴影重建:在没有运动矢量的情况下,准确重建阴影仍然很复杂。使用展现不同光照条件的样本进行训练,可以提高模型的阴影再现效果。
  • 遮挡消除:挑战出现在先前被遮挡但因运动而可见的区域。由于模式不一致,模型难以重建这些区域,有时会导致重影伪影。使用代表性样本丰富训练数据有助于解决此问题。
  • 反射:与阴影类似,反射重建依赖于噪声颜色输入。将第一个非镜面反射点合并到辅助缓冲区中可以显著提升反射质量,尤其对于反射表面而言。

通过英特尔

为了进一步增强低功耗 GPU 的高性能视觉保真度,英特尔推出了硬件加速纹理集神经压​​缩 (TSNC),并与 DirectX 协同矢量兼容。这项技术最大限度地发挥了当代芯片中 AI 驱动硬件功能的潜力,与使用 FMA(融合乘加)的传统计算型实现相比,性能提升高达 47 倍。以下是一些值得关注的性能指标:

  • 英特尔 Arc 140V (Lunar Lake):2.6 毫秒(BC6 基线)/ 2.1 毫秒(带协同向量的 TSNC)
  • 英特尔 Arc B580(Battlemage):0.55 毫秒(BC6 基线)/ 0.55 毫秒(带协作向量的 TSNC)

英特尔的 TSNC 表现出与传统 BC6 压缩相当或更优的性能水平,同时利用更小的纹理内存占用,从而优化资源使用并提高整体性能。

英特尔近期的演示和出版物分享的洞见凸显了公司的发展轨迹。英特尔正在从过去的形象中蜕变,展现出一家蓄势待发、在 GPU 领域不断创新的公司。凭借 Xe2 等架构,英特尔似乎已在入门级独立 GPU 市场和集成 GPU 解决方案中占据着举足轻重的地位。这些充满希望的进步可能会彻底改变 iGPU 领域,人们对其即将推出的实施方案充满期待,这也体现了英特尔对开源开发的承诺。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注