英特爾推出整合 GPU 的高保真視覺效果和增強性能：演示 Arc B580 上用於路徑追蹤的光線重建降噪器

在 SIGGRAPH & HPG 2025 上，英特爾展示了整合和獨立 GPU 在視覺保真度和效能增強方面的重大進步。

提升視覺品質：英特爾對整合 GPU 的策略重點

整合式圖形處理器 (iGPU) 的格局發生了翻天覆地的變化。十年前，iGPU 主要用於媒體播放，遊戲體驗大多不盡人意。然而，近年來的技術進步已使許多整合解決方案的效能接近入門級獨立 GPU 的水平。英特爾如今致力於進一步提升這些設備的視覺品質和性能。

為了實現未來幾代 iGPU 及其獨立顯示卡的這些目標，英特爾的策略舉措包括：

提高路徑追蹤效率
探索神經圖形技術
引入創新的基於物理的效果，例如螢光

主要目標是提供高保真視覺效果，尤其是路徑追踪，並針對利用 iGPU 的節能設備進行了最佳化。路徑追蹤因其在模擬中大量使用光子路徑而以其運算需求而聞名，需要降噪才能產生清晰的影像。英特爾的方法涉及重採樣重要性取樣，可將視覺品質顯著提升高達十倍。

以下創新有助於提升品質：

這項最新研究已被 SIGGRAPH 2025 大會錄用，它透過改進重採樣重要性採樣技術，推進了即時路徑追蹤。該技術將樣本組織成局部直方圖，並利用具有對立模式的準蒙特卡洛採樣有效地降低雜訊。與藍噪音結合使用時，此方法可顯著增強視覺效果，使結果提升高達十倍。

這項進步建立在《Cyberpunk 2077》等知名 AAA 遊戲所採用的領先技術之上，彌合了高階遊戲體驗與低功耗硬體之間的差距。

儘管面臨重重障礙，但技術的進步是顯而易見的——從最初對簡單場景的實驗，到具有動態植被和燈光過渡等複雜元素的複雜動畫叢林廢墟場景，以每像素 1 個樣本 (1 SPP) 進行完整路徑追踪，在英特爾 B580 GPU 上以 1440p 實現穩定的每秒 30 幀。

透過英特爾

除了這些進展之外，英特爾還發布了第二版 Open Image Denoise，這是一款針對更廣泛用戶的 AI 加速光線追蹤工具。該開源庫的第一個版本在業界廣受好評，此次更新承諾增強跨供應商支持，提高與所有主流 GPU 的兼容性，包括英特爾、NVIDIA 和 AMD 的 GPU。

英特爾正在積極開發降噪器的下一個版本，該版本將整合神經網路架構，以進一步增強視覺效果並提升效能。最近的一次演示重點展示了英特爾 Arc B580 GPU 上以 1440p 分辨率進行的“萬億三角形路徑追踪”，並實現了穩定的 30 FPS 幀率。

性能和影像品質與路徑追蹤每個階段處理的光線數量直接相關。

為了最大限度地降低運算需求和記憶體佔用，我們採用 1 個 SPP 和單一光線進行每次反射。然而，由於路徑追蹤固有的可變性，產生的影像可能會出現明顯的雜訊。每個像素的渲染基於一條隨機光路，這會導致亮度和顏色顯著波動，尤其是在間接照明和反射等複雜光照條件下。我們的解決方案涉及使用時空聯合神經去噪和過採樣模型來清除雜訊並增強細節。

透過英特爾

此次令人印象深刻的演示的主要亮點包括：

降低路徑追蹤的運算成本以實現即時效能是一項突出的挑戰，也是當前業界和學術界研究的重點。在我們的系列部落格文章中，我們分享了關於即時路徑追蹤的見解，該場景包含一萬億個三角形的叢林廢墟動畫，該場景使用英特爾 Arc B580 GPU 成功實現了 1440p 解析度下 30 FPS 的幀率。
本部落格系列強調 1 SPP 去噪和超採樣的實際應用，包括視覺品質評估指標、管理具有一萬億個實例三角形的高複雜度場景中的動畫，以及內容創建和性能優化所涉及的權衡。

值得注意的是，英特爾旨在使用時空聯合神經去噪和超採樣模型來增強細節重建和降噪效果。這種方法與NVIDIA在DLSS 3.5中的光線重建技術以及AMD即將在其FSR Redstone技術中推出的光線再生功能相似。

精細紋理細節：降噪器通常透過旨在降低雜訊的最佳化來產生更平滑的結果。然而，這可能會失去精細細節，尤其是在區分高頻雜訊和實際訊號變得困難時。

閃爍：雖然降噪後的單一影格看起來很清晰，但影格與影格之間的細微變化可能會導致隨著時間的推移出現明顯的閃爍，尤其是在光照或場景動態變化的情況下。平衡的時間損失可以穩定輸出，但過度使用可能會導致重影偽影。

莫爾條紋：莫爾條紋源自於高頻細節的欠取樣，會在場景細節和像素網格之間造成視覺幹擾。使用針對此類圖案的多樣化樣本訓練模型可以提升去雜訊性能。

陰影重建：在沒有運動向量的情況下，準確重建陰影仍然很複雜。使用展現不同光照條件的樣本進行訓練，可以提高模型的陰影再現效果。

遮蔽消除：挑戰出現在先前被遮蔽但因運動而可見的區域。由於模式不一致，模型難以重建這些區域，有時會導致重影偽影。使用代表性樣本豐富訓練資料有助於解決此問題。

反射：與陰影類似，反射重建依賴雜訊顏色輸入。將第一個非鏡面反射點合併到輔助緩衝區可以顯著提升反射質量，尤其對於反射表面而言。

透過英特爾

為了進一步增強低功耗 GPU 的高效能視覺保真度，英特爾推出了硬體加速紋理集神經壓力 (TSNC)，並與 DirectX 協同向量相容。這項技術最大限度地發揮了當代晶片中 AI 驅動硬體功能的潛力，與使用 FMA（融合乘加）的傳統運算型實現相比，性能提升高達 47 倍。以下是一些值得關注的性能指標：

英特爾 Arc 140V (Lunar Lake)：2.6 毫秒（BC6 基線）/ 2.1 毫秒（搭配協同向量的 TSNC）
英特爾 Arc B580（Battlemage）：0.55 毫秒（BC6 基線）/ 0.55 毫秒（具有協作向量的 TSNC）

英特爾的 TSNC 表現出與傳統 BC6 壓縮相當或更優的性能水平，同時利用更小的紋理記憶體佔用，從而優化資源使用並提高整體性能。

英特爾近期的演示和出版物分享的洞見凸顯了公司的發展軌跡。英特爾正從過去的形像中蛻變，展現出一家蓄勢待發、在 GPU 領域不斷創新的公司。憑藉 Xe2 等架構，英特爾似乎已在入門級獨立 GPU 市場和整合 GPU 解決方案中佔據著舉足輕重的地位。這些充滿希望的進步可能會徹底改變 iGPU 領域，人們對其即將推出的實施方案充滿期待，這也體現了英特爾對開源開發的承諾。

來源和圖片