Intel stellt hochauflösende Grafik und verbesserte Leistung auf integrierten GPUs vor: Demonstriert Ray Reconstruction Denoiser für Path Tracing auf Arc B580

Intel stellt hochauflösende Grafik und verbesserte Leistung auf integrierten GPUs vor: Demonstriert Ray Reconstruction Denoiser für Path Tracing auf Arc B580

Auf der SIGGRAPH & HPG 2025 präsentierte Intel bedeutende Fortschritte bei der Bildtreue und Leistungsverbesserungen sowohl für integrierte als auch für diskrete GPUs.

Verbesserung der Bildqualität: Intels strategischer Fokus auf integrierte GPUs

Die Landschaft der integrierten Grafikprozessoren (iGPUs) hat sich dramatisch verändert. Vor zehn Jahren dienten iGPUs hauptsächlich der Medienwiedergabe, und das Gaming-Erlebnis war weitgehend unbefriedigend. Dank jüngster Fortschritte nähern sich viele integrierte Lösungen jedoch dem Leistungsniveau diskreter GPUs der Einstiegsklasse an. Intel arbeitet nun daran, die Bildqualität und Leistung dieser Einheiten weiter zu verbessern.

Um diese Ziele für zukünftige Generationen von iGPUs und ihren diskreten Gegenstücken zu erreichen, umfassen die strategischen Initiativen von Intel:

  • Effizienzsteigerung beim Path Tracing
  • Erkundung neuronaler Grafiktechnologien
  • Einführung innovativer physikalischer Effekte wie Fluoreszenz

Das Hauptziel besteht darin, hochauflösende visuelle Effekte, insbesondere Path Tracing, zu ermöglichen, optimiert für energieeffiziente Geräte mit iGPUs. Path Tracing ist aufgrund der umfangreichen Nutzung von Photonenpfaden für die Simulation für seinen hohen Rechenaufwand bekannt und erfordert eine Rauschreduzierung, um ein sauberes Bild zu erzeugen. Intels Ansatz nutzt Resampled Importance Sampling, das die Bildqualität um das bis zu Zehnfache verbessert.

Zu dieser gesteigerten Qualität tragen folgende Neuerungen bei:

Diese aktuelle Arbeit, die auf der SIGGRAPH 2025 vorgestellt wurde, verbessert die Echtzeit-Pfadverfolgung durch die Verfeinerung des Resampled Importance Sampling.Diese Technik organisiert Stichproben in lokalen Histogrammen und nutzt Quasi-Monte-Carlo-Sampling mit antithetischen Mustern, um Rauschen effektiv zu minimieren. In Kombination mit blauem Rauschen führt diese Methode zu einer deutlichen visuellen Verbesserung und erzielt bis zu zehnmal bessere Ergebnisse.

Diese Weiterentwicklung baut auf den führenden Techniken auf, die in renommierten AAA-Titeln wie Cyberpunk 2077 zum Einsatz kommen, und schließt die Lücke zwischen High-End-Gaming-Erlebnissen und stromsparender Hardware.

Trotz zahlreicher Hindernisse ist die Weiterentwicklung der Technologie deutlich erkennbar – von den anfänglichen Experimenten mit einfachen Szenen bis hin zur komplexen, animierten Szene „Dschungelruinen“ mit komplizierten Elementen wie dynamischer Vegetation und Lichtübergängen, die vollständig mit 1 Sample pro Pixel (1 SPP) verfolgt wird und konstante 30 Bilder pro Sekunde bei 1440p auf der Intel B580 GPU erreicht.

über Intel

Zusätzlich zu diesen Entwicklungen stellte Intel die zweite Version von Open Image Denoise vor, einem KI-beschleunigten Raytracing-Tool, das einem breiteren Publikum zugänglich gemacht wird. Die erste Version dieser Open-Source-Bibliothek genießt in der Branche hohes Ansehen. Das Update verspricht verbesserte herstellerübergreifende Unterstützung und verbessert die Kompatibilität mit allen wichtigen GPUs, einschließlich denen von Intel, NVIDIA und AMD.

Intel arbeitet aktiv an der nächsten Version des Denoisers, die eine neuronale Netzwerkarchitektur integriert, um die Grafik weiter zu verbessern und die Leistung zu steigern. Eine kürzlich erfolgte Demonstration zeigte „ Path Tracing a Trillion Triangles “ auf der Intel Arc B580 GPU bei 1440p und lieferte stabile 30 FPS.

Leistung und Bildqualität hängen direkt von der Anzahl der Strahlen ab, die in jeder Phase der Pfadverfolgung verarbeitet werden.

Um Rechenaufwand und Speicherverbrauch zu minimieren, verwenden wir 1 SPP und einen einzelnen Strahl pro Abprall. Aufgrund der inhärenten Variabilität des Path Tracings können die resultierenden Bilder jedoch deutliches Rauschen aufweisen. Die Darstellung jedes Pixels basiert auf einem zufälligen Lichtpfad, was zu erheblichen Helligkeits- und Farbschwankungen führt, insbesondere bei komplexen Lichtverhältnissen wie indirekter Beleuchtung und Reflexionen. Unsere Lösung nutzt ein räumlich-zeitliches, gemeinsames neuronales Denoising- und Supersampling-Modell, um das Rauschen zu beseitigen und Details hervorzuheben.

über Intel

Zu den wichtigsten Highlights dieser eindrucksvollen Demonstration zählen:

  • Die Reduzierung des Rechenaufwands für Path Tracing für Echtzeit-Performance ist eine große Herausforderung und steht aktuell im Fokus der Forschung in Industrie und Wissenschaft. In unserer Blog-Reihe teilen wir Einblicke in Echtzeit-Path Tracing für die animierte Szene „Dschungelruinen“ mit einer Billion Dreiecke und erreichen mit einer Intel Arc B580 GPU erfolgreich 30 FPS bei 1440p.
  • In dieser Blogserie liegt der Schwerpunkt auf praktischen Anwendungen der 1 SPP-Rauschunterdrückung und des Supersamplings, darunter Metriken zur Beurteilung der visuellen Qualität, die Verwaltung von Animationen in hochkomplexen Szenen mit einer Billion instanziierten Dreiecken und die Kompromisse bei der Inhaltserstellung und Leistungsoptimierung.

Intel zielt insbesondere darauf ab, die Detailrekonstruktion und Rauschunterdrückung mithilfe eines räumlich-zeitlichen neuronalen Denoising- und Supersampling-Modells zu verbessern. Dieser Ansatz weist Ähnlichkeiten mit NVIDIAs Ray Reconstruction-Technologie aus DLSS 3.5 sowie AMDs kommender Ray Regeneration-Funktion innerhalb der FSR Redstone-Technologie auf.

  • Feine Texturdetails: Denoiser erzielen durch Optimierungen zur Rauschreduzierung oft glattere Ergebnisse. Dabei können jedoch feine Details verloren gehen, insbesondere wenn die Unterscheidung zwischen hochfrequentem Rauschen und dem eigentlichen Signal schwierig wird.
  • Flackern: Obwohl einzelne, denominationierte Frames sauber erscheinen, können leichte Abweichungen von Frame zu Frame mit der Zeit zu einem wahrnehmbaren Flimmern führen, insbesondere aufgrund wechselnder Beleuchtung oder Szenendynamik. Ein ausgeglichener zeitlicher Verlust kann die Ergebnisse stabilisieren, übermäßiger Einsatz kann jedoch zu Geisterbildern führen.
  • Moiré-Muster: Diese entstehen durch Unterabtastung hochfrequenter Details und erzeugen visuelle Interferenzen zwischen Szenendetails und Pixelrastern. Das Training des Modells mit verschiedenen Beispielen, die solche Muster berücksichtigen, kann die Leistung bei der Rauschunterdrückung verbessern.
  • Schattenrekonstruktion: Die präzise Rekonstruktion von Schatten bleibt ohne Bewegungsvektoren komplex. Das Training mit Proben unterschiedlicher Lichtverhältnisse ermöglicht eine verbesserte Schattenreproduktion durch das Modell.
  • Disokklusion: Probleme entstehen in Bereichen, die zuvor verdeckt waren, aber durch Bewegung sichtbar wurden. Das Modell hat aufgrund inkonsistenter Muster Schwierigkeiten, diese zu rekonstruieren, was manchmal zu Ghosting-Artefakten führt. Die Anreicherung von Trainingsdaten mit repräsentativen Stichproben hilft, dieses Problem zu bewältigen.
  • Reflexionen: Wie Schatten basiert auch die Reflexionsrekonstruktion auf verrauschten Farbeingaben. Die Einbindung des ersten nicht spiegelnden Treffers in Hilfspuffer verbessert die Reflexionsqualität erheblich, insbesondere bei reflektierenden Oberflächen.

über Intel

Um die hohe Bildtreue bei stromsparenden GPUs weiter zu verbessern, hat Intel die hardwarebeschleunigte Texture Set Neural Compression (TSNC) eingeführt, die mit DirectX Cooperative Vectors kompatibel ist. Diese Technologie maximiert das Potenzial KI-gesteuerter Hardwarefunktionen in modernen Chips und erreicht eine bis zu 47-fache Leistungssteigerung im Vergleich zu herkömmlichen, rechenorientierten Implementierungen mit FMA (Fused Multiply Add).Hier sind einige bemerkenswerte Leistungskennzahlen:

  • Intel Arc 140V (Lunar Lake): 2, 6 ms (BC6-Basislinie) / 2, 1 ms (TSNC mit kooperativen Vektoren)
  • Intel Arc B580 (Battlemage): 0, 55 ms (BC6-Basislinie) / 0, 55 ms (TSNC mit kooperativen Vektoren)

Intels TSNC weist Leistungsniveaus auf, die der herkömmlichen BC6-Komprimierung entsprechen oder diese übertreffen, während der Texturspeicherbedarf kleiner ausfällt, wodurch die Ressourcennutzung optimiert und die Gesamtleistung verbessert wird.

Die Erkenntnisse aus Intels jüngsten Demonstrationen und Veröffentlichungen unterstreichen die Zukunftsaussichten des Unternehmens. Intel entwickelt sich von seinem bisherigen Image weiter und präsentiert sich als innovatives Unternehmen im GPU-Bereich. Mit Architekturen wie Xe2 scheint Intel sowohl im Einstiegssegment diskreter GPUs als auch bei integrierten Lösungen als starker Player gut aufgestellt zu sein. Diese vielversprechenden Fortschritte könnten das iGPU-Segment revolutionieren. Die Erwartung auf zukünftige Implementierungen ist groß und spiegelt das Engagement des Unternehmens für Open-Source-Entwicklungen wider.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert