Intel prezentuje wysokiej jakości wizualizacje i zwiększoną wydajność na zintegrowanych procesorach graficznych: demonstruje Ray Reconstruction Denoiser do śledzenia ścieżki na Arc B580

Intel prezentuje wysokiej jakości wizualizacje i zwiększoną wydajność na zintegrowanych procesorach graficznych: demonstruje Ray Reconstruction Denoiser do śledzenia ścieżki na Arc B580

Podczas konferencji SIGGRAPH i HPG 2025 firma Intel zaprezentowała znaczące udoskonalenia w zakresie wierności obrazu i wydajności zarówno w przypadku zintegrowanych, jak i dyskretnych procesorów graficznych.

Poprawa jakości obrazu: Strategiczne skupienie firmy Intel na zintegrowanych procesorach graficznych

Krajobraz zintegrowanych jednostek przetwarzania grafiki (iGPU) uległ drastycznej transformacji. Dekadę temu iGPU służyły głównie do odtwarzania multimediów, a wrażenia z gier były w dużej mierze niezadowalające. Jednak ostatnie postępy pozwoliły wielu zintegrowanym rozwiązaniom zbliżyć się do poziomu wydajności podstawowych dyskretnych GPU. Intel poświęca się teraz dalszemu zwiększaniu jakości wizualnej i wydajności tych jednostek.

Aby osiągnąć te cele w przyszłych generacjach układów iGPU i ich dyskretnych odpowiednikach, strategiczne inicjatywy firmy Intel obejmują:

  • Zwiększanie wydajności w śledzeniu ścieżki
  • Eksploracja technologii grafiki neuronowej
  • Wprowadzenie innowacyjnych efektów fizycznych, takich jak fluorescencja

Głównym celem jest zapewnienie wysokiej jakości efektów wizualnych, w szczególności Path Tracing, zoptymalizowanych pod kątem energooszczędnych urządzeń wykorzystujących iGPU. Path Tracing, znany ze swoich wymagań obliczeniowych ze względu na szerokie wykorzystanie ścieżek fotonów do symulacji, wymaga redukcji szumów, aby uzyskać czysty obraz. Podejście Intela obejmuje Resampled Importance Sampling, które poprawia jakość wizualną o niezwykły współczynnik nawet dziesięciokrotnie.

Do tej podwyższonej jakości przyczyniają się następujące innowacje:

Ta niedawna praca, która została zaakceptowana na konferencji SIGGRAPH 2025, rozwija śledzenie ścieżki w czasie rzeczywistym poprzez udoskonalenie Resampled Importance Sampling.Ta technika organizuje próbki w lokalne histogramy i wykorzystuje próbkowanie Quasi Monte Carlo z antytetycznymi wzorcami, aby skutecznie zminimalizować szum. W połączeniu z szumem niebieskim ta metoda prowadzi do znacznej poprawy wizualnej, osiągając do dziesięciu razy lepsze rezultaty.

Postęp ten opiera się na wiodących technikach stosowanych w uznanych tytułach AAA, takich jak Cyberpunk 2077, łącząc w sobie wrażenia z gier najwyższej klasy ze sprzętem o niskim poborze mocy.

Pomimo licznych przeszkód, ewolucja technologii jest widoczna — od początkowych eksperymentów z prostymi scenami po złożoną, animowaną scenę Jungle Ruins z misternymi elementami, takimi jak dynamiczna roślinność i zmiany oświetlenia, w pełni śledzoną ścieżką z 1 próbką na piksel (1 SPP), osiągającą stałe 30 klatek na sekundę przy rozdzielczości 1440p na procesorze graficznym Intel B580.

za pośrednictwem Intel

Oprócz tych zmian Intel ujawnił drugą iterację Open Image Denoise, narzędzia do śledzenia promieni z akceleracją AI, dostępnego dla szerszej publiczności. Pierwsza wersja tej biblioteki open-source jest dobrze postrzegana w branży, a aktualizacja obiecuje ulepszone wsparcie między dostawcami, poprawiając kompatybilność ze wszystkimi głównymi procesorami graficznymi, w tym Intel, NVIDIA i AMD.

Firma Intel aktywnie pracuje nad kolejną wersją denoisera, która zintegruje architekturę sieci neuronowej, aby jeszcze bardziej ulepszyć efekty wizualne i zwiększyć wydajność. Niedawna demonstracja podkreśliła „ Śledzenie ścieżki biliona trójkątów ” na procesorze graficznym Intel Arc B580 przy rozdzielczości 1440p, zapewniając stabilne 30 FPS.

Wydajność i jakość obrazu są bezpośrednio zależne od liczby promieni przetwarzanych w każdej fazie śledzenia ścieżki.

Aby zminimalizować zapotrzebowanie na moc obliczeniową i wykorzystanie pamięci, stosujemy 1 SPP i pojedynczy promień dla każdego odbicia. Jednak ze względu na wrodzoną zmienność śledzenia ścieżki, powstałe obrazy mogą wykazywać zauważalny szum. Renderowanie każdego piksela opiera się na jednej losowej ścieżce światła, co prowadzi do znacznych wahań jasności i koloru, szczególnie w złożonych warunkach oświetleniowych, takich jak oświetlenie pośrednie i odbicia. Nasze rozwiązanie obejmuje wykorzystanie przestrzenno-czasowego modelu neuronowego odszumiania i supersamplingu w celu oczyszczenia szumu i wzmocnienia szczegółów.

za pośrednictwem Intel

Do najważniejszych punktów tej imponującej demonstracji należą:

  • Zmniejszenie kosztów obliczeniowych śledzenia ścieżki w celu uzyskania wydajności w czasie rzeczywistym jest znaczącym wyzwaniem, które jest obecnie przedmiotem badań zarówno w przemyśle, jak i w środowisku akademickim. W naszej serii wpisów na blogu dzielimy się spostrzeżeniami na temat śledzenia ścieżki w czasie rzeczywistym dla animowanej sceny Jungle Ruins z bilionem trójkątów, osiągając pomyślnie 30 FPS przy 1440p z procesorem graficznym Intel Arc B580.
  • W tej serii wpisów na blogu położono nacisk na praktyczne zastosowania odszumiania i supersamplingu 1 SPP, w tym na metryki oceny jakości obrazu, zarządzanie animacjami w scenach o wysokim stopniu złożoności, obejmujących bilion trójkątów, a także na kompromisy związane z tworzeniem treści i optymalizacją wydajności.

Co ciekawe, Intel zamierza ulepszyć rekonstrukcję szczegółów i redukcję szumów, wykorzystując przestrzenno-czasowy model neuronowego odszumiania i supersamplingu. To podejście jest podobne do technologii Ray Reconstruction firmy NVIDIA z DLSS 3.5, a także do nadchodzącej funkcji Ray Regeneration firmy AMD w ramach technologii FSR Redstone.

  • Szczegóły drobnych tekstur: Denoisery często dają gładsze rezultaty dzięki optymalizacji ukierunkowanej na redukcję szumów. Może to jednak powodować utratę drobnych szczegółów, zwłaszcza gdy rozróżnienie szumu o wysokiej częstotliwości od rzeczywistego sygnału staje się trudne.
  • Migotanie: Chociaż poszczególne klatki bez szumów wydają się czyste, niewielkie różnice między klatkami mogą z czasem prowadzić do zauważalnego migotania, szczególnie z powodu zmieniającego się oświetlenia lub dynamiki sceny. Zrównoważona strata czasowa może ustabilizować wyjścia, ale nadużywanie może skutkować artefaktami typu ghosting.
  • Wzory Moiré: powstają w wyniku niedopróbkowania szczegółów o wysokiej częstotliwości, co powoduje interferencję wizualną między szczegółami sceny a siatkami pikseli. Trening modelu z różnymi próbkami odnoszącymi się do takich wzorców może poprawić wydajność odszumiania.
  • Rekonstrukcja cienia: Dokładna rekonstrukcja cieni pozostaje złożona bez wektorów ruchu. Trening z próbkami wykazującymi różne warunki oświetlenia pozwala na ulepszoną reprodukcję cienia przez model.
  • Disocclusion: Wyzwania pojawiają się w obszarach wcześniej zasłoniętych, ale widocznych dzięki ruchowi. Model ma trudności z ich rekonstrukcją z powodu niespójnych wzorców, co czasami skutkuje artefaktami ghostingu. Wzbogacanie danych treningowych o reprezentatywne próbki pomaga w zarządzaniu tym problemem.
  • Odbicia: Podobnie jak cienie, rekonstrukcja odbicia opiera się na zaszumionym kolorze wejściowym. Włączenie pierwszego nieodblaskowego uderzenia do buforów pomocniczych znacznie poprawia jakość odbicia, szczególnie w przypadku powierzchni odbijających.

za pośrednictwem Intel

Aby jeszcze bardziej zwiększyć wydajność wierności wizualnej w procesorach graficznych o niskim poborze mocy, firma Intel wprowadziła sprzętowo przyspieszaną kompresję tekstur Neural Compression (TSNC), zgodną z DirectX Cooperative Vectors. Technologia ta maksymalizuje potencjał funkcji sprzętowych opartych na sztucznej inteligencji w nowoczesnych układach scalonych, osiągając nawet 47-krotny wzrost wydajności w porównaniu z tradycyjnymi implementacjami zorientowanymi na obliczenia przy użyciu FMA (Fused Multiply Add).Oto kilka godnych uwagi wskaźników wydajności:

  • Intel Arc 140V (Lunar Lake): 2, 6 ms (bazowy BC6) / 2, 1 ms (TSNC z wektorami kooperacyjnymi)
  • Intel Arc B580 (Battlemage): 0, 55 ms (bazowy BC6) / 0, 55 ms (TSNC z wektorami kooperacyjnymi)

Technologia TSNC firmy Intel charakteryzuje się wydajnością równą lub wyższą od konwencjonalnej kompresji BC6, przy jednoczesnym wykorzystaniu mniejszej ilości pamięci tekstur, co pozwala na optymalizację wykorzystania zasobów i zwiększenie ogólnej wydajności.

Wnioski przekazane w ostatnich demonstracjach i publikacjach Intela podkreślają przyszłą trajektorię firmy. Intel ewoluuje od swojego poprzedniego wizerunku, prezentując firmę gotową na innowacje w dziedzinie GPU. Dzięki architekturze takiej jak Xe2, Intel wydaje się dobrze pozycjonowany jako potężny gracz zarówno na rynkach dyskretnych GPU klasy podstawowej, jak i zintegrowanych rozwiązań. Te obiecujące postępy mogą zrewolucjonizować segment iGPU, z silnym oczekiwaniem na ich nadchodzące wdrożenia, odzwierciedlając ich zaangażowanie w rozwój oprogramowania typu open source.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *