
Firma Intel oficjalnie ogłosiła wprowadzenie architektury graficznej Xe3, która ma zadebiutować w zintegrowanym procesorze GPU nadchodzących procesorów Panther Lake. W najbliższej przyszłości planowane jest wprowadzenie wariantu Xe3P.
Intel prezentuje architekturę Xe3 dla procesorów graficznych Panther Lake, obiecującą wzrost wydajności nawet o 50%
Procesor Intel Xe3 jest następcą ubiegłorocznej architektury Xe2, która znacząco wzbogaciła ofertę produktów firmy poprzez integrację z dwoma kluczowymi premierami: procesorami Lunar Lake „Core Ultra 200” oraz dyskretnymi kartami graficznymi Arc B-Series „Battlemage”.Architektura Xe2 wykorzystała doświadczenia swojego poprzednika, Xe1, oraz pierwotnej rodziny Arc Alchemist A-Series, co zaowocowało udanym debiutem na obu platformach.



Ostatnie udoskonalenia oprogramowania wzmocniły również ofertę Intela w zakresie obsługi sterowników, co korzystnie wpływa nie tylko na gry, ale także na tworzenie treści, renderowanie i procesy sztucznej inteligencji. Nowo wydana seria Arc Pro płynnie integruje się z istniejącym ekosystemem sterowników, podobnie jak procesory graficzne Battlemage.

Ostatnie miesiące firmy Intel przyniosły znaczące postępy w technologii graficznej, czego najlepszym przykładem jest nadchodząca seria Panther Lake „Core Ultra 300”, w której zastosowano najnowocześniejszą architekturę Xe3.
iGPU Xe3: następna generacja Arc B-Series i informacje o Xe3P
Architektura Xe3 bazuje na architekturze Xe2, rozszerzając możliwości graficzne w większych konfiguracjach i optymalizując przepustowość. Warto zauważyć, że procesory graficzne iGPU oparte na Xe3 będą oznaczone marką Arc B-Series.
Co ciekawe, podczas gdy oddzielne układy GPU Battlemage bazują na architekturze Xe2, iGPU Panther Lake przechodzą na architekturę Xe3. To ujednolicenie odzwierciedla strategiczną decyzję Intela o ujednoliceniu oferty produktowej w zakresie zarówno rozwiązań zintegrowanych, jak i dyskretnych.

Przyszłe prace wskazują, że rodzina procesorów Arc, wykorzystująca ulepszoną architekturę Xe3 o nazwie Xe3P, jest w przygotowaniu i ma oferować dalsze optymalizacje, zamiast od razu przechodzić na Xe4. Ten strategiczny ruch sugeruje, że Xe3P może być stosowany zarówno w rozwiązaniach z oddzielnymi GPU, jak i w ulepszonych konfiguracjach iGPU dla nadchodzących procesorów Nova Lake.
Chociaż Xe3P nie będzie częścią obecnej serii Arc B, podobnie jak Battlemage dGPU czy Panther Lake iGPU, oczekiwania na to, co prawdopodobnie będzie kolejnym elementem rodziny Arc — być może Arc C-Series — rosną. Mając te elementy wyjaśnione, przyjrzyjmy się bliżej szczegółom architektury Xe3.
Xe3 – Zwiększanie wydajności i energooszczędności procesorów graficznych iGPU
Architektura Xe3 oznacza znaczący wzrost możliwości renderowania. Poprzednia wersja Xe2 posiadała 4 rdzenie Xe i 4 jednostki ray tracingu dedykowane dla każdego wycinka renderującego.

Z kolei Xe3 oferuje imponującą liczbę 6 rdzeni Xe i 6 jednostek ray tracingu na wycinek renderowania, co przekłada się na wzrost o 50%.To ulepszenie umożliwia firmie Intel efektywne wdrażanie zróżnicowanych konfiguracji płytek GPU w układach SoC Panther Lake.

Dostępne konfiguracje obejmują układ 4-rdzeniowy Xe dla procesorów WeU 8C i 16C oraz bardziej zaawansowaną konfigurację 12-rdzeniową Xe przeznaczoną dla najmocniejszego układu 16C, co obiecuje ewolucję dynamiki wydajności w porównaniu z konkurencyjnymi układami, takimi jak Arrow Lake i Lunar Lake.

Specyfikacje obu konfiguracji są następujące:
- Konfiguracja 4 rdzeni Xe:
- 4 rdzenie Xe (architektura Xe3)
- 1 Wycinek renderowania
- 32 silniki XMX
- 4 MB pamięci podręcznej L2
- 1 Geo Pipeline
- 4 próbniki
- 4 jednostki śledzenia promieni
- 2 tylne moduły pikselowe
- Konfiguracja rdzenia 12 Xe:
- 12 rdzeni Xe (architektura Xe3)
- 2 wycinki renderowania
- 96 silników XMX
- 16 MB pamięci podręcznej L2
- 2 rurociągi Geo
- 12 próbek
- 12 jednostek śledzenia promieni
- 4 tylne elementy pikseli

Mimo że konfiguracja 4Xe charakteryzuje się mniejszą pamięcią podręczną L2, model 12Xe wyróżnia się 16 MB pamięci podręcznej L2, co skutecznie zmniejsza ruch w strukturze SoC — co przekłada się na 36% redukcję ruchu podczas gier.

Udoskonalenia architektury w ramach środowiska Xe3 obejmują ulepszone funkcje rdzeniowe, takie jak osiem 512-bitowych silników wektorowych i osiem 2048-bitowych silników XMX, a także 33-procentowy wzrost współdzielonej pamięci podręcznej L1/SLM.

Ta innowacyjna architektura sprawia, że silnik Xe Vector Engine może teraz wykorzystać nawet o 25% więcej wątków, zapewniając jednocześnie obsługę alokacji rejestrów zmiennych, co przekłada się na poprawę wydajności, zwłaszcza w zadaniach skoncentrowanych na sztucznej inteligencji.

Co więcej, silniki XMX zostały zaprojektowane z myślą o akceleracji AI, a procesor graficzny 12Xe iGPU może osiągnąć do 120 TOPs, a procesor 4Xe iGPU około 40 TOPs. Dla porównania, poprzednia architektura Xe2 generowała maksymalnie 67 TOPs, co sprawia, że przejście na Xe3 oznaczało znaczący skok wydajności.

Szczegółowe informacje na temat liczby operacji na rdzeń Xe3 wykonywanych na zegarze przedstawiają się następująco:
- XMX TF32: 1024 operacji/zegar
- XMX FP16: 2048 operacji/zegar
- XMX BF16: 2048 operacji/zegar
- XMX INT8: 4096 operacji/zegar
- XMX INT4: 8192 operacji/zegar
- XMX INT2: 8192 operacji/zegar

Dodatkowo, Intel wprowadził najnowocześniejszą jednostkę ray tracingu z dynamicznym zarządzaniem promieniami, zaprojektowaną do asynchronicznego śledzenia promieni. Jednostka ta jest wyposażona w wiele potoków przechodzenia, jednostki przecięcia trójkątów oraz pamięć podręczną BVH, co zwiększa ogólną wydajność.

Nowy menedżer URB umożliwia częściowe aktualizacje, znacznie poprawiając wydajność zarządzania danymi na GPU. Co więcej, udoskonalenia obejmują nawet dwukrotnie większą częstotliwość filtrowania anizotropowego i testowania szablonów, co dodatkowo wyróżnia Xe3.
W zakresie multimediów architektura oferuje zaawansowane funkcje, takie jak kodowanie/dekodowanie AV1, dekodowanie VVC oraz obsługę eDP 1.5. Dodatkowe funkcje obejmują obsługę 10-bitowego formatu AVC i kompatybilność z różnymi formatami Sony XAVC, co wzbogaca możliwości obsługi multimediów w systemie Xe3 w systemie Panther Lake.
Intel nadal skaluje i zwiększa wydajność GPU dzięki Xe3
Firma Intel opublikowała wstępne oceny wydajności swoich procesorów graficznych Xe3, skupiając się na mikrotestach porównujących poszczególne segmenty mikroarchitektury procesorów graficznych z poprzednimi wersjami.

Wstępne wyniki wydajności mieszania i zaplecza wskazują na minimalne wahania, biorąc pod uwagę stały przydział zasobów w Xe3. Jednak uderzający wzrost o 50% w metrykach FP16 dla GEMM odzwierciedla przewagę skalowalności GPU. Ponieważ Xe3 przewyższa rozmiarem Xe2, te testy w pełni wykorzystują jego możliwości, prezentując imponujące ulepszenia architektoniczne, takie jak poprawa szybkości anizotropowej, szybkości renderowania siatki, odczytów rozproszonych i przecięć ray tracingu, które wzrosły od 2x do 2, 7x.

Znaczne postępy w obszarach takich jak testy głębokości i aplikacje wymagające dużej liczby rejestrów zanotowano ponad 7-krotnie w porównaniu z poprzednią generacją, co obrazuje skok w standardach wydajności.

Aby przedstawić to wizualnie, klatka wyrenderowana przy użyciu Xe3 w porównaniu z Xe2 ukazuje postępy poczynione w zakresie udoskonaleń wydajności.

Ponadto firma Intel udoskonala swój pakiet oprogramowania graficznego dla systemu Windows, wprowadzając przydatne aktualizacje, w tym udoskonalenia kompilatora za pośrednictwem kompilatora Intel Graphics Compiler (IGC) i przydzielania rejestrów zmiennych w celu dalszej optymalizacji wydajności.

Intel wprowadza szybsze funkcje planowania poprzez bezpośrednie wywłaszczanie, co pozwala na szybkie przełączanie kontekstu bez konieczności opróżniania pamięci podręcznej. Ponadto, najnowsze aktualizacje obejmują obsługę wektorów kooperacyjnych DirectX, zaprezentowanych w demonstracji Intel „Neural Radiance Field” wykorzystującej te wektory.

Podsumowując, architektura Intel Xe3 stanowi znaczący postęp w porównaniu z architekturą Xe2, która obecnie konkuruje z wiodącymi iGPU RDNA 3.5, takimi jak Radeon 880M i 890M, w popularnych laptopach. Chociaż Xe2 może nie dorównywać w pełni zaawansowanym układom, takim jak implementacje RDNA 3.5, np. Strix Halo, współpraca między Intelem a NVIDIA w zakresie niestandardowych układów SoC może zniwelować tę lukę.
Dodaj komentarz