Intel Xe3 그래픽 출시: Xe2 대비 50% 성능 향상, 업그레이드된 RT 유닛, Panther Lake “Arc B-시리즈” iGPU용 12개 Xe 코어 및 곧 출시될 Xe3P 후속 제품

인텔은 공식적으로 Xe3 그래픽 아키텍처를 발표했습니다.이 아키텍처는 곧 출시될 팬서 레이크 프로세서의 통합 GPU에 탑재될 예정이며, 가까운 미래에 Xe3P 변형을 출시할 계획입니다.

인텔, 팬서 레이크 iGPU용 Xe3 아키텍처 공개: 최대 50% 성능 향상 기대

인텔의 Xe3는 작년에 출시된 Xe2 아키텍처를 계승합니다. Xe2 아키텍처는 Lunar Lake “Core Ultra 200” CPU와 Arc B 시리즈 “Battlemage” 외장 그래픽 카드라는 두 가지 주요 제품에 통합되어 제품군을 크게 강화했습니다. Xe2 아키텍처는 이전 모델인 Xe1과 초기 Arc Alchemist A 시리즈 제품군에서 얻은 경험을 바탕으로 두 플랫폼 모두에서 성공적인 출시를 이루었습니다.

인텔 로고가 있는 XPU가 왜 필요한가요? TECH TOUR US에서 노트북과 게임용 그래픽을 포함한 다양한 장치와 워크로드를 선보입니다.

GPU 및 NPU 최적화 세부 정보가 포함된 Intel Panther Lake XPU 그래픽으로, 더 큰 구성으로 확장 가능하고 효율성이 최적화되었음을 보여줍니다.

최근 소프트웨어 개선을 통해 인텔의 드라이버 지원 기능이 강화되어 게임뿐만 아니라 콘텐츠 제작, 렌더링, AI 프로세스에도 도움이 되었습니다.새롭게 출시된 Arc Pro 시리즈는 Battlemage GPU와 함께 기존 드라이버 생태계와 완벽하게 통합되었습니다.

인텔 Xe3 그래픽 공식 발표: Xe2보다 50% 이상 빠른 속도, 향상된 RT 유닛, 팬서 레이크용 12개 Xe 코어

인텔은 최근 몇 달 동안 그래픽 기술에서 상당한 발전을 이루었으며, 특히 최첨단 Xe3 아키텍처를 도입한 Panther Lake “Core Ultra 300” 시리즈가 주목을 받았습니다.

Xe3 iGPU: 차세대 Arc B 시리즈 및 Xe3P에 대한 통찰력

Xe3 아키텍처는 Xe2를 기반으로 더 큰 구성에 맞춰 그래픽 성능을 확장하고 처리량을 최적화합니다.특히 Xe3 기반 iGPU는 Arc B 시리즈로 출시될 예정입니다.

흥미롭게도, 배틀메이지 외장 GPU는 Xe2 기반인 반면, 팬서 레이크 iGPU는 Xe3 아키텍처로 전환됩니다.이러한 변화는 인텔이 내장 및 외장 옵션 모두에서 제품 스택을 통합하려는 전략적 결정을 반영합니다.

향후 개발 상황에 따르면, 업그레이드된 Xe3 아키텍처를 사용하는 Arc 제품군인 Xe3P가 개발 중이며, Xe4로 바로 넘어가는 대신 추가적인 최적화를 제공할 것으로 예상됩니다.이러한 전략적 움직임은 Xe3P가 향후 Nova Lake CPU의 개별 GPU 솔루션과 향상된 iGPU 구성 모두에 적용될 수 있음을 시사합니다.

Xe3P는 Battlemage dGPU나 Panther Lake iGPU와 함께 현재 Arc B 시리즈에 포함되지는 않지만, Arc 제품군의 다음 세대 제품, 아마도 Arc C 시리즈에 대한 기대감이 고조되고 있습니다.이러한 요소들을 명확히 했으니, 이제 Xe3 아키텍처의 세부 사항을 살펴보겠습니다.

Xe3 – iGPU 성능 및 전력 효율성 향상

Xe3 아키텍처는 렌더링 성능의 획기적인 발전을 보여줍니다.이전 Xe2는 렌더 슬라이스당 4개의 Xe 코어와 4개의 레이 트레이싱 유닛을 탑재했습니다.

반면, Xe3는 렌더 슬라이스당 6개의 Xe 코어와 6개의 레이 트레이싱 유닛을 탑재하여 50%의 성능 향상을 달성했습니다.이러한 향상된 성능을 통해 인텔은 Panther Lake SoC 내에서 다양한 GPU 타일 구성을 효율적으로 구축할 수 있습니다.

사용 가능한 구성에는 8C 및 16C WeU용 4 Xe 코어 다이와 최상위 16C 다이용으로 지정된 보다 진보된 12 Xe 코어 설정이 포함되어 Arrow Lake 및 Lunar Lake와 같은 경쟁 제품에 비해 성능 역학에서 진화를 약속합니다.

두 가지 구성에 대한 사양은 다음과 같습니다.

4 Xe 코어 구성:
- 4개의 Xe 코어(Xe3 아키텍처)
- 1 렌더 슬라이스
- 32개의 XMX 엔진
- 4MB L2 캐시
- 1 지오 파이프라인
- 4개의 샘플러
- 4개의 레이 트레이싱 유닛
- 2개의 픽셀 백엔드
12 Xe 코어 구성:
- 12개의 Xe 코어(Xe3 아키텍처)
- 2개의 렌더 슬라이스
- 96 XMX 엔진
- 16MB L2 캐시
- 2개의 지오 파이프라인
- 12개의 샘플러
- 12개의 레이 트레이싱 유닛
- 4개의 픽셀 백엔드

Intel Xe³ Panther Lake 4Xe GPU 구성 다이어그램은 화면에 4개의 Xe 코어와 32개의 XMX 엔진과 같은 세부 정보를 보여줍니다.

4Xe 구성의 경우 L2 캐시가 감소했음에도 불구하고 12Xe 모델은 16MB L2 캐시로 SoC 패브릭의 트래픽을 효과적으로 줄여 게임 시나리오에서 트래픽을 최대 36%까지 줄였습니다.

16MB L2$를 사용하는 Intel SoC Fabric의 트래픽 감소 차트는 4가지 벤치마크에서 -17%~-36% 감소를 보여줍니다.

Xe3 프레임워크 내의 아키텍처 업그레이드에는 8개의 512비트 벡터 엔진과 8개의 2048비트 XMX 엔진과 같은 핵심 기능이 향상되었으며, 공유 L1/SLM 캐시가 33% 증가했습니다.

Xe-core, 향상된 레이 트레이싱 유닛, 그래픽 고정 기능 향상에 대한 섹션이 포함된 Intel Xe 3 기술 개요입니다.

이 혁신적인 아키텍처를 통해 Xe 벡터 엔진은 가변 레지스터 할당을 지원하면서 최대 25% 더 많은 스레드를 활용할 수 있게 되었으며, 이를 통해 특히 AI 중심 작업에서 성능이 향상되었습니다.

최대 25% 더 많은 스레드와 가변 레지스터 할당과 같은 기능이 추가된 Intel Xe 벡터 엔진 다이어그램입니다.

더욱이 XMX 엔진은 AI 가속을 위해 설계되었으며, 12Xe iGPU는 최대 120 TOPs를, 4Xe iGPU는 약 40 TOPs를 구현할 수 있습니다.참고로, 이전 Xe2 아키텍처는 최대 67 TOPs를 생성했기 때문에 Xe3으로의 전환은 성능 면에서 눈에 띄는 도약을 의미합니다.

Xe 매트릭스 확장 기능과 최대 120 TOPS 텍스트가 포함된 벤치마킹 화면의 Intel Xe3 XMX AI 가속 엔진.

Xe3 아키텍처의 클럭당 Xe 코어 작업은 다음과 같이 자세히 설명되어 있습니다.

XMX TF32: 1024 ops/clk
XMX FP16: 2048 ops/clk
XMX BF16: 2048 ops/clk
XMX INT8: 4096 ops/clk
XMX INT4: 8192 ops/clk
XMX INT2: 8192 ops/clk

Intel Xe^3 향상된 레이 트레이싱 유닛과 화면에 "동적 레이 관리"가 표시됩니다.

또한, 인텔은 비동기 레이 트레이싱을 위해 설계된 동적 레이 관리 기능을 갖춘 최첨단 레이 트레이싱 장치를 선보였습니다.이 장치에는 다중 순회 파이프라인, 삼각형 교차 장치, 그리고 BVH 캐시가 탑재되어 전반적인 성능이 향상됩니다.

Intel Xe³ GFX 고정 기능 기능에는 새로운 URB 관리자와 프레젠테이션 슬라이드에서 최대 2배의 이방성 필터링이 포함됩니다.

새로운 URB 관리자는 부분 업데이트를 용이하게 하여 GPU의 데이터 관리 효율성을 크게 향상시킵니다.또한, 최대 2배 향상된 이방성 필터링 및 스텐실 테스트 속도를 통해 Xe3의 차별성을 더욱 강화합니다.

미디어 측면에서는 AV1 인코딩/디코딩, VVC 디코드, eDP 1.5 지원과 같은 고급 기능이 포함되어 있습니다.추가 기능으로는 AVC 10비트 지원 및 다양한 소니 XAVC 포맷과의 호환성이 있으며, 이를 통해 Panther Lake에서 Xe3의 멀티미디어 처리 성능이 더욱 향상됩니다.

Intel, Xe3로 GPU 성능 확장 및 향상 지속

인텔은 Xe3 GPU에 대한 예비 성능 평가를 공개했는데, 이는 이전 버전과 비교하여 GPU 마이크로아키텍처의 개별 세그먼트를 평가하는 마이크로벤치마크에 초점을 맞췄습니다.

Intel Xe^3 Panther Lake Micro 벤치마크 차트는 다양한 작업에 걸쳐 성능 향상을 보여주며, Depth Writes에서 7.4로 가장 높은 성능을 보였습니다.

Xe3에서 리소스 할당이 일정하게 유지된다는 점을 고려하면 블렌드 및 백엔드 성능의 초기 결과는 변동이 미미함을 나타냅니다.그러나 GEMM의 FP16 지표가 50%나 증가한 것은 GPU의 확장성 이점을 보여줍니다. Xe3의 크기가 Xe2를 능가하는 만큼, 이 벤치마크는 Xe3의 성능을 최대한 활용하여 이방성 렌더링 속도, 메시 렌더링 속도, 분산 읽기, 레이 트레이싱 교차 등 2배에서 2.7배까지 향상된 놀라운 아키텍처 개선을 보여줍니다.

Intel Xe3 Panther Lake 성능 그래프는 Xe3, Xe2 Lunar Lake, Xe Arrow Lake H의 추세를 보여줍니다.

심도 테스트 및 레지스터 중심 애플리케이션과 같은 분야에서 상당한 성과가 있었으며, 이전 세대와 비교했을 때 7배 이상의 개선이 이루어졌으며, 이는 성능 표준의 도약을 보여줍니다.

Intel Xe^3 Panther Lake 성능 그래프는 Lunar Lake 대비 50% 이상의 성능을 보여줍니다." title="Intel Xe^3 Panther Lake 성능 그래프는 Lunar Lake 대비 50% 이상의 성능을 보여줍니다." width="728" height="410" loading="lazy" class="wp-image" src="https://cdn.thefilibusterblog.com/wp-content/uploads/2025/10/2025-10-09_0-26-28-728×410-1.webp"/></figure> <p>실제 성능 지표를 비교했을 때 Panther Lake의 Xe3는 Lunar Lake iGPU 대비 50% 이상 향상되었고 Arrow Lake-H 대비 와트당 성능이 40% 이상 향상되었습니다.</p> <figure class=

인텔 팬서 레이크 Xe³ 성능 그래프는 루나 레이크와 애로우 레이크 H를 비교합니다.

시각적으로 표현하자면, Xe3와 Xe2를 사용하여 렌더링한 프레임은 성능 향상 측면에서 이루어진 진전을 보여줍니다.

Xe3에서 한 프레임 동안 Intel Panther Lake 12 Xe-코어와 Lunar Lake 8 Xe-코어의 성능을 비교한 그래프입니다.타이밍 세부 정보도 포함되어 있습니다.

또한 인텔은 인텔 그래픽 컴파일러(IGC)를 통한 컴파일러 개선 및 성능 최적화를 위한 가변 레지스터 할당을 포함한 유용한 업데이트를 도입하여 Windows 그래픽 소프트웨어 스택을 향상시키고 있습니다.

Intel 기술이 적용된 Windows GFX 소프트웨어 스택 다이어그램에는 Vulkan, XeSS, DirectX가 통합된 프레임워크, 런타임, 드라이버가 포함되어 있습니다.

인텔은 직접 선점을 통해 더 빠른 스케줄링 기능을 도입하여 플러싱 없이도 신속한 컨텍스트 전환을 가능하게 합니다.또한, 최신 업데이트에는 DirectX Cooperative Vector 지원이 포함되었으며, 이러한 벡터를 활용하는 인텔의 “Neural Radiance Field” 데모를 통해 시연되었습니다.

Microsoft와 협력하여 XII Ultimate 및 XMX AI Engines 로고가 표시된 Cooperative Vectors라는 DirectX 기능이 기술 다이어그램에 표시되어 있습니다.

요약하자면, 인텔 Xe3 아키텍처는 현재 주류 노트북 시장에서 Radeon 880M 및 890M과 같은 주요 RDNA 3.5 iGPU와 경쟁하고 있는 Xe2에 비해 눈에 띄는 개선을 보여줍니다. Xe2가 Strix Halo와 같은 RDNA 3.5 구현과 같은 상위 계층의 성능에 완벽하게 부합하지는 않지만, 인텔과 엔비디아의 맞춤형 SoC 파트너십을 통해 이러한 격차를 메울 수 있을 것입니다.

출처 및 이미지