
인텔은 공식적으로 Xe3 그래픽 아키텍처를 발표했습니다.이 아키텍처는 곧 출시될 팬서 레이크 프로세서의 통합 GPU에 탑재될 예정이며, 가까운 미래에 Xe3P 변형을 출시할 계획입니다.
인텔, 팬서 레이크 iGPU용 Xe3 아키텍처 공개: 최대 50% 성능 향상 기대
인텔의 Xe3는 작년에 출시된 Xe2 아키텍처를 계승합니다. Xe2 아키텍처는 Lunar Lake “Core Ultra 200” CPU와 Arc B 시리즈 “Battlemage” 외장 그래픽 카드라는 두 가지 주요 제품에 통합되어 제품군을 크게 강화했습니다. Xe2 아키텍처는 이전 모델인 Xe1과 초기 Arc Alchemist A 시리즈 제품군에서 얻은 경험을 바탕으로 두 플랫폼 모두에서 성공적인 출시를 이루었습니다.



최근 소프트웨어 개선을 통해 인텔의 드라이버 지원 기능이 강화되어 게임뿐만 아니라 콘텐츠 제작, 렌더링, AI 프로세스에도 도움이 되었습니다.새롭게 출시된 Arc Pro 시리즈는 Battlemage GPU와 함께 기존 드라이버 생태계와 완벽하게 통합되었습니다.

인텔은 최근 몇 달 동안 그래픽 기술에서 상당한 발전을 이루었으며, 특히 최첨단 Xe3 아키텍처를 도입한 Panther Lake “Core Ultra 300” 시리즈가 주목을 받았습니다.
Xe3 iGPU: 차세대 Arc B 시리즈 및 Xe3P에 대한 통찰력
Xe3 아키텍처는 Xe2를 기반으로 더 큰 구성에 맞춰 그래픽 성능을 확장하고 처리량을 최적화합니다.특히 Xe3 기반 iGPU는 Arc B 시리즈로 출시될 예정입니다.
흥미롭게도, 배틀메이지 외장 GPU는 Xe2 기반인 반면, 팬서 레이크 iGPU는 Xe3 아키텍처로 전환됩니다.이러한 변화는 인텔이 내장 및 외장 옵션 모두에서 제품 스택을 통합하려는 전략적 결정을 반영합니다.

향후 개발 상황에 따르면, 업그레이드된 Xe3 아키텍처를 사용하는 Arc 제품군인 Xe3P가 개발 중이며, Xe4로 바로 넘어가는 대신 추가적인 최적화를 제공할 것으로 예상됩니다.이러한 전략적 움직임은 Xe3P가 향후 Nova Lake CPU의 개별 GPU 솔루션과 향상된 iGPU 구성 모두에 적용될 수 있음을 시사합니다.
Xe3P는 Battlemage dGPU나 Panther Lake iGPU와 함께 현재 Arc B 시리즈에 포함되지는 않지만, Arc 제품군의 다음 세대 제품, 아마도 Arc C 시리즈에 대한 기대감이 고조되고 있습니다.이러한 요소들을 명확히 했으니, 이제 Xe3 아키텍처의 세부 사항을 살펴보겠습니다.
Xe3 – iGPU 성능 및 전력 효율성 향상
Xe3 아키텍처는 렌더링 성능의 획기적인 발전을 보여줍니다.이전 Xe2는 렌더 슬라이스당 4개의 Xe 코어와 4개의 레이 트레이싱 유닛을 탑재했습니다.

반면, Xe3는 렌더 슬라이스당 6개의 Xe 코어와 6개의 레이 트레이싱 유닛을 탑재하여 50%의 성능 향상을 달성했습니다.이러한 향상된 성능을 통해 인텔은 Panther Lake SoC 내에서 다양한 GPU 타일 구성을 효율적으로 구축할 수 있습니다.

사용 가능한 구성에는 8C 및 16C WeU용 4 Xe 코어 다이와 최상위 16C 다이용으로 지정된 보다 진보된 12 Xe 코어 설정이 포함되어 Arrow Lake 및 Lunar Lake와 같은 경쟁 제품에 비해 성능 역학에서 진화를 약속합니다.

두 가지 구성에 대한 사양은 다음과 같습니다.
- 4 Xe 코어 구성:
- 4개의 Xe 코어(Xe3 아키텍처)
- 1 렌더 슬라이스
- 32개의 XMX 엔진
- 4MB L2 캐시
- 1 지오 파이프라인
- 4개의 샘플러
- 4개의 레이 트레이싱 유닛
- 2개의 픽셀 백엔드
- 12 Xe 코어 구성:
- 12개의 Xe 코어(Xe3 아키텍처)
- 2개의 렌더 슬라이스
- 96 XMX 엔진
- 16MB L2 캐시
- 2개의 지오 파이프라인
- 12개의 샘플러
- 12개의 레이 트레이싱 유닛
- 4개의 픽셀 백엔드

4Xe 구성의 경우 L2 캐시가 감소했음에도 불구하고 12Xe 모델은 16MB L2 캐시로 SoC 패브릭의 트래픽을 효과적으로 줄여 게임 시나리오에서 트래픽을 최대 36%까지 줄였습니다.

Xe3 프레임워크 내의 아키텍처 업그레이드에는 8개의 512비트 벡터 엔진과 8개의 2048비트 XMX 엔진과 같은 핵심 기능이 향상되었으며, 공유 L1/SLM 캐시가 33% 증가했습니다.

이 혁신적인 아키텍처를 통해 Xe 벡터 엔진은 가변 레지스터 할당을 지원하면서 최대 25% 더 많은 스레드를 활용할 수 있게 되었으며, 이를 통해 특히 AI 중심 작업에서 성능이 향상되었습니다.

더욱이 XMX 엔진은 AI 가속을 위해 설계되었으며, 12Xe iGPU는 최대 120 TOPs를, 4Xe iGPU는 약 40 TOPs를 구현할 수 있습니다.참고로, 이전 Xe2 아키텍처는 최대 67 TOPs를 생성했기 때문에 Xe3으로의 전환은 성능 면에서 눈에 띄는 도약을 의미합니다.

Xe3 아키텍처의 클럭당 Xe 코어 작업은 다음과 같이 자세히 설명되어 있습니다.
- XMX TF32: 1024 ops/clk
- XMX FP16: 2048 ops/clk
- XMX BF16: 2048 ops/clk
- XMX INT8: 4096 ops/clk
- XMX INT4: 8192 ops/clk
- XMX INT2: 8192 ops/clk

또한, 인텔은 비동기 레이 트레이싱을 위해 설계된 동적 레이 관리 기능을 갖춘 최첨단 레이 트레이싱 장치를 선보였습니다.이 장치에는 다중 순회 파이프라인, 삼각형 교차 장치, 그리고 BVH 캐시가 탑재되어 전반적인 성능이 향상됩니다.

새로운 URB 관리자는 부분 업데이트를 용이하게 하여 GPU의 데이터 관리 효율성을 크게 향상시킵니다.또한, 최대 2배 향상된 이방성 필터링 및 스텐실 테스트 속도를 통해 Xe3의 차별성을 더욱 강화합니다.
미디어 측면에서는 AV1 인코딩/디코딩, VVC 디코드, eDP 1.5 지원과 같은 고급 기능이 포함되어 있습니다.추가 기능으로는 AVC 10비트 지원 및 다양한 소니 XAVC 포맷과의 호환성이 있으며, 이를 통해 Panther Lake에서 Xe3의 멀티미디어 처리 성능이 더욱 향상됩니다.
Intel, Xe3로 GPU 성능 확장 및 향상 지속
인텔은 Xe3 GPU에 대한 예비 성능 평가를 공개했는데, 이는 이전 버전과 비교하여 GPU 마이크로아키텍처의 개별 세그먼트를 평가하는 마이크로벤치마크에 초점을 맞췄습니다.

Xe3에서 리소스 할당이 일정하게 유지된다는 점을 고려하면 블렌드 및 백엔드 성능의 초기 결과는 변동이 미미함을 나타냅니다.그러나 GEMM의 FP16 지표가 50%나 증가한 것은 GPU의 확장성 이점을 보여줍니다. Xe3의 크기가 Xe2를 능가하는 만큼, 이 벤치마크는 Xe3의 성능을 최대한 활용하여 이방성 렌더링 속도, 메시 렌더링 속도, 분산 읽기, 레이 트레이싱 교차 등 2배에서 2.7배까지 향상된 놀라운 아키텍처 개선을 보여줍니다.

심도 테스트 및 레지스터 중심 애플리케이션과 같은 분야에서 상당한 성과가 있었으며, 이전 세대와 비교했을 때 7배 이상의 개선이 이루어졌으며, 이는 성능 표준의 도약을 보여줍니다.

시각적으로 표현하자면, Xe3와 Xe2를 사용하여 렌더링한 프레임은 성능 향상 측면에서 이루어진 진전을 보여줍니다.

또한 인텔은 인텔 그래픽 컴파일러(IGC)를 통한 컴파일러 개선 및 성능 최적화를 위한 가변 레지스터 할당을 포함한 유용한 업데이트를 도입하여 Windows 그래픽 소프트웨어 스택을 향상시키고 있습니다.

인텔은 직접 선점을 통해 더 빠른 스케줄링 기능을 도입하여 플러싱 없이도 신속한 컨텍스트 전환을 가능하게 합니다.또한, 최신 업데이트에는 DirectX Cooperative Vector 지원이 포함되었으며, 이러한 벡터를 활용하는 인텔의 “Neural Radiance Field” 데모를 통해 시연되었습니다.

요약하자면, 인텔 Xe3 아키텍처는 현재 주류 노트북 시장에서 Radeon 880M 및 890M과 같은 주요 RDNA 3.5 iGPU와 경쟁하고 있는 Xe2에 비해 눈에 띄는 개선을 보여줍니다. Xe2가 Strix Halo와 같은 RDNA 3.5 구현과 같은 상위 계층의 성능에 완벽하게 부합하지는 않지만, 인텔과 엔비디아의 맞춤형 SoC 파트너십을 통해 이러한 격차를 메울 수 있을 것입니다.
답글 남기기