 
						인텔은 최대 288개의 차세대 코어를 자랑하는 Clearwater Forest라는 이름의 곧 출시될 Xeon 6+ E-코어 CPU 제품군에 대한 추가적인 정보를 제공했습니다.
Intel Clearwater Forest 소개: 고밀도 컴퓨팅 서버를 위한 288개의 차세대 Darkmont E-코어
인텔은 성능 효율성과 함께 향상된 컴퓨팅 밀도를 제공하는 최초의 E-코어 전용 제온 CPU였던 이전 모델인 시에라 포레스트(Sierra Forest)의 발전을 바탕으로 클리어워터 포레스트를 통해 상당한 발전을 이루고 있습니다.이는 인텔 제온 제품군에 있어 주목할 만한 발전을 의미하며, 이제 성능 코어(P-코어)와 효율 코어(E-코어)라는 별도의 제품군으로 구성됩니다.

클리어워터 포레스트는 Xeon 6+ 브랜드로 출시되는 E-Core 전용 CPU의 2세대 시작을 알립니다.

첨단 기술: Intel 18A, RibbonFET 및 Foveros Direct3D를 탑재한 Power Via
인텔은 클리어워터 포레스트를 통해 분산형 아키텍처와 첨단 패키징 솔루션을 한층 강화하고 있습니다.이 새로운 칩 구조는 다양한 칩렛과 구성 요소를 갖춘 다층 설계를 채택하여 인텔의 엔지니어링 역량을 과시합니다.

클리어워터 포레스트 아키텍처는 2.5D 패키징 기술을 사용하여 12개의 EMIB 타일을 통합합니다.이 구성은 3개의 활성 기반 타일, 2개의 I/O 타일, 그리고 총 12개의 컴퓨팅 타일을 연결합니다. I/O 타일은 인텔 7 노드 기반으로, 활성 기반 타일은 인텔 3 프로세스 노드를 활용하며, 컴퓨팅 칩렛은 최첨단 인텔 18A 기술로 제작됩니다.

Darkmont E-Core 설계를 적용한 각 컴퓨팅 칩렛은 RibbonFET 기술을 사용하는 18A 공정 노드를 사용하여 제작되었으며, 게이트 커패시턴스 감소를 통해 전력 효율을 최적화합니다.또한, 18A 공정은 90% 이상의 뛰어난 셀 밀도를 자랑하며, 후면 전원 레일을 통한 신호 라우팅을 개선하여 에너지 손실을 4~5%까지 크게 최소화합니다.

RibbonFET 기술은 전류 관리를 향상시키고 누설 전력을 줄여 눈에 띄는 성능 향상을 제공합니다.이 혁신 기술은 더 낮은 동작 전압을 유지하면서 전류를 더욱 정밀하게 제어할 수 있게 해줍니다.결과적으로 게이트 길이가 짧아져 트랜지스터당 전력 소비량이 20% 감소합니다.

RibbonFET 기술의 주요 특징은 다음과 같습니다.
- 고밀도 CPU를 위한 칩 부품의 향상된 소형화
- 트랜지스터 채널의 전류에 대한 정밀한 제어
- 와트당 성능 및 운영 효율성 향상
- 리본 폭과 다양한 임계 전압 유형을 통해 조정 가능한 매개변수가 활성화됩니다.
PowerVia 기술은 표준 셀 활용도를 최대 10%, ISO 전력 성능을 4% 향상시켜 RibbonFET을 보완합니다.이러한 방식은 실리콘 하부에서 전력을 공급하여 전반적인 칩 성능을 향상시킵니다.

PowerVia 기술의 주요 특징은 다음과 같습니다.
- 전력 분배 혼잡 감소로 전체 칩 성능 향상
- 레이아웃을 최적화하기 위한 코스 피치 금속 재분배
- 효율적인 전력 관리를 위한 뒷면 다이 통합
- 향상된 전력 분배를 위한 나노 스케일 TSV
- 뛰어난 신호 라우팅 기능
- 최적화된 공간 활용을 위한 90% 이상의 셀 밀도
또한, Clearwater Forest는 대량 생산 분야에서 최초로 Foveros Direct3D를 사용할 예정입니다. Foveros Direct3D는 기본 활성 타일에서 컴퓨팅 타일과 I/O 타일을 효과적으로 연결하는 혁신적인 패키징 솔루션입니다.이 기술은 9um 범프 피치로 전력 소비를 최소화하여 타일 간 효율적인 데이터 전송을 가능하게 합니다.
다음 3D 구조 개요는 Clearwater Forest Xeon 6+ CPU 아키텍처를 보여줍니다.

클리어워터 숲의 세 가지 주요 타일 탐험
클리어워터 포레스트 아키텍처는 컴퓨팅 타일, I/O 타일, 기본 타일의 세 가지 주요 타일로 구성됩니다.
클리어워터 포레스트 I/O 타일
이 타일은 Intel 7 프로세스 기술을 활용하고 Intel Quick Assist Technology, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator, Intel In-Memory Analytics Accelerator를 포함하여 두 패키지에 걸쳐 8개의 가속기를 통합하여 총 16개의 가속기를 제공합니다.

각 I/O 타일에는 PCIe Gen 5.0 레인 48개(총 96개), CXL 2.0 레인 32개(총 64개), UPI 2.0 레인 96개(총 192개)가 장착되어 있습니다. Granite Rapids와 동일하지만, 이 디자인은 Sierra Forest에 비해 상당히 업그레이드되었습니다.
클리어워터 포레스트 베이스 타일
EMIB를 통해 위의 컴퓨트 타일에 연결된 베이스 타일은 Intel 3 공정 기술을 사용하여 세 개의 베이스 타일을 수용합니다.각 베이스 타일에는 DDR5 메모리 컨트롤러가 4개씩 포함되어 총 12개의 메모리 채널을 제공합니다.또한, 각 컴퓨트 타일에 48MB의 공유 LLC를 제공하여 총 576MB의 온패키지 LLC를 제공합니다.

클리어워터 포레스트 컴퓨트 타일
컴퓨팅 타일은 새로운 18A 공정 기술을 탑재한 Clearwater Forest의 최첨단 기술을 보여줍니다.각 타일은 6개의 모듈로 구성되어 있으며, 각 모듈은 4개의 Darkmont E-Core를 호스팅하여, 각 컴퓨팅 타일당 24개의 E-Core, 총 12개의 타일에 288개의 E-Core를 제공합니다.




또한 각 모듈에는 4MB의 L2 캐시가 포함되어 있어 컴퓨팅 타일당 24MB, 12개 타일 전체에 걸쳐 총 288MB의 L2 캐시를 제공합니다. LLC와 결합하면 전체 칩의 캐시 용량은 864MB에 달합니다.
- 12x 컴퓨팅 타일(Intel 18A)
- 3x 활성 기본 타일(Intel 3)
- 2x Intel I/O 타일(Intel 7)
- 12x EMIB 타일(EMIB 2.5D)
Darkmont E-Core에 대한 심층 분석
이제 Panther Lake 클라이언트 CPU에도 사용되는 Darkmont E-Core에 대해 더 자세히 알아보겠습니다.

Darkmont 아키텍처는 Lunar Lake와 Arrow Lake CPU에 적용된 Skymont 디자인과 유사하지만, Crestmont에 비해 상당히 업그레이드된 제품입니다.

Darkmont 코어의 주요 개선 사항으로는 128바이트로 업데이트된 예측 블록, 향상된 명령어 페칭, 그리고 Crestmont보다 50% 더 많은 디코드 클러스터를 포함하는 더 넓은 디코드 유닛을 자랑하는 9-와이드 마이크로아키텍처가 있습니다.또한 Uop 큐 용량 증가와 더욱 정교해진 명령어 캐시도 개선되었습니다.

인텔은 또한 비순차 엔진(OOE)을 강화했습니다.8개 항목의 할당과 16개 항목의 폐기 메커니즘을 통해 더욱 빠른 리소스 관리를 제공하며, 416개 항목의 비순차 윈도우 용량도 더욱 확장되었습니다.
디스패치 포트가 26개로 확장되었으며, 스칼라 엔진은 정수 ALU 8개를 탑재하고 벡터 엔진은 부동 소수점 ALU 4개를 포함하여 여러 실행 작업에 걸쳐 성능을 최적화했습니다.

메모리 하위 시스템 개선 사항은 포괄적인 업그레이드를 반영합니다. L2 캐시 대역폭이 두 배로 늘어나고 L1에서 L1로의 전송이 빨라져 데이터 통신 효율성이 향상되었습니다.
외부 패브릭 데이터 전송이 제거됨에 따라 L2 캐시는 이제 L1 캐시를 통해 데이터에 직접 액세스할 수 있습니다.또한, 클록 속도도 매 클록 사이클마다 16바이트에서 32바이트로 향상되었습니다.

결론적으로, 클리어워터 포레스트에서 사용된 Darkmont E-Core는 144코어 Xeon 6780E ‘Sierra Forest’에 비해 최대 90%의 성능 향상을 제공하며, 다양한 부하에 걸쳐 효율성을 23% 높이고 총 소유 비용(TCO)을 낮추면서 최대 8:1의 서버 통합을 지원합니다.
초기 성과 지표
인텔은 클리어워터 포레스트 ‘Xeon 6+’ CPU에 대한 예비 성능 통계를 공개하면서, 144코어 Xeon 6700E ‘시에라 포레스트’와 출시되지 않은 288코어 Xeon 6900E 칩과의 비교를 제시했습니다.

330W에서 작동하는 144코어 Sierra Forest(Xeon 6780E)와 대조적으로, 288개 코어와 450W TDP를 갖춘 Clearwater Forest 모델은 놀랍게도 TDP가 36.3% 낮고 코어 수는 두 배로 늘어나 성능이 112.7% 향상되고 와트당 효율성이 54.7% 향상되었습니다.
500W의 TDP를 관리하는 288코어 Sierra Forest 칩과 비교했을 때, Clearwater Forest는 11% 더 낮은 TDP를 유지하면서도 17% 더 나은 성능과 와트당 30% 증가된 성능을 제공합니다.

이러한 향상된 성능은 IPC를 17% 향상시키는 첨단 Darkmont E-Core 덕분에 가능합니다. Clearwater Forest 플랫폼은 이를 통해 기존 Xeon 시스템 대비 1.9배 향상된 성능과 23% 향상된 효율성을 제공하며, 상당한 서버 통합 비율을 지원합니다.
Intel Xeon 6+ CPU 및 플랫폼 사양
클리어워터 포레스트 “Xeon 6+ CPU”는 1S 및 2S 구성 모두에 적용 가능한 LGA 7529 소켓을 사용합니다.이는 Xeon 6900P ‘Granite Rapids-AP’ CPU에 사용되는 소켓과 동일합니다.이 칩은 300~500W의 TDP 범위에서 작동하며, 144개의 코어를 탑재한 Xeon 6700E 및 6900P의 작동 매개변수를 반영합니다.

이러한 CPU는 최대 6개의 UPI 2.0 링크(최대 24GT/s), 최대 96개의 PCIe Gen 5.0 레인, 최대 64개의 CXL 2.0 레인을 수용하는 것과 함께 최대 8000MT/s의 속도를 지원하는 최대 12채널 DDR5 메모리를 제공합니다.
보안 기능 측면에서 이 아키텍처는 인텔 소프트웨어 가드 익스텐션(SGX)과 인텔 트러스트 도메인 익스텐션(TDX)을 포함합니다.또한, 인텔의 애플리케이션 에너지 텔레메트리(AET)와 터보 레이트 리미터(Turbo Rate Limiter) 기술을 통해 전력 관리가 강화됩니다.클리어워터 포레스트 CPU는 VNNI 및 INT8 기능을 갖춘 AVX2(Advanced Vector Extensions 2)를 지원합니다.

요약하자면 Clearwater Forest “Xeon 6+”가 Sierra Forest “Xeon 6″과 비교했을 때 어떤 성능을 보이는지 살펴보겠습니다.
- 최대 2배의 코어 수
- 코어당 IPC 17% 향상
- 5배 이상의 마지막 레벨 캐시
- 4개의 추가 메모리 채널
- UPI 링크 2개 더
- 메모리 속도 20% 증가

인텔의 Clearwater Forest “Xeon 6+” CPU는 2026년 하반기에 출시될 예정이며, 출시에 앞서 추가적인 성능 데이터와 통찰력이 공개될 것으로 예상됩니다.
Intel Xeon CPU 제품군 개요(예비):
| 가족 브랜딩 | 다이아몬드 래피즈 | 클리어워터 숲 | 그래닛 래피즈 | 시에라 포레스트 | 에메랄드 래피즈 | 사파이어 래피즈 | 아이스 레이크-SP | 쿠퍼 레이크-SP | 캐스케이드 호수-SP/AP | 스카이레이크-SP | 
|---|---|---|---|---|---|---|---|---|---|---|
| 프로세스 노드 | 미정 | 인텔 18A | 인텔 3 | 인텔 3 | 인텔 7 | 인텔 7 | 10nm+ | 14nm++ | 14nm++ | 14nm+ | 
| 플랫폼 이름 | 인텔 오크 스트림 | 인텔 버치 스트림 | 인텔 버치 스트림 | 인텔 마운틴 스트림/인텔 버치 스트림 | 인텔 이글 스트림 | 인텔 이글 스트림 | 인텔 휘틀리 | 인텔 시더 아일랜드 | 인텔 퍼리 | 인텔 퍼리 | 
| 핵심 아키텍처 | 팬서 코브-X | 다크몬트 | 레드우드 코브 | 시에라 글렌 | 랩터 코브 | 골든 코브 | 서니 코브 | 캐스케이드 호수 | 캐스케이드 호수 | 스카이레이크 | 
| MCP(멀티칩 패키지) WeUs | 예 | 예 | 예 | 예 | 예 | 예 | 아니요 | 아니요 | 예 | 아니요 | 
| 소켓 | LGA XXXX / 9324 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4677 | LGA 4677 | LGA 4189 | LGA 4189 | LGA 3647 | LGA 3647 | 
| 최대 코어 수 | 미정 | 최대 288개 | 최대 128개 | 최대 288개 | 최대 64개? | 최대 56개 | 최대 40개 | 최대 28개 | 최대 28개 | 최대 28개 | 
| 최대 스레드 수 | 미정 | 최대 288개 | 최대 256개 | 최대 288개 | 최대 128개 | 최대 112개 | 최대 80개 | 최대 56개 | 최대 56개 | 최대 56개 | 
| 최대 L3 캐시 | 미정 | 미정 | 480MB L3 | 108MB L3 | 320MB L3 | 105MB L3 | 60MB L3 | 38.5MB L3 | 38.5MB L3 | |
| 메모리 지원 | 최대 16채널 DDR5? | 최대 12채널 DDR5-8000 | 최대 12채널 DDR5-6400/MCR-8800 | 최대 12채널 DDR5-6400 | 최대 8채널 DDR5-5600 | 최대 8채널 DDR5-4800 | 최대 8채널 DDR4-3200 | 최대 6채널 DDR4-3200 | DDR4-2933 6채널 | DDR4-2666 6채널 | 
| PCIe Gen 지원 | PCIe 6.0? | PCIe 5.0(96개 레인) | PCIe 5.0(136개 레인) | PCIe 5.0(88개 레인) | PCIe 5.0(80개 레인) | PCIe 5.0(80개 레인) | PCIe 4.0(64개 레인) | PCIe 3.0(48개 레인) | PCIe 3.0(48개 레인) | PCIe 3.0(48개 레인) | 
| TDP 범위(PL1) | 미정 | 최대 500W | 최대 500W | 최대 350W | 최대 350W | 최대 350W | 105-270W | 150W-250W | 165W-205W | 140W-205W | 
| 3D Xpoint Optane DIMM | 미정 | 해당 없음 | 도나휴 고개 | 해당 없음 | 크로우 패스 | 크로우 패스 | 바로우 패스 | 바로우 패스 | 아파치 패스 | 해당 없음 | 
| 경쟁 | AMD EPYC 베니스 | AMD EPYC 토리노 | AMD EPYC 토리노 | AMD EPYC 베르가모 | AMD EPYC 제노아 ~5nm | AMD EPYC 제노아 ~5nm | AMD EPYC 밀란 7nm+ | AMD EPYC 로마 7nm | AMD EPYC 로마 7nm | AMD EPYC 네이플스 14nm | 
| 시작하다 | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 | 
 
		   
		   
		   
		  
답글 남기기