
英特爾對其即將推出的 Xeon 6+ E-core CPU 系列(稱為 Clearwater Forest)提供了更多見解,該系列擁有多達 288 個下一代核心。
英特爾 Clearwater Forest 新品發表:288 個新一代 Darkmont E 核心,協助高密度運算伺服器
在其前身 Sierra Forest(首款 E-Core 專用至強 CPU,提供更高的運算密度和效能效率)的基礎上,英特爾在 Clearwater Forest 上取得了重大進展。這標誌著英特爾至強產品線的顯著發展,目前已分為性能核心 (P-Core) 和高效核心 (E-Core) 兩個系列。

Clearwater Forest 標誌著 Xeon 6+ 品牌下第二代 E-Core CPU 的開始。

先進技術:Intel 18A、RibbonFET 和 Power Via,採用 Foveros Direct3D
憑藉 Clearwater Forest,英特爾正在提升其分解式架構和先進封裝解決方案。這款新晶片結構採用多層設計,包含各種晶片和組件,展現了英特爾的工程實力。

Clearwater Forest 架構採用 2.5D 封裝技術整合了 12 個 EMIB 模組。此配置連接了三個主動基礎模組、兩個 I/O 模組以及總共 12 個計算模組。 I/O 模組基於英特爾 7 節點構建,主動基礎模組採用英特爾 3 節點製程,計算晶片組則採用尖端的英特爾 18A 技術生產。

每個運算晶片均採用 Darkmont E-Core 設計,採用 18A 製程節點,該節點採用 RibbonFET 技術,透過降低閘極電容來優化功率效率。此外,18A 製程擁有超過 90% 的驚人單元密度,並有助於改善透過背面電源軌的訊號佈線,從而顯著降低 4-5% 的能耗。

RibbonFET 技術增強了電流管理並降低了漏電,從而帶來顯著的性能優勢。這項創新技術能夠在保持較低工作電壓的同時更嚴格地控制電流,從而縮短閘極長度,使每個電晶體的功耗降低 20%。

RibbonFET 技術的主要特性包括:
- 增強高密度CPU晶片元件的小型化
- 精確控制電晶體通道中的電流
- 提高每瓦性能和營運效率
- 透過色帶寬度和各種閾值電壓類型實現可調參數
PowerVia 技術與 RibbonFET 技術相得益彰,可將標準單元利用率提升高達 10%,ISO 功耗效能提升 4%。此方法可從矽片下方引導電源,進而提升晶片的整體效能。

PowerVia技術的亮點包括:
- 減少配電擁塞,提升晶片整體效能
- 重新分配間距金屬以優化佈局
- 背面晶片集成,實現高效電源管理
- 奈米級 TSV 增強配電
- 卓越的訊號路由能力
- 超過 90% 的單元密度,可優化空間利用率
此外,Clearwater Forest 將成為首個在量產中採用 Foveros Direct3D 的廠商。 Foveros Direct3D 是一種創新的封裝解決方案,能夠有效地連接基礎活動模組上的運算和 I/O 模組。該技術採用 9 微米的凸塊間距,最大限度地降低了功耗,從而實現了模組之間的高效資料傳輸。
以下 3D 構造概覽展示了 Clearwater Forest Xeon 6+ CPU 架構:

探索清水森林的三個主要地塊
Clearwater Forest 架構由三個主要模組組成:運算模組、I/O 模組和基礎模組。
清水森林 I/O 地磚
該Tile採用英特爾7代工藝,整合了兩種封裝的8個加速器,包括英特爾快速輔助技術、英特爾動態負載平衡器、英特爾資料流加速器、英特爾記憶體分析加速器,共16個加速器。

每個 I/O 模組配備 48 條 PCIe Gen 5.0 通道(共 96 條)、32 條 CXL 2.0 通道(共 64 條)和 96 條 UPI 2.0 通道(共 192 條)。雖然與 Granite Rapids 相比沒有變化,但這種設計相比 Sierra Forest 有了顯著的升級。
清水森林地磚
基礎模組 (Base Tile) 透過 EMIB 連接到上方的運算模組,採用英特爾 3 製程技術,可容納三個基礎模組。每個基礎模組包含四個 DDR5 記憶體控制器,總共 12 個記憶體通道。此外,它們為每個計算模組提供 48 MB 的共享 LLC,總計 576 MB 的封裝內 LLC。

清水森林計算瓦片
這些計算模組代表了 Clearwater Forest 最先進的技術,採用了全新的 18A 製程技術。每個計算模組由六個模組構成,每個模組承載四個 Darkmont E-Core,最終每個計算模組包含 24 個 E-Core,十二個計算模組共包含 288 個 E-Core。




此外,每個模組包含 4 MB 的 L2 緩存,相當於每個計算區塊 24 MB,12 個計算區塊總共 288 MB 的 L2 快取。與 LLC 結合使用時,整個晶片的快取容量達到 864 MB。
- 12 個計算模組(英特爾 18A)
- 3x 活動基礎磁磚(英特爾 3)
- 2 個英特爾 I/O Tiles(英特爾 7)
- 12x EMIB 瓷磚(EMIB 2.5D)
深入了解 Darkmont E-Core
現在讓我們深入研究 Panther Lake 用戶端 CPU 中也採用的 Darkmont E-Core。

雖然 Darkmont 架構與 Lunar Lake 和 Arrow Lake CPU 中的 Skymont 設計有相似之處,但它比 Crestmont 有了顯著的升級。

Darkmont 核心的顯著改進包括:更新的預測區塊(128 位元組)、增強的指令擷取功能,以及 9 寬微架構,該架構擁有更寬的解碼單元,與 Crestmont 相比,解碼簇數量增加了 50%。其他增強功能包括更大的 Uop 佇列容量和更精細的指令快取。

英特爾也增強了亂序引擎 (OOE)。它具有 8 寬分配和 16 寬退出機制,可實現更快的資源管理,同時具有更大的 416 個條目亂序視窗容量。
調度連接埠擴展至 26 個,其中標量引擎具有 8 個整數 ALU,而向量引擎包含 4 個浮點 ALU,從而優化了多個執行任務的效能。

記憶體子系統的增強反映了全面的升級:現在可以將 L2 快取頻寬增加一倍並加快 L1 到 L1 的傳輸,從而提高資料通訊效率。
透過消除外部結構資料傳輸,L2 快取現在可以直接透過 L1 快取存取資料。同時,讀取時脈頻率也從每個時脈週期 16 位元組提升至 32 位元組。

總而言之,與 144 核心 Xeon 6780E「Sierra Forest」相比,Clearwater Forest 中的 Darkmont E-Core 效能提升高達 90%,不同負載下的效率提升 23%,支援高達 8:1 的伺服器整合,同時降低整體擁有成本 (TCO)。
初始績效指標
英特爾發布了 Clearwater Forest“Xeon 6+”CPU 的初步性能統計數據,並與 144 核 Xeon 6700E“Sierra Forest”和未發布的 288 核 Xeon 6900E 晶片進行了比較。

與運行功率為 330W 的 144 核 Sierra Forest(Xeon 6780E)相比,擁有 288 個核心、TDP 為 450W 的 Clearwater Forest 變體的 TDP 降低了 36.3%,核心數量增加了一倍,性能提高了 112.7%,每瓦效率提高了 54.7%。
與 TDP 為 500W 的 288 核心 Sierra Forest 晶片相比,Clearwater Forest 的 TDP 降低了 11%,同時效能提高了 17%,每瓦效能提高了 30%。

效能提升源自於先進的 Darkmont E-Core,其 IPC 效能提升 17%。與過時的 Xeon 系統相比,Clearwater Forest 平台的效能提升了 1.9 倍,效率提升了 23%,並支援更高的伺服器整合率。
Intel Xeon 6+ CPU 和平台的規格
Clearwater Forest「至強 6+ CPU」將採用 LGA 7529 插槽,適用於單路和雙路配置。此插槽與至強 6900P「Granite Rapids-AP」 CPU 使用的插槽相同。這些晶片的 TDP 範圍為 300-500W,與擁有 144 個核心的至強 6700E 和 6900P 的運作參數一致。

這些 CPU 將支援多達 12 通道 DDR5 內存,支援高達 8000 MT/s 的速度,同時容納多達 6 個 UPI 2.0 鏈路(高達 24 GT/s)、多達 96 個 PCIe Gen 5.0 通道和多達 64 個 CXL 2.0 通道。
在安全功能方面,此架構包含英特爾軟體保護擴充 (SGX) 和英特爾信任域擴充 (TDX)。此外,英特爾的應用能耗遙測 (AET) 和 Turbo 速率限制器技術增強了電源管理。 Clearwater Forest CPU 將支援具有 VNNI 和 INT8 功能的高階向量擴充 2 (AVX2)。

總結一下,Clearwater Forest「Xeon 6+」與Sierra Forest「Xeon 6」的比較如下:
- 核心數量最多增加 2 倍
- 每核心 IPC 提升 17%
- 超過 5 倍末級緩存
- 4 個附加記憶體通道
- 另外 2 個 UPI 鏈接
- 記憶體速度提高 20%

英特爾 Clearwater Forest「Xeon 6+」CPU 預計將於 2026 年下半年推出,預計在發布前公佈更多性能數據和見解。
Intel Xeon CPU 家族概述(初步):
家族品牌 | 鑽石急流 | 清水森林 | 花崗岩急流城 | 獅子山 | 翡翠急流 | 藍寶石急流 | 冰湖-SP | 庫柏湖-SP | 卡斯卡德湖-SP/AP | Skylake-SP |
---|---|---|---|---|---|---|---|---|---|---|
行程節點 | 待定 | 英特爾 18A | 英特爾 3 | 英特爾 3 | 英特爾 7 | 英特爾 7 | 10奈米以上 | 14奈米++ | 14奈米++ | 14奈米+ |
平台名稱 | 英特爾橡樹溪 | 英特爾 Birch Stream | 英特爾 Birch Stream | 英特爾山流/英特爾樺木流 | 英特爾鷹流 | 英特爾鷹流 | 英特爾惠特利 | 英特爾雪松島 | 英特爾普利 | 英特爾普利 |
核心架構 | Panther Cove-X | 黑暗山 | 紅木灣 | 獅子山 | 猛禽灣 | 黃金灣 | 陽光灣 | 卡斯凱德湖 | 卡斯凱德湖 | Skylake |
MCP(多晶片封裝) | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 不 | 不 | 是的 | 不 |
插座 | LGA XXXX / 9324 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4677 | LGA 4677 | LGA 4189 | LGA 4189 | LGA 3647 | LGA 3647 |
最大核心數 | 待定 | 最多 288 個 | 最多 128 個 | 最多 288 個 | 最多 64 個? | 最多 56 個 | 最多 40 | 最多 28 個 | 最多 28 個 | 最多 28 個 |
最大線程數 | 待定 | 最多 288 個 | 最多 256 個 | 最多 288 個 | 最多 128 個 | 最多 112 個 | 最多 80 | 最多 56 個 | 最多 56 個 | 最多 56 個 |
最大 L3 緩存 | 待定 | 待定 | 480 MB 三級 | 108 MB L3 | 320 MB L3 | 105 MB L3 | 60 MB L3 | 38.5 MB 三級 | 38.5 MB 三級 | |
記憶體支援 | 最多 16 頻道 DDR5? | 最多 12 頻道 DDR5-8000 | 最多 12 頻道 DDR5-6400/MCR-8800 | 高達 12 頻道 DDR5-6400 | 高達 8 頻道 DDR5-5600 | 高達 8 頻道 DDR5-4800 | 高達 8 頻道 DDR4-3200 | 最多 6 頻道 DDR4-3200 | DDR4-2933 6通道 | DDR4-2666 6通道 |
PCIe Gen 支持 | PCIe 6.0? | PCIe 5.0(96頻道) | PCIe 5.0(136頻道) | PCIe 5.0(88頻道) | PCIe 5.0(80通道) | PCIe 5.0(80通道) | PCIe 4.0(64頻道) | PCIe 3.0(48頻道) | PCIe 3.0(48頻道) | PCIe 3.0(48頻道) |
TDP 範圍 (PL1) | 待定 | 高達 500W | 高達 500W | 高達 350W | 高達 350W | 高達 350W | 105-270瓦 | 150瓦-250瓦 | 165瓦-205瓦 | 140瓦-205瓦 |
3D Xpoint Optane DIMM | 待定 | 不適用 | 多納休山口 | 不適用 | 克羅帕斯 | 克羅帕斯 | 巴洛山口 | 巴洛山口 | 阿帕契山口 | 不適用 |
競賽 | AMD EPYC 威尼斯 | AMD EPYC 都靈 | AMD EPYC 都靈 | AMD EPYC 貝加莫 | AMD EPYC Genoa ~5nm | AMD EPYC Genoa ~5nm | AMD EPYC Milan 7nm+ | AMD EPYC Rome 7nm | AMD EPYC Rome 7nm | AMD EPYC 那不勒斯 14nm |
發射 | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 |
發佈留言