英特爾 Clearwater Forest “Xeon 6+” 處理器深度分析:配備多達 288 個 Darkmont E 核心、576 MB 快取和 18A,並採用 Foveros D3D + EMIB 2.5D 技術

英特爾 Clearwater Forest “Xeon 6+” 處理器深度分析:配備多達 288 個 Darkmont E 核心、576 MB 快取和 18A,並採用 Foveros D3D + EMIB 2.5D 技術

英特爾對其即將推出的 Xeon 6+ E-core CPU 系列(稱為 Clearwater Forest)提供了更多見解,該系列擁有多達 288 個下一代核心。

英特爾 Clearwater Forest 新品發表:288 個新一代 Darkmont E 核心,協助高密度運算伺服器

在其前身 Sierra Forest(首款 E-Core 專用至強 CPU,提供更高的運算密度和效能效率)的基礎上,英特爾在 Clearwater Forest 上取得了重大進展。這標誌著英特爾至強產品線的顯著發展,目前已分為性能核心 (P-Core) 和高效核心 (E-Core) 兩個系列。

微晶片背景上,英特爾標誌位於「資料中心戰略概述」旁。

Clearwater Forest 標誌著 Xeon 6+ 品牌下第二代 E-Core CPU 的開始。

推出英特爾至強 6+ 和英特爾至強 6 CPU,之前代號為 Granite Rapids 和 Sierra Forest。

先進技術:Intel 18A、RibbonFET 和 Power Via,採用 Foveros Direct3D

憑藉 Clearwater Forest,英特爾正在提升其分解式架構和先進封裝解決方案。這款新晶片結構採用多層設計,包含各種晶片和組件,展現了英特爾的工程實力。

英特爾 Clearwater Forest 伺服器 CPU 詳細資料螢幕,具有 288 個 E 核心和英特爾 18A 等功能。

Clearwater Forest 架構採用 2.5D 封裝技術整合了 12 個 EMIB 模組。此配置連接了三個主動基礎模組、兩個 I/O 模組以及總共 12 個計算模組。 I/O 模組基於英特爾 7 節點構建,主動基礎模組採用英特爾 3 節點製程,計算晶片組則採用尖端的英特爾 18A 技術生產。

Clearwater Forest 架構圖顯示了具有 Intel 18A 和其他組件的 12x Compute tile。

每個運算晶片均採用 Darkmont E-Core 設計,採用 18A 製程節點,該節點採用 RibbonFET 技術,透過降低閘極電容來優化功率效率。此外,18A 製程擁有超過 90% 的驚人單元密度,並有助於改善透過背面電源軌的訊號佈線,從而顯著降低 4-5% 的能耗。

英特爾 18A 製程資訊圖突顯了更高單元密度等優勢。

RibbonFET 技術增強了電流管理並降低了漏電,從而帶來顯著的性能優勢。這項創新技術能夠在保持較低工作電壓的同時更嚴格地控制電流,從而縮短閘極長度,使每個電晶體的功耗降低 20%。

RibbonFET 技術圖表突顯了電流控制等功能。

RibbonFET 技術的主要特性包括:

  • 增強高密度CPU晶片元件的小型化
  • 精確控制電晶體通道中的電流
  • 提高每瓦性能和營運效率
  • 透過色帶寬度和各種閾值電壓類型實現可調參數

PowerVia 技術與 RibbonFET 技術相得益彰,可將標準單元利用率提升高達 10%,ISO 功耗效能提升 4%。此方法可從矽片下方引導電源,進而提升晶片的整體效能。

英特爾 PowerVia 圖表概述了主要特性。

PowerVia技術的亮點包括:

  • 減少配電擁塞,提升晶片整體效能
  • 重新分配間距金屬以優化佈局
  • 背面晶片集成,實現高效電源管理
  • 奈米級 TSV 增強配電
  • 卓越的訊號路由能力
  • 超過 90% 的單元密度,可優化空間利用率

此外,Clearwater Forest 將成為首個在量產中採用 Foveros Direct3D 的廠商。 Foveros Direct3D 是一種創新的封裝解決方案,能夠有效地連接基礎活動模組上的運算和 I/O 模組。該技術採用 9 微米的凸塊間距,最大限度地降低了功耗,從而實現了模組之間的高效資料傳輸。

以下 3D 構造概覽展示了 Clearwater Forest Xeon 6+ CPU 架構:

帶有標記晶片的英特爾 Clearwater Forest 3D 構造圖。

探索清水森林的三個主要地塊

Clearwater Forest 架構由三個主要模組組成:運算模組、I/O 模組和基礎模組。

清水森林 I/O 地磚

該Tile採用英特爾7代工藝,整合了兩種封裝的8個加速器,包括英特爾快速輔助技術、英特爾動態負載平衡器、英特爾資料流加速器、英特爾記憶體分析加速器,共16個加速器。

英特爾 I/O Tile 架構圖,展示了技術細節。

每個 I/O 模組配備 48 條 PCIe Gen 5.0 通道(共 96 條)、32 條 CXL 2.0 通道(共 64 條)和 96 條 UPI 2.0 通道(共 192 條)。雖然與 Granite Rapids 相比沒有變化,但這種設計相比 Sierra Forest 有了顯著的升級。

清水森林地磚

基礎模組 (Base Tile) 透過 EMIB 連接到上方的運算模組,採用英特爾 3 製程技術,可容納三個基礎模組。每個基礎模組包含四個 DDR5 記憶體控制器,總共 12 個記憶體通道。此外,它們為每個計算模組提供 48 MB 的共享 LLC,總計 576 MB 的封裝內 LLC。

清水森林計算瓦片

這些計算模組代表了 Clearwater Forest 最先進的技術,採用了全新的 18A 製程技術。每個計算模組由六個模組構成,每個模組承載四個 Darkmont E-Core,最終每個計算模組包含 24 個 E-Core,十二個計算模組共包含 288 個 E-Core。

英特爾技術之旅幻燈片展示了運算模組架構,其中包含模組和 E 核心的詳細資訊。
英特爾計算模組架構資訊圖展示了其規格。
英特爾運算模組架構突顯核心規格。
英特爾計算模組架構圖詳細介紹了 Darkmont E 核心。

此外,每個模組包含 4 MB 的 L2 緩存,相當於每個計算區塊 24 MB,12 個計算區塊總共 288 MB 的 L2 快取。與 LLC 結合使用時,整個晶片的快取容量達到 864 MB。

  • 12 個計算模組(英特爾 18A)
  • 3x 活動基礎磁磚(英特爾 3)
  • 2 個英特爾 I/O Tiles(英特爾 7)
  • 12x EMIB 瓷磚(EMIB 2.5D)

深入了解 Darkmont E-Core

現在讓我們深入研究 Panther Lake 用戶端 CPU 中也採用的 Darkmont E-Core。

英特爾研究員史蒂芬‧羅賓遜 (Stephen Robinson) 製作的英特爾幻燈片,題為「Darkmont E-core Deep Dive」。

雖然 Darkmont 架構與 Lunar Lake 和 Arrow Lake CPU 中的 Skymont 設計有相似之處,但它比 Crestmont 有了顯著的升級。

英特爾圖表標題為“Darkmont E-core”,帶有標記部分。

Darkmont 核心的顯著改進包括:更新的預測區塊(128 位元組)、增強的指令擷取功能,以及 9 寬微架構,該架構擁有更寬的解碼單元,與 Crestmont 相比,解碼簇數量增加了 50%。其他增強功能包括更大的 Uop 佇列容量和更精細的指令快取。

英特爾 Darkmont E-core 亂序引擎圖,突出顯示了分配和退出功能。

英特爾也增強了亂序引擎 (OOE)。它具有 8 寬分配和 16 寬退出機制,可實現更快的資源管理,同時具有更大的 416 個條目亂序視窗容量。

調度連接埠擴展至 26 個,其中標量引擎具有 8 個整數 ALU,而向量引擎包含 4 個浮點 ALU,從而優化了多個執行任務的效能。

英特爾執行引擎展示 Darkmont E-core 的功能。

記憶體子系統的增強反映了全面的升級:現在可以將 L2 快取頻寬增加一倍並加快 L1 到 L1 的傳輸,從而提高資料通訊效率。

透過消除外部結構資料傳輸,L2 快取現在可以直接透過 L1 快取存取資料。同時,讀取時脈頻率也從每個時脈週期 16 位元組提升至 32 位元組。

Crestmont 和 Darkmont E-Core 架構比較圖。

總而言之,與 144 核心 Xeon 6780E「Sierra Forest」相比,Clearwater Forest 中的 Darkmont E-Core 效能提升高達 90%,不同負載下的效率提升 23%,支援高達 8:1 的伺服器整合,同時降低整體擁有成本 (TCO)。

初始績效指標

英特爾發布了 Clearwater Forest“Xeon 6+”CPU 的初步性能統計數據,並與 144 核 Xeon 6700E“Sierra Forest”和未發布的 288 核 Xeon 6900E 晶片進行了比較。

圖表比較了 Clearwater Forest 和 Sierra Forest 的性能指標。

與運行功率為 330W 的 144 核 Sierra Forest(Xeon 6780E)相比,擁有 288 個核心、TDP 為 450W 的 Clearwater Forest 變體的 TDP 降低了 36.3%,核心數量增加了一倍,性能提高了 112.7%,每瓦效率提高了 54.7%。

與 TDP 為 500W 的 288 核心 Sierra Forest 晶片相比,Clearwater Forest 的 TDP 降低了 11%,同時效能提高了 17%,每瓦效能提高了 30%。

Darkmont 與 Crestmont CPU 的效能與效率指標。

效能提升源自於先進的 Darkmont E-Core,其 IPC 效能提升 17%。與過時的 Xeon 系統相比,Clearwater Forest 平台的效能提升了 1.9 倍,效率提升了 23%,並支援更高的伺服器整合率。

Intel Xeon 6+ CPU 和平台的規格

Clearwater Forest「至強 6+ CPU」將採用 LGA 7529 插槽,適用於單路和雙路配置。此插槽與至強 6900P「Granite Rapids-AP」 CPU 使用的插槽相同。這些晶片的 TDP 範圍為 300-500W,與擁有 144 個核心的至強 6700E 和 6900P 的運作參數一致。

螢幕突出顯示英特爾 Clearwater Forest 技術規格和功能。

這些 CPU 將支援多達 12 通道 DDR5 內存,支援高達 8000 MT/s 的速度,同時容納多達 6 個 UPI 2.0 鏈路(高達 24 GT/s)、多達 96 個 PCIe Gen 5.0 通道和多達 64 個 CXL 2.0 通道。

在安全功能方面,此架構包含英特爾軟體保護擴充 (SGX) 和英特爾信任域擴充 (TDX)。此外,英特爾的應用能耗遙測 (AET) 和 Turbo 速率限制器技術增強了電源管理。 Clearwater Forest CPU 將支援具有 VNNI 和 INT8 功能的高階向量擴充 2 (AVX2)。

Intel Xeon 6+ 具有 288 個 E 核心和 DDR5 記憶體功能。

總結一下,Clearwater Forest「Xeon 6+」與Sierra Forest「Xeon 6」的比較如下:

  • 核心數量最多增加 2 倍
  • 每核心 IPC 提升 17%
  • 超過 5 倍末級緩存
  • 4 個附加記憶體通道
  • 另外 2 個 UPI 鏈接
  • 記憶體速度提高 20%
英特爾® Xeon 6700E 與 Clearwater Forest 規格的比較。

英特爾 Clearwater Forest「Xeon 6+」CPU 預計將於 2026 年下半年推出,預計在發布前公佈更多性能數據和見解。

Intel Xeon CPU 家族概述(初步):

家族品牌 鑽石急流 清水森林 花崗岩急流城 獅子山 翡翠急流 藍寶石急流 冰湖-SP 庫柏湖-SP 卡斯卡德湖-SP/AP Skylake-SP
行程節點 待定 英特爾 18A 英特爾 3 英特爾 3 英特爾 7 英特爾 7 10奈米以上 14奈米++ 14奈米++ 14奈米+
平台名稱 英特爾橡樹溪 英特爾 Birch Stream 英特爾 Birch Stream 英特爾山流/英特爾樺木流 英特爾鷹流 英特爾鷹流 英特爾惠特利 英特爾雪松島 英特爾普利 英特爾普利
核心架構 Panther Cove-X 黑暗山 紅木灣 獅子山 猛禽灣 黃金灣 陽光灣 卡斯凱德湖 卡斯凱德湖 Skylake
MCP(多晶片封裝) 是的 是的 是的 是的 是的 是的 是的
插座 LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
最大核心數 待定 最多 288 個 最多 128 個 最多 288 個 最多 64 個? 最多 56 個 最多 40 最多 28 個 最多 28 個 最多 28 個
最大線程數 待定 最多 288 個 最多 256 個 最多 288 個 最多 128 個 最多 112 個 最多 80 最多 56 個 最多 56 個 最多 56 個
最大 L3 緩存 待定 待定 480 MB 三級 108 MB L3 320 MB L3 105 MB L3 60 MB L3 38.5 MB 三級 38.5 MB 三級
記憶體支援 最多 16 頻道 DDR5? 最多 12 頻道 DDR5-8000 最多 12 頻道 DDR5-6400/MCR-8800 高達 12 頻道 DDR5-6400 高達 8 頻道 DDR5-5600 高達 8 頻道 DDR5-4800 高達 8 頻道 DDR4-3200 最多 6 頻道 DDR4-3200 DDR4-2933 6通道 DDR4-2666 6通道
PCIe Gen 支持 PCIe 6.0? PCIe 5.0(96頻道) PCIe 5.0(136頻道) PCIe 5.0(88頻道) PCIe 5.0(80通道) PCIe 5.0(80通道) PCIe 4.0(64頻道) PCIe 3.0(48頻道) PCIe 3.0(48頻道) PCIe 3.0(48頻道)
TDP 範圍 (PL1) 待定 高達 500W 高達 500W 高達 350W 高達 350W 高達 350W 105-270瓦 150瓦-250瓦 165瓦-205瓦 140瓦-205瓦
3D Xpoint Optane DIMM 待定 不適用 多納休山口 不適用 克羅帕斯 克羅帕斯 巴洛山口 巴洛山口 阿帕契山口 不適用
競賽 AMD EPYC 威尼斯 AMD EPYC 都靈 AMD EPYC 都靈 AMD EPYC 貝加莫 AMD EPYC Genoa ~5nm AMD EPYC Genoa ~5nm AMD EPYC Milan 7nm+ AMD EPYC Rome 7nm AMD EPYC Rome 7nm AMD EPYC 那不勒斯 14nm
發射 2025-2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *