
英特尔对其即将推出的 Xeon 6+ E-core CPU 系列(称为 Clearwater Forest)提供了更多见解,该系列拥有多达 288 个下一代核心。
英特尔 Clearwater Forest 新品发布:288 个下一代 Darkmont E 核心,助力高密度计算服务器
在其前身 Sierra Forest(首款 E-Core 专用至强 CPU,提供更高的计算密度和性能效率)的基础上,英特尔在 Clearwater Forest 上取得了重大进展。这标志着英特尔至强产品线的显著发展,目前已分为性能核心 (P-Core) 和高效核心 (E-Core) 两个系列。

Clearwater Forest 标志着 Xeon 6+ 品牌下第二代 E-Core CPU 的开始。

先进技术:英特尔 18A、RibbonFET 和 Power Via,采用 Foveros Direct3D
凭借 Clearwater Forest,英特尔正在提升其分解式架构和先进封装解决方案。这款新芯片结构采用多层设计,包含各种芯片和组件,展现了英特尔的工程实力。

Clearwater Forest 架构采用 2.5D 封装技术集成了 12 个 EMIB 模块。此配置连接了三个有源基础模块、两个 I/O 模块以及总共 12 个计算模块。I/O 模块基于英特尔 7 节点构建,有源基础模块采用英特尔 3 节点制程,计算芯片组则采用尖端的英特尔 18A 技术生产。

每个计算芯片均采用 Darkmont E-Core 设计,采用 18A 工艺节点,该节点采用 RibbonFET 技术,通过降低栅极电容来优化功率效率。此外,18A 工艺拥有超过 90% 的惊人单元密度,并有助于改善通过背面电源轨的信号布线,从而显著降低 4-5% 的能耗。

RibbonFET 技术增强了电流管理并降低了漏电,从而带来显著的性能优势。这项创新技术能够在保持较低工作电压的同时更严格地控制电流,从而缩短栅极长度,使每个晶体管的功耗降低 20%。

RibbonFET 技术的主要特性包括:
- 增强高密度CPU芯片元件的小型化
- 精确控制晶体管通道中的电流
- 提高每瓦性能和运营效率
- 通过色带宽度和各种阈值电压类型实现可调参数
PowerVia 技术与 RibbonFET 技术相得益彰,可将标准单元利用率提升高达 10%,ISO 功耗性能提升 4%。这种方法可从硅片下方引导电源,从而提升芯片的整体性能。

PowerVia技术的亮点包括:
- 减少配电拥塞,提升芯片整体性能
- 重新分配间距金属以优化布局
- 背面芯片集成,实现高效电源管理
- 纳米级 TSV 增强配电
- 卓越的信号路由能力
- 超过 90% 的单元密度,可优化空间利用率
此外,Clearwater Forest 将成为首个在量产中采用 Foveros Direct3D 的厂商。Foveros Direct3D 是一种创新的封装解决方案,能够有效地连接基础活动模块上的计算和 I/O 模块。该技术采用 9 微米的凸块间距,最大限度地降低了功耗,从而实现了模块之间的高效数据传输。
以下 3D 构造概览展示了 Clearwater Forest Xeon 6+ CPU 架构:

探索清水森林的三个主要地块
Clearwater Forest 架构由三个主要模块组成:计算模块、I/O 模块和基础模块。
清水森林 I/O 地砖
该Tile采用英特尔7代工艺,集成了两种封装的8个加速器,包括英特尔快速辅助技术、英特尔动态负载均衡器、英特尔数据流加速器、英特尔内存分析加速器,共计16个加速器。

每个 I/O 模块配备 48 条 PCIe Gen 5.0 通道(共计 96 条)、32 条 CXL 2.0 通道(共计 64 条)和 96 条 UPI 2.0 通道(共计 192 条)。虽然与 Granite Rapids 相比没有变化,但这种设计相比 Sierra Forest 有了显著的升级。
清水森林地砖
基础模块 (Base Tile) 通过 EMIB 连接到上方的计算模块,采用英特尔 3 工艺技术,可容纳三个基础模块。每个基础模块包含四个 DDR5 内存控制器,总共 12 个内存通道。此外,它们为每个计算模块提供 48 MB 的共享 LLC,总计 576 MB 的封装内 LLC。

清水森林计算瓦片
这些计算模块代表了 Clearwater Forest 最先进的技术,采用了全新的 18A 制程技术。每个计算模块由六个模块构成,每个模块承载四个 Darkmont E-Core,最终每个计算模块包含 24 个 E-Core,十二个计算模块共包含 288 个 E-Core。




此外,每个模块包含 4 MB 的 L2 缓存,相当于每个计算块 24 MB,12 个计算块总共 288 MB 的 L2 缓存。与 LLC 结合使用时,整个芯片的缓存容量达到 864 MB。
- 12 个计算模块(英特尔 18A)
- 3x 活动基础瓷砖(英特尔 3)
- 2 个英特尔 I/O Tiles(英特尔 7)
- 12x EMIB 瓷砖(EMIB 2.5D)
深入了解 Darkmont E-Core
现在让我们深入研究一下 Panther Lake 客户端 CPU 中也采用的 Darkmont E-Core。

虽然 Darkmont 架构与 Lunar Lake 和 Arrow Lake CPU 中的 Skymont 设计有相似之处,但它比 Crestmont 有了显著的升级。

Darkmont 核心的显著改进包括:更新后的预测块(128 字节)、增强的指令提取功能,以及 9 宽微架构,该架构拥有更宽的解码单元,与 Crestmont 相比,解码簇数量增加了 50%。其他增强功能包括更大的 Uop 队列容量和更精细的指令缓存。

英特尔还增强了乱序引擎 (OOE)。它具有 8 宽分配和 16 宽退出机制,可实现更快的资源管理,同时具有更大的 416 个条目乱序窗口容量。
调度端口扩展至 26 个,其中标量引擎具有 8 个整数 ALU,而矢量引擎包含 4 个浮点 ALU,从而优化了多个执行任务的性能。

内存子系统的增强反映了全面的升级:现在可以将 L2 缓存带宽增加一倍并加快 L1 到 L1 的传输,从而提高数据通信效率。
通过消除外部结构数据传输,L2 缓存现在可以直接通过 L1 缓存访问数据。同时,读取时钟频率也从每个时钟周期 16 字节提升至 32 字节。

总而言之,与 144 核 Xeon 6780E“Sierra Forest”相比,Clearwater Forest 中的 Darkmont E-Core 性能提升高达 90%,不同负载下的效率提升 23%,支持高达 8:1 的服务器整合,同时降低总体拥有成本 (TCO)。
初始绩效指标
英特尔发布了 Clearwater Forest“Xeon 6+”CPU 的初步性能统计数据,并与 144 核 Xeon 6700E“Sierra Forest”和未发布的 288 核 Xeon 6900E 芯片进行了比较。

与运行功率为 330W 的 144 核 Sierra Forest(Xeon 6780E)相比,拥有 288 个核心、TDP 为 450W 的 Clearwater Forest 变体的 TDP 降低了 36.3%,核心数量增加了一倍,性能提高了 112.7%,每瓦效率提高了 54.7%。
与 TDP 为 500W 的 288 核 Sierra Forest 芯片相比,Clearwater Forest 的 TDP 降低了 11%,同时性能提高了 17%,每瓦性能提高了 30%。

性能提升源于先进的 Darkmont E-Core,其 IPC 性能提升 17%。与过时的 Xeon 系统相比,Clearwater Forest 平台的性能提升了 1.9 倍,效率提升了 23%,并支持更高的服务器整合率。
Intel Xeon 6+ CPU 和平台的规格
Clearwater Forest“至强 6+ CPU”将采用 LGA 7529 插槽,适用于单路和双路配置。该插槽与至强 6900P“Granite Rapids-AP” CPU 使用的插槽相同。这些芯片的 TDP 范围为 300-500W,与拥有 144 个核心的至强 6700E 和 6900P 的运行参数一致。

这些 CPU 将支持多达 12 通道 DDR5 内存,支持高达 8000 MT/s 的速度,同时容纳多达 6 个 UPI 2.0 链路(高达 24 GT/s)、多达 96 个 PCIe Gen 5.0 通道和多达 64 个 CXL 2.0 通道。
在安全功能方面,该架构包含英特尔软件保护扩展 (SGX) 和英特尔信任域扩展 (TDX)。此外,英特尔的应用能耗遥测 (AET) 和 Turbo 速率限制器技术增强了电源管理。Clearwater Forest CPU 将支持具有 VNNI 和 INT8 功能的高级矢量扩展 2 (AVX2)。

总结一下,Clearwater Forest“Xeon 6+”与Sierra Forest“Xeon 6”的对比情况如下:
- 核心数量最多增加 2 倍
- 每核 IPC 提升 17%
- 超过 5 倍末级缓存
- 4 个附加内存通道
- 另外 2 个 UPI 链接
- 内存速度提高 20%

英特尔 Clearwater Forest“Xeon 6+”CPU 预计将于 2026 年下半年推出,预计将在发布前公布更多性能数据和见解。
Intel Xeon CPU 家族概述(初步):
家族品牌 | 钻石急流 | 清水森林 | 花岗岩急流城 | 塞拉森林 | 翡翠急流 | 蓝宝石急流 | 冰湖-SP | 库珀湖-SP | 卡斯卡德湖-SP/AP | Skylake-SP |
---|---|---|---|---|---|---|---|---|---|---|
进程节点 | 待定 | 英特尔 18A | 英特尔 3 | 英特尔 3 | 英特尔 7 | 英特尔 7 | 10纳米以上 | 14纳米++ | 14纳米++ | 14纳米+ |
平台名称 | 英特尔橡树溪 | 英特尔 Birch Stream | 英特尔 Birch Stream | 英特尔山流/英特尔桦木流 | 英特尔鹰流 | 英特尔鹰流 | 英特尔惠特利 | 英特尔雪松岛 | 英特尔普利 | 英特尔普利 |
核心架构 | Panther Cove-X | 黑暗山 | 红木湾 | 塞拉格伦 | 猛禽湾 | 黄金湾 | 阳光湾 | 卡斯凯德湖 | 卡斯凯德湖 | Skylake |
MCP(多芯片封装) | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 不 | 不 | 是的 | 不 |
插座 | LGA XXXX / 9324 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4677 | LGA 4677 | LGA 4189 | LGA 4189 | LGA 3647 | LGA 3647 |
最大核心数 | 待定 | 最多 288 个 | 最多 128 个 | 最多 288 个 | 最多 64 个? | 最多 56 个 | 最多 40 | 最多 28 个 | 最多 28 个 | 最多 28 个 |
最大线程数 | 待定 | 最多 288 个 | 最多 256 个 | 最多 288 个 | 最多 128 个 | 最多 112 个 | 最多 80 | 最多 56 个 | 最多 56 个 | 最多 56 个 |
最大 L3 缓存 | 待定 | 待定 | 480 MB 三级 | 108 MB L3 | 320 MB L3 | 105 MB L3 | 60 MB L3 | 38.5 MB 三级 | 38.5 MB 三级 | |
内存支持 | 最多 16 通道 DDR5? | 最多 12 通道 DDR5-8000 | 最多 12 通道 DDR5-6400/MCR-8800 | 高达 12 通道 DDR5-6400 | 高达 8 通道 DDR5-5600 | 高达 8 通道 DDR5-4800 | 高达 8 通道 DDR4-3200 | 最多 6 通道 DDR4-3200 | DDR4-2933 6通道 | DDR4-2666 6通道 |
PCIe Gen 支持 | PCIe 6.0? | PCIe 5.0(96通道) | PCIe 5.0(136通道) | PCIe 5.0(88通道) | PCIe 5.0(80通道) | PCIe 5.0(80通道) | PCIe 4.0(64通道) | PCIe 3.0(48通道) | PCIe 3.0(48通道) | PCIe 3.0(48通道) |
TDP 范围 (PL1) | 待定 | 高达 500W | 高达 500W | 高达 350W | 高达 350W | 高达 350W | 105-270瓦 | 150瓦-250瓦 | 165瓦-205瓦 | 140瓦-205瓦 |
3D Xpoint Optane DIMM | 待定 | 不适用 | 多纳休山口 | 不适用 | 克罗帕斯 | 克罗帕斯 | 巴洛山口 | 巴洛山口 | 阿帕奇山口 | 不适用 |
竞赛 | AMD EPYC 威尼斯 | AMD EPYC 都灵 | AMD EPYC 都灵 | AMD EPYC 贝加莫 | AMD EPYC Genoa ~5nm | AMD EPYC Genoa ~5nm | AMD EPYC Milan 7nm+ | AMD EPYC Rome 7nm | AMD EPYC Rome 7nm | AMD EPYC 那不勒斯 14nm |
发射 | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 |
发表回复