英特尔 Clearwater Forest “Xeon 6+” 处理器深度分析:配备多达 288 个 Darkmont E 核心、576 MB 缓存和 18A,并采用 Foveros D3D + EMIB 2.5D 技术

英特尔 Clearwater Forest “Xeon 6+” 处理器深度分析:配备多达 288 个 Darkmont E 核心、576 MB 缓存和 18A,并采用 Foveros D3D + EMIB 2.5D 技术

英特尔对其即将推出的 Xeon 6+ E-core CPU 系列(称为 Clearwater Forest)提供了更多见解,该系列拥有多达 288 个下一代核心。

英特尔 Clearwater Forest 新品发布:288 个下一代 Darkmont E 核心,助力高密度计算服务器

在其前身 Sierra Forest(首款 E-Core 专用至强 CPU,提供更高的计算密度和性能效率)的基础上,英特尔在 Clearwater Forest 上取得了重大进展。这标志着英特尔至强产品线的显著发展,目前已分为性能核心 (P-Core) 和高效核心 (E-Core) 两个系列。

微芯片背景上,英特尔徽标位于“数据中心战略概述”旁边。

Clearwater Forest 标志着 Xeon 6+ 品牌下第二代 E-Core CPU 的开始。

推出英特尔至强 6+ 和英特尔至强 6 CPU,之前代号为 Granite Rapids 和 Sierra Forest。

先进技术:英特尔 18A、RibbonFET 和 Power Via,采用 Foveros Direct3D

凭借 Clearwater Forest,英特尔正在提升其分解式架构和先进封装解决方案。这款新芯片结构采用多层设计,包含各种芯片和组件,展现了英特尔的工程实力。

英特尔 Clearwater Forest 服务器 CPU 详细信息屏幕,具有 288 个 E 核和英特尔 18A 等功能。

Clearwater Forest 架构采用 2.5D 封装技术集成了 12 个 EMIB 模块。此配置连接了三个有源基础模块、两个 I/O 模块以及总共 12 个计算模块。I/O 模块基于英特尔 7 节点构建,有源基础模块采用英特尔 3 节点制程,计算芯片组则采用尖端的英特尔 18A 技术生产。

Clearwater Forest 架构图显示了带有 Intel 18A 和其他组件的 12x Compute tile。

每个计算芯片均采用 Darkmont E-Core 设计,采用 18A 工艺节点,该节点采用 RibbonFET 技术,通过降低栅极电容来优化功率效率。此外,18A 工艺拥有超过 90% 的惊人单元密度,并有助于改善通过背面电源轨的信号布线,从而显著降低 4-5% 的能耗。

英特尔 18A 工艺信息图突出显示了更高单元密度等优势。

RibbonFET 技术增强了电流管理并降低了漏电,从而带来显著的性能优势。这项创新技术能够在保持较低工作电压的同时更严格地控​​制电流,从而缩短栅极长度,使每个晶体管的功耗降低 20%。

RibbonFET 技术图表突出显示了电流控制等功能。

RibbonFET 技术的主要特性包括:

  • 增强高密度CPU芯片元件的小型化
  • 精确控制晶体管通道中的电流
  • 提高每瓦性能和运营效率
  • 通过色带宽度和各种阈值电压类型实现可调参数

PowerVia 技术与 RibbonFET 技术相得益彰,可将标准单元利用率提升高达 10%,ISO 功耗性能提升 4%。这种方法可从硅片下方引导电源,从而提升芯片的整体性能。

英特尔 PowerVia 图表概述了主要特性。

PowerVia技术的亮点包括:

  • 减少配电拥塞,提升芯片整体性能
  • 重新分配间距金属以优化布局
  • 背面芯片集成,实现高效电源管理
  • 纳米级 TSV 增强配电
  • 卓越的信号路由能力
  • 超过 90% 的单元密度,可优化空间利用率

此外,Clearwater Forest 将成为首个在量产中采用 Foveros Direct3D 的厂商。Foveros Direct3D 是一种创新的封装解决方案,能够有效地连接基础活动模块上的计算和 I/O 模块。该技术采用 9 微米的凸块间距,最大限度地降低了功耗,从而实现了模块之间的高效数据传输。

以下 3D 构造概览展示了 Clearwater Forest Xeon 6+ CPU 架构:

带有标记芯片的英特尔 Clearwater Forest 3D 构造图。

探索清水森林的三个主要地块

Clearwater Forest 架构由三个主要模块组成:计算模块、I/O 模块和基础模块。

清水森林 I/O 地砖

该Tile采用英特尔7代工艺,集成了两种封装的8个加速器,包括英特尔快速辅助技术、英特尔动态负载均衡器、英特尔数据流加速器、英特尔内存分析加速器,共计16个加速器。

英特尔 I/O Tile 架构图,展示了技术细节。

每个 I/O 模块配备 48 条 PCIe Gen 5.0 通道(共计 96 条)、32 条 CXL 2.0 通道(共计 64 条)和 96 条 UPI 2.0 通道(共计 192 条)。虽然与 Granite Rapids 相比没有变化,但这种设计相比 Sierra Forest 有了显著的升级。

清水森林地砖

基础模块 (Base Tile) 通过 EMIB 连接到上方的计算模块,采用英特尔 3 工艺技术,可容纳三个基础模块。每个基础模块包含四个 DDR5 内存控制器,总共 12 个内存通道。此外,它们为每个计算模块提供 48 MB 的共享 LLC,总计 576 MB 的封装内 LLC。

清水森林计算瓦片

这些计算模块代表了 Clearwater Forest 最先进的技术,采用了全新的 18A 制程技术。每个计算模块由六个模块构成,每个模块承载四个 Darkmont E-Core,最终每个计算模块包含 24 个 E-Core,十二个计算模块共包含 288 个 E-Core。

英特尔技术之旅幻灯片展示了计算模块架构,其中包含模块和 E 核的详细信息。
英特尔计算模块架构信息图展示了其规格。
英特尔计算模块架构突出核心规格。
英特尔计算模块架构图详细介绍了 Darkmont E 核心。

此外,每个模块包含 4 MB 的 L2 缓存,相当于每个计算块 24 MB,12 个计算块总共 288 MB 的 L2 缓存。与 LLC 结合使用时,整个芯片的缓存容量达到 864 MB。

  • 12 个计算模块(英特尔 18A)
  • 3x 活动基础瓷砖(英特尔 3)
  • 2 个英特尔 I/O Tiles(英特尔 7)
  • 12x EMIB 瓷砖(EMIB 2.5D)

深入了解 Darkmont E-Core

现在让我们深入研究一下 Panther Lake 客户端 CPU 中也采用的 Darkmont E-Core。

英特尔研究员史蒂芬·罗宾逊 (Stephen Robinson) 制作的英特尔幻灯片,题为“Darkmont E-core Deep Dive”。

虽然 Darkmont 架构与 Lunar Lake 和 Arrow Lake CPU 中的 Skymont 设计有相似之处,但它比 Crestmont 有了显著的升级。

英特尔图表标题为“Darkmont E-core”,带有标记部分。

Darkmont 核心的显著改进包括:更新后的预测块(128 字节)、增强的指令提取功能,以及 9 宽微架构,该架构拥有更宽的解码单元,与 Crestmont 相比,解码簇数量增加了 50%。其他增强功能包括更大的 Uop 队列容量和更精细的指令缓存。

英特尔 Darkmont E-core 乱序引擎图,突出显示了分配和退出功能。

英特尔还增强了乱序引擎 (OOE)。它具有 8 宽分配和 16 宽退出机制,可实现更快的资源管理,同时具有更大的 416 个条目乱序窗口容量。

调度端口扩展至 26 个,其中标量引擎具有 8 个整数 ALU,而矢量引擎包含 4 个浮点 ALU,从而优化了多个执行任务的性能。

英特尔执行引擎展示 Darkmont E-core 的功能。

内存子系统的增强反映了全面的升级:现在可以将 L2 缓存带宽增加一倍并加快 L1 到 L1 的传输,从而提高数据通信效率。

通过消除外部结构数据传输,L2 缓存现在可以直接通过 L1 缓存访问数据。同时,读取时钟频率也从每个时钟周期 16 字节提升至 32 字节。

Crestmont 和 Darkmont E-Core 架构比较图。

总而言之,与 144 核 Xeon 6780E“Sierra Forest”相比,Clearwater Forest 中的 Darkmont E-Core 性能提升高达 90%,不同负载下的效率提升 23%,支持高达 8:1 的服务器整合,同时降低总体拥有成本 (TCO)。

初始绩效指标

英特尔发布了 Clearwater Forest“Xeon 6+”CPU 的初步性能统计数据,并与 144 核 Xeon 6700E“Sierra Forest”和未发布的 288 核 Xeon 6900E 芯片进行了比较。

图表比较了 Clearwater Forest 和 Sierra Forest 的性能指标。

与运行功率为 330W 的 144 核 Sierra Forest(Xeon 6780E)相比,拥有 288 个核心、TDP 为 450W 的 Clearwater Forest 变体的 TDP 降低了 36.3%,核心数量增加了一倍,性能提高了 112.7%,每瓦效率提高了 54.7%。

与 TDP 为 500W 的 288 核 Sierra Forest 芯片相比,Clearwater Forest 的 TDP 降低了 11%,同时性能提高了 17%,每瓦性能提高了 30%。

Darkmont 与 Crestmont CPU 的性能和效率指标。

性能提升源于先进的 Darkmont E-Core,其 IPC 性能提升 17%。与过时的 Xeon 系统相比,Clearwater Forest 平台的性能提升了 1.9 倍,效率提升了 23%,并支持更高的服务器整合率。

Intel Xeon 6+ CPU 和平台的规格

Clearwater Forest“至强 6+ CPU”将采用 LGA 7529 插槽,适用于单路和双路配置。该插槽与至强 6900P“Granite Rapids-AP” CPU 使用的插槽相同。这些芯片的 TDP 范围为 300-500W,与拥有 144 个核心的至强 6700E 和 6900P 的运行参数一致。

屏幕突出显示英特尔 Clearwater Forest 技术规格和功能。

这些 CPU 将支持多达 12 通道 DDR5 内存,支持高达 8000 MT/s 的速度,同时容纳多达 6 个 UPI 2.0 链路(高达 24 GT/s)、多达 96 个 PCIe Gen 5.0 通道和多达 64 个 CXL 2.0 通道。

在安全功能方面,该架构包含英特尔软件保护扩展 (SGX) 和英特尔信任域扩展 (TDX)。此外,英特尔的应用能耗遥测 (AET) 和 Turbo 速率限制器技术增强了电源管理。Clearwater Forest CPU 将支持具有 VNNI 和 INT8 功能的高级矢量扩展 2 (AVX2)。

Intel Xeon 6+ 具有 288 个 E 核和 DDR5 内存功能。

总结一下,Clearwater Forest“Xeon 6+”与Sierra Forest“Xeon 6”的对比情况如下:

  • 核心数量最多增加 2 倍
  • 每核 IPC 提升 17%
  • 超过 5 倍末级缓存
  • 4 个附加内存通道
  • 另外 2 个 UPI 链接
  • 内存速度提高 20%
英特尔® Xeon 6700E 与 Clearwater Forest 规格的比较。

英特尔 Clearwater Forest“Xeon 6+”CPU 预计将于 2026 年下半年推出,预计将在发布前公布更多性能数据和见解。

Intel Xeon CPU 家族概述(初步):

家族品牌 钻石急流 清水森林 花岗岩急流城 塞拉森林 翡翠急流 蓝宝石急流 冰湖-SP 库珀湖-SP 卡斯卡德湖-SP/AP Skylake-SP
进程节点 待定 英特尔 18A 英特尔 3 英特尔 3 英特尔 7 英特尔 7 10纳米以上 14纳米++ 14纳米++ 14纳米+
平台名称 英特尔橡树溪 英特尔 Birch Stream 英特尔 Birch Stream 英特尔山流/英特尔桦木流 英特尔鹰流 英特尔鹰流 英特尔惠特利 英特尔雪松岛 英特尔普利 英特尔普利
核心架构 Panther Cove-X 黑暗山 红木湾 塞拉格伦 猛禽湾 黄金湾 阳光湾 卡斯凯德湖 卡斯凯德湖 Skylake
MCP(多芯片封装) 是的 是的 是的 是的 是的 是的 是的
插座 LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
最大核心数 待定 最多 288 个 最多 128 个 最多 288 个 最多 64 个? 最多 56 个 最多 40 最多 28 个 最多 28 个 最多 28 个
最大线程数 待定 最多 288 个 最多 256 个 最多 288 个 最多 128 个 最多 112 个 最多 80 最多 56 个 最多 56 个 最多 56 个
最大 L3 缓存 待定 待定 480 MB 三级 108 MB L3 320 MB L3 105 MB L3 60 MB L3 38.5 MB 三级 38.5 MB 三级
内存支持 最多 16 通道 DDR5? 最多 12 通道 DDR5-8000 最多 12 通道 DDR5-6400/MCR-8800 高达 12 通道 DDR5-6400 高达 8 通道 DDR5-5600 高达 8 通道 DDR5-4800 高达 8 通道 DDR4-3200 最多 6 通道 DDR4-3200 DDR4-2933 6通道 DDR4-2666 6通道
PCIe Gen 支持 PCIe 6.0? PCIe 5.0(96通道) PCIe 5.0(136通道) PCIe 5.0(88通道) PCIe 5.0(80通道) PCIe 5.0(80通道) PCIe 4.0(64通道) PCIe 3.0(48通道) PCIe 3.0(48通道) PCIe 3.0(48通道)
TDP 范围 (PL1) 待定 高达 500W 高达 500W 高达 350W 高达 350W 高达 350W 105-270瓦 150瓦-250瓦 165瓦-205瓦 140瓦-205瓦
3D Xpoint Optane DIMM 待定 不适用 多纳休山口 不适用 克罗帕斯 克罗帕斯 巴洛山口 巴洛山口 阿帕奇山口 不适用
竞赛 AMD EPYC 威尼斯 AMD EPYC 都灵 AMD EPYC 都灵 AMD EPYC 贝加莫 AMD EPYC Genoa ~5nm AMD EPYC Genoa ~5nm AMD EPYC Milan 7nm+ AMD EPYC Rome 7nm AMD EPYC Rome 7nm AMD EPYC 那不勒斯 14nm
发射 2025-2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注