
Intel は、最大 288 個の次世代コアという驚異的なコア数を誇る Clearwater Forest として知られる、今後発売予定の Xeon 6+ E コア CPU ファミリーに関する詳細情報を提供しました。
Intel Clearwater Forest のご紹介: 高密度コンピューティングサーバー向け 288 基の次世代 Darkmont E-Core
パフォーマンス効率と演算密度の向上を実現した初のE-Core専用Xeon CPUである前身のSierra Forestの躍進を受け、IntelはClearwater Forestで大きな進歩を遂げています。これは、パフォーマンスコア(P-Core)と効率コア(E-Core)の別々のファミリーに分かれたIntelのXeonラインナップにおける、注目すべき進化を示しています。

Clearwater Forest は、Xeon 6+ ブランドによる E-Core のみの CPU の第 2 世代の始まりを示しています。

先進技術: Intel 18A、RibbonFET、Foveros Direct3D 搭載のパワービア
Clearwater Forestにより、インテルは分散型アーキテクチャと高度なパッケージングソリューションをさらに進化させます。この新しいチップ構造は、多様なチップレットとコンポーネントを備えた多層設計を採用しており、インテルのエンジニアリング力の高さを実証しています。

Clearwater Forestアーキテクチャは、2.5Dパッケージング技術を用いて12個のEMIBタイルを統合しています。この構成は、3個のアクティブベースタイル、2個のI/Oタイル、そして合計12個のコンピュートタイルを接続します。I/OタイルはIntel 7ノード上に構築され、アクティブベースタイルはIntel 3プロセスノードを活用し、コンピュートチップレットは最先端のIntel 18Aテクノロジーで製造されています。

Darkmont E-Core設計を採用した各コンピューティングチップレットは、RibbonFETテクノロジーを採用した18Aプロセスノードで製造されており、ゲート容量の低減により電力効率を最適化します。さらに、18Aプロセスは90%を超える優れたセル密度を誇り、裏面電源レールを通じた信号配線の改善により、エネルギー損失を4~5%大幅に低減します。

RibbonFETテクノロジーは電流管理を強化し、電力リークを低減することで、顕著な性能向上をもたらします。このイノベーションにより、動作電圧を低く抑えながら電流をより厳密に制御することが可能になり、ゲート長の短縮によりトランジスタあたりの消費電力を20%削減します。

RibbonFET テクノロジーの主な機能は次のとおりです。
- 高密度CPU向けチップ部品の小型化を強化
- トランジスタチャネル内の電流を正確に制御
- ワットあたりのパフォーマンスと運用効率の向上
- リボン幅とさまざまな閾値電圧タイプによって調整可能なパラメータ
PowerViaテクノロジーは、RibbonFETを補完し、標準セルの使用率を最大10%、ISO電力性能を4%向上させます。このアプローチはシリコンの下から電力を供給し、チップ全体の性能を向上させます。

PowerVia テクノロジーのハイライトは次のとおりです。
- 電力分配の混雑を軽減し、チップ全体のパフォーマンスを向上
- レイアウトを最適化するために粗ピッチ金属を再配分
- 効率的な電力管理のための裏面ダイ統合
- 電力分配を強化するナノスケールTSV
- 優れた信号ルーティング機能
- 90%以上のセル密度でスペースを最適化
さらに、Clearwater Forestは、ベースアクティブタイル上でコンピューティングタイルとI/Oタイルを効果的に接続できる革新的なパッケージングソリューションであるFoveros Direct3Dを量産に初めて採用する予定です。この技術は、9μmのバンプピッチで消費電力を最小限に抑え、タイル間の効率的なデータ転送を可能にします。
次の 3D 構造の概要は、Clearwater Forest Xeon 6+ CPU アーキテクチャを示しています。

クリアウォーターフォレストの3つの主要なタイルを探索する
Clearwater Forest アーキテクチャは、コンピューティング タイル、I/O タイル、ベース タイルの 3 つの主要なタイルで構成されています。
クリアウォーターフォレスト I/O タイル
このタイルは、Intel 7 プロセス テクノロジーを活用し、Intel Quick Assist テクノロジー、Intel Dynamic Load Balancer、Intel Data Streaming Accelerator、および Intel In-Memory Analytics Accelerator を含む 2 つのパッケージにまたがる 8 つのアクセラレーター (合計 16 個のアクセラレーター) を統合します。

各I/Oタイルには、PCIe Gen 5.0レーン48本(合計96レーン)、CXL 2.0レーン32本(合計64レーン)、UPI 2.0レーン96本(合計192レーン)が搭載されています。Granite Rapidsから変更はありませんが、この設計はSierra Forestと比べて大幅にアップグレードされています。
クリアウォーターフォレストベースタイル
ベースタイルは、EMIBを介して上位のコンピューティングタイルに接続され、Intel 3プロセステクノロジーを使用して3つのベースタイルを収容します。各ベースタイルには4つのDDR5メモリコントローラが搭載され、合計12のメモリチャネルが存在します。さらに、各コンピューティングタイルには48MBの共有LLCが提供され、合計576MBのオンパッケージLLCとなります。

クリアウォーターフォレストコンピューティングタイル
コンピューティングタイルは、Clearwater Forestの最も先進的な部分であり、新しい18Aプロセステクノロジーを採用しています。各タイルは6つのモジュールで構成され、各モジュールには4つのDarkmont E-Coreが搭載されています。つまり、コンピューティングタイルあたり24個のE-Core、12タイル全体では288個のE-Coreとなります。




さらに、各モジュールには4MBのL2キャッシュが搭載されており、計算タイルあたり24MB、12個のタイル全体で合計288MBのL2キャッシュとなります。LLCと組み合わせると、チップ全体のキャッシュ容量は864MBに達します。
- 12x コンピューティング タイル (Intel 18A)
- アクティブベースタイル×3(Intel 3)
- 2x Intel I/O タイル (Intel 7)
- 12x EMIB タイル (EMIB 2.5D)
Darkmont E-Coreの詳細
それでは、Panther Lake クライアント CPU にも採用されている Darkmont E-Core について詳しく見ていきましょう。

Darkmont アーキテクチャは、Lunar Lake および Arrow Lake CPU に搭載されている Skymont デザインと類似していますが、Crestmont よりも大幅にアップグレードされています。

Darkmontコアの注目すべき改良点としては、128バイトに更新された予測ブロック、強化された命令フェッチ、そしてCrestmontと比較して50%多いデコードクラスタを組み込んだ、より広いデコードユニットを備えた9ワイドマイクロアーキテクチャなどが挙げられます。その他の機能強化としては、Uopキュー容量の増強と、より洗練された命令キャッシュなどがあります。

Intelはアウトオブオーダーエンジン(OOE)も強化しました。8ワイドの割り当てと16ワイドのリタイアメカニズムによりリソース管理が高速化され、アウトオブオーダーウィンドウの容量は416エントリと大幅に増加しました。
ディスパッチ ポートの拡張は 26 に達し、スカラー エンジンには 8 つの整数 ALU が搭載され、ベクター エンジンには 4 つの浮動小数点 ALU が含まれており、複数の実行タスクにわたってパフォーマンスが最適化されます。

メモリ サブシステムの機能強化は包括的なアップグレードを反映しており、L2 キャッシュ帯域幅の 2 倍と L1 から L1 への転送の高速化が可能になり、データ通信の効率が向上します。
外部ファブリックデータ転送が不要になったことで、L2キャッシュはL1キャッシュを介して直接データにアクセスできるようになりました。コンビクションクロックレートも同様に向上し、クロックサイクルごとに16バイトから32バイトに向上しました。

結論として、Clearwater Forest に搭載された Darkmont E-Core は、144 コアの Xeon 6780E「Sierra Forest」と比較して最大 90% のパフォーマンス向上を実現し、さまざまな負荷にわたって効率が 23% 向上し、総所有コスト (TCO) を抑えながら最大 8:1 のサーバー統合をサポートします。
初期パフォーマンス指標
Intel は、Clearwater Forest「Xeon 6+」CPU の予備的なパフォーマンス統計を発表し、144 コアの Xeon 6700E「Sierra Forest」と、未発表の 288 コアの Xeon 6900E チップとの比較を示しました。

330W で動作する 144 コアの Sierra Forest (Xeon 6780E) とは対照的に、288 コアで TDP が 450W の Clearwater Forest バリアントは、コア数が 2 倍で TDP が 36.3% も低く、112.7% のパフォーマンス向上とワットあたりの効率 54.7% 向上を実現しています。
TDP 500W を管理する 288 コアの Sierra Forest チップと比較すると、Clearwater Forest は TDP を 11% 低く抑えながら、パフォーマンスは 17% 向上し、ワットあたりのパフォーマンスは 30% 向上しています。

このパフォーマンス向上は、IPCを17%向上させる先進のDarkmont Eコアによるものです。Clearwater Forestプラットフォームは、旧式のXeonシステムと比較して、パフォーマンスを1.9倍、効率を23%向上させ、大幅なサーバー統合率を実現します。
Intel Xeon 6+ CPUおよびプラットフォームの仕様
Clearwater Forestの「Xeon 6+ CPU」は、1S構成と2S構成の両方に対応するLGA 7529ソケットを採用します。これは、Xeon 6900P「Granite Rapids-AP」CPUと同じソケットです。これらのチップは、144コアを搭載したXeon 6700Eおよび6900Pの動作パラメータを反映し、TDPは300~500Wの範囲で動作します。

これらの CPU は、最大 8000 MT/s の速度をサポートする最大 12 チャネルの DDR5 メモリを備え、最大 6 つの UPI 2.0 リンク (最大 24 GT/s)、最大 96 の PCIe Gen 5.0 レーン、最大 64 の CXL 2.0 レーンを収容します。
セキュリティ機能に関しては、アーキテクチャにはIntel Software Guard Extensions(SGX)とIntel Trust Domain Extensions(TDX)が組み込まれています。さらに、IntelのApplication Energy Telemetry(AET)とTurbo Rate Limiterテクノロジーによって電力管理が強化されています。Clearwater Forest CPUは、VNNIおよびINT8機能を備えたAdvanced Vector Extensions 2(AVX2)をサポートします。

まとめると、Clearwater Forest「Xeon 6+」とSierra Forest「Xeon 6」の比較は次のようになります。
- コア数は最大2倍
- コアあたり17%のIPC向上
- 最終レベルキャッシュの5倍以上
- 4つの追加メモリチャネル
- さらに2つのUPIリンク
- メモリ速度が20%向上

Intel の Clearwater Forest「Xeon 6+」CPU の発売は 2026 年後半に予定されており、リリースに先立って追加のパフォーマンス データと分析情報が公開される予定です。
Intel Xeon CPU ファミリーの概要 (暫定):
ファミリーブランディング | ダイヤモンドラピッズ | クリアウォーターフォレスト | グラナイト・ラピッズ | シエラフォレスト | エメラルドラピッズ | サファイアラピッズ | アイスレイクSP | クーパーレイクSP | カスケード湖-SP/AP | スカイレイクSP |
---|---|---|---|---|---|---|---|---|---|---|
プロセスノード | 未定 | インテル 18A | インテル3 | インテル3 | インテル 7 | インテル 7 | 10nm以上 | 14nm++ | 14nm++ | 14nm以上 |
プラットフォーム名 | インテル オーク ストリーム | インテル バーチ ストリーム | インテル バーチ ストリーム | インテル マウンテン ストリーム/インテル バーチ ストリーム | インテル イーグル ストリーム | インテル イーグル ストリーム | インテル・ホイットリー | インテル シーダー アイランド | インテル・パーリー | インテル・パーリー |
コアアーキテクチャ | パンサーコーブ-X | ダークモント | レッドウッドコーブ | シエラ・グレン | ラプターコーブ | ゴールデンコーブ | サニーコーブ | カスケード湖 | カスケード湖 | スカイレイク |
MCP(マルチチップパッケージ)WeUs | はい | はい | はい | はい | はい | はい | いいえ | いいえ | はい | いいえ |
ソケット | LGA XXXX / 9324 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4677 | LGA 4677 | LGA 4189 | LGA 4189 | LGA 3647 | LGA 3647 |
最大コア数 | 未定 | 最大288 | 最大128 | 最大288 | 64までですか? | 最大56 | 最大40 | 最大28 | 最大28 | 最大28 |
最大スレッド数 | 未定 | 最大288 | 最大256 | 最大288 | 最大128 | 最大112 | 最大80 | 最大56 | 最大56 | 最大56 |
最大L3キャッシュ | 未定 | 未定 | 480 MB L3 | 108 MB L3 | 320 MB L3 | 105 MB L3 | 60 MB L3 | 38.5 MB L3 | 38.5 MB L3 | |
メモリサポート | 最大 16 チャネル DDR5? | 最大12チャネルDDR5-8000 | 最大12チャネルDDR5-6400/MCR-8800 | 最大12チャネルDDR5-6400 | 最大8チャネルDDR5-5600 | 最大8チャネルDDR5-4800 | 最大8チャネルDDR4-3200 | 最大6チャネルDDR4-3200 | DDR4-2933 6チャネル | DDR4-2666 6チャネル |
PCIe Gen サポート | PCIe6.0? | PCIe 5.0(96レーン) | PCIe 5.0(136レーン) | PCIe 5.0(88レーン) | PCIe 5.0(80レーン) | PCIe 5.0(80レーン) | PCIe 4.0(64レーン) | PCIe 3.0(48レーン) | PCIe 3.0(48レーン) | PCIe 3.0(48レーン) |
TDP範囲(PL1) | 未定 | 最大500W | 最大500W | 最大350W | 最大350W | 最大350W | 105~270W | 150W~250W | 165W-205W | 140W~205W |
3D Xpoint Optane DIMM | 未定 | 該当なし | ドナヒュー峠 | 該当なし | クロウパス | クロウパス | バーロウ峠 | バーロウ峠 | アパッチ峠 | 該当なし |
競争 | AMD EPYC ヴェネツィア | AMD EPYC トリノ | AMD EPYC トリノ | AMD EPYC ベルガモ | AMD EPYC ジェノア ~5nm | AMD EPYC ジェノア ~5nm | AMD EPYC ミラノ 7nm+ | AMD EPYC ローマ 7nm | AMD EPYC ローマ 7nm | AMD EPYC ナポリ 14nm |
打ち上げ | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 |
コメントを残す