Detaillierte Analyse der Intel Clearwater Forest „Xeon 6+“-Prozessoren: Mit bis zu 288 Darkmont E-Cores, 576 MB Cache und 18A mit Foveros D3D + EMIB 2.5D-Technologie

Detaillierte Analyse der Intel Clearwater Forest „Xeon 6+“-Prozessoren: Mit bis zu 288 Darkmont E-Cores, 576 MB Cache und 18A mit Foveros D3D + EMIB 2.5D-Technologie

Intel hat zusätzliche Einblicke in seine kommende Xeon 6+ E-Core-CPU-Familie namens Clearwater Forest gegeben, die mit einer beeindruckenden Kernanzahl von bis zu 288 Kernen der nächsten Generation aufwarten kann.

Einführung von Intel Clearwater Forest: 288 Darkmont E-Cores der nächsten Generation für High-Density-Compute-Server

Aufbauend auf den Fortschritten des Vorgängers Sierra Forest – der ersten dedizierten Xeon-CPU mit E-Core-Anbindung, die neben höherer Rechendichte auch höhere Leistungseffizienz bot – erzielt Intel mit Clearwater Forest bedeutende Fortschritte. Dies stellt eine bemerkenswerte Weiterentwicklung der Xeon-Produktpalette von Intel dar, die nun in separate Familien für Performance Cores (P-Core) und Efficient Cores (E-Core) unterteilt ist.

Intel-Logo neben „Data Center Strategic Overview“ auf einem Mikrochip-Hintergrund.

Der Clearwater Forest markiert den Beginn der zweiten Generation von E-Core-Only-CPUs unter der Marke Xeon 6+.

Wir stellen die Intel Xeon 6+ und Intel Xeon 6 CPUs vor, die zuvor die Codenamen Granite Rapids und Sierra Forest trugen.

Fortschrittliche Technologie: Intel 18A, RibbonFET und Power Via mit Foveros Direct3D

Mit Clearwater Forest erweitert Intel seine disaggregierte Architektur und seine fortschrittlichen Verpackungslösungen. Diese neue Chipstruktur verwendet ein mehrschichtiges Design mit verschiedenen Chiplets und Komponenten und stellt Intels technisches Können unter Beweis.

Bildschirm mit CPU-Details zum Intel Clearwater Forest-Server mit Funktionen wie 288 E-Cores und Intel 18A.

Die Clearwater Forest-Architektur integriert zwölf EMIB-Kacheln mit 2, 5D-Verpackungstechnologie. Diese Konfiguration verbindet drei aktive Basiskacheln, zwei I/O-Kacheln und insgesamt zwölf Rechenkacheln. Die I/O-Kacheln basieren auf dem Intel 7-Knoten, die aktiven Basiskacheln nutzen den Intel 3-Prozessknoten und die Rechenchiplets werden mit der hochmodernen Intel 18A-Technologie hergestellt.

Architekturdiagramm von Clearwater Forest mit 12x Compute-Kacheln mit Intel 18A und anderen Komponenten.

Jeder Rechenchip mit Darkmont E-Core-Design wird im 18A-Prozessknoten mit RibbonFET-Technologie gefertigt, der die Energieeffizienz durch reduzierte Gate-Kapazität optimiert. Darüber hinaus bietet der 18A-Prozess eine beeindruckende Zelldichte von über 90 % und ermöglicht eine verbesserte Signalführung über die rückseitigen Stromschienen, wodurch Energieverluste um 4–5 % reduziert werden.

Infografik zum Intel 18A-Prozess, die Vorteile wie eine höhere Zelldichte hervorhebt.

Die RibbonFET-Technologie verbessert das Strommanagement und reduziert den Leistungsverlust, was zu deutlichen Leistungsvorteilen führt. Diese Innovation ermöglicht eine bessere Kontrolle der elektrischen Ströme bei gleichzeitig niedrigeren Betriebsspannungen. Die daraus resultierenden kürzeren Gate-Längen tragen zu einer 20-prozentigen Reduzierung des Stromverbrauchs pro Transistor bei.

Diagramm der RibbonFET-Technologie mit hervorgehobenen Funktionen wie der Stromsteuerung.

Zu den wichtigsten Merkmalen der RibbonFET-Technologie gehören:

  • Verstärkte Miniaturisierung von Chipkomponenten für hochdichte CPUs
  • Präzise Kontrolle über elektrische Ströme im Transistorkanal
  • Verbesserte Leistung pro Watt und Betriebseffizienz
  • Einstellbare Parameter durch Bandbreiten und verschiedene Schwellenspannungstypen

Die PowerVia-Technologie ergänzt RibbonFET, indem sie die Standardzellenauslastung um bis zu 10 % und die ISO-Power-Leistung um 4 % erhöht. Dieser Ansatz leitet den Strom von unterhalb des Siliziums ab und verbessert so die Gesamtleistung des Chips.

Intel PowerVia-Diagramm mit den wichtigsten Funktionen.

Zu den Highlights der PowerVia-Technologie gehören:

  • Reduzierte Überlastung der Stromverteilung, wodurch die Gesamtleistung des Chips gesteigert wird
  • Neuverteilung grober Pitchmetalle zur Optimierung des Layouts
  • Rückseitenintegration für effizientes Energiemanagement
  • Nanoskalige TSVs für eine verbesserte Energieverteilung
  • Überlegene Signalrouting-Funktionen
  • Über 90 % Zelldichte für optimierte Raumausnutzung

Darüber hinaus wird Clearwater Forest als erstes Unternehmen in der Großserienproduktion Foveros Direct3D einsetzen, eine innovative Verpackungslösung, die Rechen- und I/O-Kacheln auf den aktiven Basiskacheln effektiv verbindet. Diese Technologie minimiert den Stromverbrauch durch einen 9-µm-Bump-Pitch und ermöglicht so einen effizienten Datentransfer zwischen den Kacheln.

Die folgende 3D-Konstruktionsübersicht veranschaulicht die Clearwater Forest Xeon 6+ CPU-Architektur:

3D-Konstruktionsdiagramm von Intel Clearwater Forest mit beschrifteten Chiplets.

Erkundung der drei Hauptkacheln des Clearwater Forest

Die Clearwater Forest-Architektur besteht aus drei Hauptkacheln: der Compute-Kachel, der I/O-Kachel und der Basiskachel.

Clearwater Forest E/A-Kachel

Diese Kachel nutzt die Intel 7-Prozesstechnologie und integriert acht Beschleuniger in zwei Paketen, darunter Intel Quick Assist Technology, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator und Intel In-Memory Analytics Accelerator, also insgesamt 16 Beschleuniger.

Diagramm der Intel I/O-Tile-Architektur mit technischen Details.

Jedes I/O-Modul ist mit 48 PCIe Gen 5.0-Lanes (insgesamt 96), 32 CXL 2.0-Lanes (insgesamt 64) und 96 UPI 2.0-Lanes (insgesamt 192) ausgestattet. Dieses Design ist gegenüber Granite Rapids unverändert, stellt aber eine deutliche Verbesserung gegenüber Sierra Forest dar.

Clearwater Forest-Grundfliese

Das Base Tile, das über EMIB mit den darüber liegenden Compute Tiles verbunden ist, nutzt Intel 3-Prozessortechnologie und beherbergt drei Base Tiles. Jedes dieser Base Tiles enthält vier DDR5-Speichercontroller, was insgesamt 12 Speicherkanäle ergibt. Darüber hinaus bieten sie eine gemeinsame LLC mit 48 MB pro Compute Tile, was insgesamt 576 MB On-Package LLC ergibt.

Clearwater Forest Compute Tile

Die Rechenkacheln stellen den fortschrittlichsten Aspekt von Clearwater Forest dar und verfügen über die neue 18A-Prozesstechnologie. Jede Kachel besteht aus sechs Modulen mit jeweils vier Darkmont E-Cores, was 24 E-Cores pro Rechenkachel und 288 E-Cores über alle zwölf Kacheln hinweg ergibt.

Folie der Intel Tech Tour mit der Compute Tile Architecture und Details zu Modulen und E-Cores.
Infografik zur Intel Compute Tile Architecture mit Spezifikationen.
Intel Compute Tile Architecture mit Hervorhebung der Kernspezifikationen.
Diagramm der Intel Compute Tile Architecture mit Details zu den Darkmont E-Cores.

Darüber hinaus verfügt jedes Modul über 4 MB L2-Cache, was 24 MB pro Rechenkachel und insgesamt 288 MB L2-Cache für die zwölf Kacheln entspricht. In Kombination mit dem LLC erreicht der gesamte Chip 864 MB Cache.

  • 12x Compute-Kacheln (Intel 18A)
  • 3x aktive Basiskacheln (Intel 3)
  • 2x Intel I/O-Kacheln (Intel 7)
  • 12x EMIB-Kacheln (EMIB 2.5D)

Detaillierter Blick auf Darkmont E-Core

Lassen Sie uns nun tiefer in den Darkmont E-Core eintauchen, der auch in den Panther Lake-Client-CPUs zum Einsatz kommt.

Intel-Folie mit dem Titel „Darkmont E-core Deep Dive“ von Intel Fellow Stephen Robinson.

Während die Darkmont-Architektur Ähnlichkeiten mit dem Skymont-Design der Lunar Lake- und Arrow Lake-CPUs aufweist, stellt sie gegenüber Crestmont eine wesentliche Verbesserung dar.

Intel-Diagramm mit dem Titel „Darkmont E-Core“ mit beschrifteten Abschnitten.

Zu den bemerkenswerten Verbesserungen des Darkmont-Kerns gehören ein aktualisierter Vorhersageblock mit 128 Bytes, verbessertes Befehlsabrufen und eine 9-Breit-Mikroarchitektur mit einer breiteren Dekodiereinheit, die im Vergleich zu Crestmont 50 % mehr Dekodiercluster enthält. Weitere Verbesserungen sind eine erhöhte Uop-Warteschlangenkapazität und ein verfeinerter Befehlscache.

Diagramm der Out-of-Order-Engine des Intel Darkmont E-Core mit hervorgehobenen Zuweisungs- und Außerbetriebnahmefunktionen.

Intel hat außerdem die Out-of-Order Engine (OOE) verbessert. Sie verfügt über eine 8-breite Zuweisung und einen 16-breiten Ausmusterungsmechanismus für eine schnellere Ressourcenverwaltung sowie eine größere Out-of-Order-Fensterkapazität von 416 Einträgen.

Die Erweiterung über Dispatch-Ports hat 26 erreicht, wobei die Scalar Engine über 8 Integer-ALUs verfügt, während die Vector Engine 4 Float-ALUs umfasst, wodurch die Leistung über mehrere Ausführungsaufgaben hinweg optimiert wird.

Anzeige der Intel Execution Engine, die die Darkmont E-Core-Funktionen veranschaulicht.

Die Verbesserungen des Speichersubsystems spiegeln ein umfassendes Upgrade wider: Eine Verdoppelung der L2-Cache-Bandbreite und beschleunigte L1-zu-L1-Übertragungen sind jetzt möglich, wodurch die Effizienz der Datenkommunikation verbessert wird.

Durch den Wegfall externer Fabric-Datenübertragungen kann der L2-Cache nun direkt über den L1-Cache auf Daten zugreifen. Die Taktrate wurde ebenfalls von 16 Byte auf 32 Byte pro Taktzyklus verbessert.

Vergleichstabelle der Crestmont- und Darkmont E-Core-Architekturen.

Zusammenfassend lässt sich sagen, dass die in Clearwater Forest eingesetzten Darkmont E-Cores im Vergleich zum 144-Kern-Xeon 6780E „Sierra Forest“ eine Leistungssteigerung von bis zu 90 % bieten, außerdem eine Effizienzsteigerung von 23 % bei unterschiedlichen Lasten erreichen und eine Serverkonsolidierung von bis zu 8:1 bei niedrigeren Gesamtbetriebskosten (TCO) unterstützen.

Anfängliche Leistungsmetriken

Intel hat vorläufige Leistungsstatistiken für die Clearwater Forest „Xeon 6+“-CPUs veröffentlicht und Vergleiche sowohl mit dem 144-Kern-Xeon 6700E „Sierra Forest“ als auch mit den noch unveröffentlichten 288-Kern-Xeon 6900E-Chips angestellt.

Diagramm zum Vergleich der Leistungskennzahlen von Clearwater Forest und Sierra Forest.

Im Gegensatz zum 144-Kern-Sierra Forest (Xeon 6780E), der mit 330 W betrieben wird, weist die Clearwater Forest-Variante mit 288 Kernen und einer TDP von 450 W eine bemerkenswerte, um 36, 3 % niedrigere TDP auf und erreicht bei doppelter Kernanzahl eine um 112, 7 % höhere Leistung und eine um 54, 7 % verbesserte Effizienz pro Watt.

Im Vergleich zum 288-Kern-Chip Sierra Forest, der eine TDP von 500 W erreicht, weist Clearwater Forest eine um 11 % niedrigere TDP auf und bietet gleichzeitig eine um 17 % bessere Leistung und eine um 30 % höhere Leistung pro Watt.

Leistungs- und Effizienzmetriken von Darkmont- und Crestmont-CPUs.

Diese höhere Leistung ist auf die fortschrittlichen Darkmont E-Cores zurückzuführen, die eine IPC-Steigerung von 17 % ermöglichen. Die Clearwater Forest-Plattform bietet dadurch eine 1, 9-fach verbesserte Leistung, eine Effizienzsteigerung von 23 % und unterstützt im Vergleich zu veralteten Xeon-Systemen erhebliche Serverkonsolidierungsraten.

Spezifikationen für Intel Xeon 6+ CPUs und Plattform

Die Clearwater Forest „Xeon 6+ CPUs“ nutzen den LGA 7529-Sockel, der sowohl in 1S- als auch in 2S-Konfigurationen einsetzbar ist. Dies ist derselbe Sockel wie der der Xeon 6900P „Granite Rapids-AP“-CPUs. Diese Chips arbeiten mit einer TDP von 300–500 Watt und spiegeln damit die Betriebsparameter der Xeon 6700E und 6900P mit 144 Kernen wider.

Bildschirm mit Hervorhebung der technischen Daten und Funktionen von Intel Clearwater Forest.

Diese CPUs ermöglichen bis zu 12-Kanal-DDR5-Speicher mit Unterstützung für Geschwindigkeiten von bis zu 8000 MT/s und bieten Platz für bis zu 6 UPI 2.0-Links (bis zu 24 GT/s), bis zu 96 PCIe Gen 5.0-Lanes und bis zu 64 CXL 2.0-Lanes.

Zu den Sicherheitsfunktionen der Architektur gehören Intel Software Guard Extensions (SGX) und Intel Trust Domain Extensions (TDX).Darüber hinaus wird das Energiemanagement durch Intels Application Energy Telemetry (AET) und Turbo Rate Limiter-Technologien verbessert. Die Clearwater Forest CPUs unterstützen Advanced Vector Extensions 2 (AVX2) mit VNNI- und INT8-Funktionen.

Intel Xeon 6+ bietet 288 E-Cores und DDR5-Speicherkapazität.

Zusammenfassend lässt sich sagen, wie Clearwater Forest „Xeon 6+“ im Vergleich zu Sierra Forest „Xeon 6“ abschneidet:

  • Bis zu 2x so viele Kerne
  • 17 % IPC-Verbesserung pro Kern
  • Mehr als 5x Last-Level-Cache
  • 4 zusätzliche Speicherkanäle
  • 2 weitere UPI-Links
  • 20 % höhere Speichergeschwindigkeit
Vergleich zwischen den Spezifikationen von Intel® Xeon 6700E und Clearwater Forest.

Die erwartete Markteinführung der Clearwater Forest „Xeon 6+“-CPUs von Intel ist für die zweite Hälfte des Jahres 2026 geplant. Bis zur Veröffentlichung werden voraussichtlich weitere Leistungsdaten und Erkenntnisse bekannt gegeben.

Übersicht der Intel Xeon CPU-Familien (vorläufig):

Familienbranding Diamantschnellen Clearwater Forest Granite Rapids Sierra Forest Emerald Rapids Saphirschnellen Ice Lake-SP Cooper Lake-SP Cascade Lake-SP/AP Skylake-SP
Prozessknoten Wird noch bekannt gegeben Intel 18A Intel 3 Intel 3 Intel 7 Intel 7 10 nm+ 14 nm++ 14 nm++ 14 nm+
Plattformname Intel Oak Stream Intel Birch Stream Intel Birch Stream Intel Mountain Stream/Intel Birch Stream Intel Eagle Stream Intel Eagle Stream Intel Whitley Intel Cedar Island Intel Purley Intel Purley
Kernarchitektur Panther Cove-X Darkmont Redwood Cove Sierra Glen Raptor Cove Goldene Bucht Sonnige Bucht Kaskadensee Kaskadensee Himmelssee
MCP (Multi-Chip-Paket) WeUs Ja Ja Ja Ja Ja Ja NEIN NEIN Ja NEIN
Buchse LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
Maximale Kernanzahl Wird noch bekannt gegeben Bis zu 288 Bis zu 128 Bis zu 288 Bis zu 64? Bis zu 56 Bis zu 40 Bis zu 28 Bis zu 28 Bis zu 28
Maximale Thread-Anzahl Wird noch bekannt gegeben Bis zu 288 Bis zu 256 Bis zu 288 Bis zu 128 Bis zu 112 Bis zu 80 Bis zu 56 Bis zu 56 Bis zu 56
Maximaler L3-Cache Wird noch bekannt gegeben Wird noch bekannt gegeben 480 MB L3 108 MB L3 320 MB L3 105 MB L3 60 MB L3 38, 5 MB L3 38, 5 MB L3
Speicherunterstützung Bis zu 16-Kanal DDR5? Bis zu 12-Kanal DDR5-8000 Bis zu 12-Kanal DDR5-6400/MCR-8800 Bis zu 12-Kanal DDR5-6400 Bis zu 8-Kanal DDR5-5600 Bis zu 8-Kanal DDR5-4800 Bis zu 8-Kanal DDR4-3200 Bis zu 6-Kanal DDR4-3200 DDR4-2933 6-Kanal DDR4-2666 6-Kanal
PCIe Gen-Unterstützung PCIe 6.0? PCIe 5.0 (96 Lanes) PCIe 5.0 (136 Lanes) PCIe 5.0 (88 Lanes) PCIe 5.0 (80 Lanes) PCIe 5.0 (80 Lanes) PCIe 4.0 (64 Lanes) PCIe 3.0 (48 Lanes) PCIe 3.0 (48 Lanes) PCIe 3.0 (48 Lanes)
TDP-Bereich (PL1) Wird noch bekannt gegeben Bis zu 500 W Bis zu 500 W Bis zu 350 W Bis zu 350 W Bis zu 350 W 105–270 W 150 W bis 250 W 165 W – 205 W 140 W – 205 W
3D Xpoint Optane DIMM Wird noch bekannt gegeben N / A Donahue Pass N / A Krähenpass Krähenpass Barlow Pass Barlow Pass Apache Pass N / A
Wettbewerb AMD EPYC Venedig AMD EPYC Turin AMD EPYC Turin AMD EPYC Bergamo AMD EPYC Genoa ~5 nm AMD EPYC Genoa ~5 nm AMD EPYC Milan 7nm+ AMD EPYC Rome 7 nm AMD EPYC Rome 7 nm AMD EPYC Naples 14 nm
Start 2025–2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert