Analyse approfondie des processeurs Intel Clearwater Forest « Xeon 6+ » : jusqu’à 288 cœurs Darkmont E-Cores, 576 Mo de cache et 18 A avec la technologie Foveros D3D + EMIB 2.5D

Analyse approfondie des processeurs Intel Clearwater Forest « Xeon 6+ » : jusqu’à 288 cœurs Darkmont E-Cores, 576 Mo de cache et 18 A avec la technologie Foveros D3D + EMIB 2.5D

Intel a fourni des informations supplémentaires sur sa prochaine famille de processeurs Xeon 6+ E-core, connue sous le nom de Clearwater Forest, qui dispose d’un nombre impressionnant de cœurs allant jusqu’à 288 cœurs de nouvelle génération.

Présentation d’Intel Clearwater Forest : 288 E-Cores Darkmont de nouvelle génération pour serveurs de calcul haute densité

S’appuyant sur les avancées de son prédécesseur, Sierra Forest, premier processeur Xeon dédié E-Core offrant une densité de calcul accrue et une meilleure efficacité, Intel réalise des avancées significatives avec Clearwater Forest. Il s’agit d’une évolution notable de la gamme Xeon d’Intel, désormais organisée en familles distinctes pour les cœurs hautes performances (P-Core) et les cœurs performants (E-Core).

Logo Intel à côté de « Data Center Strategic Overview » sur un fond de micropuce.

La Clearwater Forest marque le début de la deuxième génération de processeurs E-Core uniquement sous la marque Xeon 6+.

Présentation des processeurs Intel Xeon 6+ et Intel Xeon 6, auparavant nommés Granite Rapids et Sierra Forest.

Technologie avancée : Intel 18A, RibbonFET et Power Via avec Foveros Direct3D

Avec Clearwater Forest, Intel optimise son architecture désagrégée et ses solutions de packaging avancées. Cette nouvelle structure de puce utilise une conception multicouche intégrant divers chiplets et composants, démontrant ainsi le savoir-faire d’Intel en matière d’ingénierie.

Écran des détails du processeur du serveur Intel Clearwater Forest avec des fonctionnalités telles que 288 cœurs E et Intel 18A.

L’architecture Clearwater Forest intègre douze tuiles EMIB utilisant la technologie de packaging 2, 5D. Cette configuration connecte trois tuiles de base actives, deux tuiles d’E/S et un total de douze tuiles de calcul. Les tuiles d’E/S sont construites sur le nœud Intel 7, les tuiles de base actives utilisent le nœud de processus Intel 3, et les puces de calcul sont produites avec la technologie de pointe Intel 18A.

Diagramme d'architecture de Clearwater Forest montrant une tuile de calcul 12x avec Intel 18A et d'autres composants.

Chaque puce de calcul, intégrant la conception Darkmont E-Core, est fabriquée selon le nœud de traitement 18A, qui utilise la technologie RibbonFET, optimisant ainsi le rendement énergétique grâce à une capacité de grille réduite. De plus, le procédé 18A offre une densité de cellules impressionnante de plus de 90 % et optimise le routage du signal via les rails d’alimentation arrière, réduisant ainsi considérablement les pertes d’énergie de 4 à 5 %.

Infographie du processus Intel 18A mettant en évidence les avantages tels qu'une densité cellulaire plus élevée.

La technologie RibbonFET améliore la gestion du courant électrique et réduit les fuites de puissance, offrant ainsi des gains de performances notables. Cette innovation permet une meilleure maîtrise des courants électriques tout en maintenant des tensions de fonctionnement plus faibles. Les longueurs de grille plus courtes qui en résultent contribuent à une baisse de 20 % de la consommation d’énergie par transistor.

Diagramme de la technologie RibbonFET avec des fonctionnalités mises en évidence telles que le contrôle du courant électrique.

Les principales caractéristiques de la technologie RibbonFET comprennent :

  • Miniaturisation améliorée des composants de puces pour les processeurs haute densité
  • Contrôle précis des courants électriques dans le canal du transistor
  • Amélioration des performances par watt et de l’efficacité opérationnelle
  • Paramètres réglables activés via les largeurs de ruban et divers types de tension de seuil

La technologie PowerVia complète le RibbonFET en augmentant l’utilisation des cellules standard jusqu’à 10 % et les performances ISO-power de 4 %.Cette approche canalise l’énergie depuis le dessous du silicium, améliorant ainsi les performances globales de la puce.

Diagramme Intel PowerVia décrivant les principales fonctionnalités.

Les points forts de la technologie PowerVia incluent :

  • Réduction de la congestion de la distribution d’énergie, améliorant les performances globales de la puce
  • Redistribution des pas de parcours pour optimiser l’agencement
  • Intégration de la matrice arrière pour une gestion efficace de l’alimentation
  • TSV à l’échelle nanométrique pour une distribution d’énergie améliorée
  • Capacités de routage de signaux supérieures
  • Densité cellulaire supérieure à 90 % pour une utilisation optimisée de l’espace

De plus, Clearwater Forest sera le premier à utiliser Foveros Direct3D, une solution de packaging innovante qui relie efficacement les tuiles de calcul et d’E/S sur les tuiles actives de base. Cette technologie minimise la consommation d’énergie grâce à un pas de bosse de 9 µm, permettant un transfert de données efficace entre les tuiles.

L’aperçu de la construction 3D suivant illustre l’architecture du processeur Clearwater Forest Xeon 6+ :

Diagramme de construction 3D d'Intel Clearwater Forest avec chiplets étiquetés.

Exploration des trois principales tuiles de la forêt de Clearwater

L’architecture de Clearwater Forest comprend trois tuiles principales : la tuile de calcul, la tuile d’E/S et la tuile de base.

Tuile d’E/S de Clearwater Forest

Cette tuile utilise la technologie de processus Intel 7 et intègre huit accélérateurs répartis sur deux packages, dont la technologie Intel Quick Assist, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator et Intel In-Memory Analytics Accelerator, pour un total de 16 accélérateurs.

Diagramme d'architecture de tuiles d'E/S Intel présentant des détails technologiques.

Chaque dalle d’E/S est équipée de 48 voies PCIe Gen 5.0 (soit 96 au total), de 32 voies CXL 2.0 (soit 64 au total) et de 96 voies UPI 2.0 (soit 192 au total).Bien que inchangée par rapport à Granite Rapids, cette conception représente une amélioration significative par rapport à Sierra Forest.

Carreaux de base Clearwater Forest

La tuile de base, connectée via EMIB aux tuiles de calcul situées au-dessus, utilise la technologie de traitement Intel 3 pour héberger trois tuiles de base. Chacune de ces tuiles de base contient quatre contrôleurs mémoire DDR5, soit un total de 12 canaux mémoire. De plus, elles fournissent un LLC partagé de 48 Mo pour chaque tuile de calcul, soit un total de 576 Mo de LLC intégré.

Tuile de calcul de la forêt de Clearwater

Les tuiles de calcul représentent l’aspect le plus avancé de Clearwater Forest, intégrant la nouvelle technologie de traitement 18A. Chaque tuile est structurée en six modules, chacun hébergeant quatre cœurs électroniques Darkmont, soit 24 cœurs électroniques par tuile de calcul et 288 cœurs électroniques répartis sur les douze tuiles.

Diapositive Intel Tech Tour présentant l'architecture Compute Tile avec des détails sur les modules et les E-cores.
Infographie de l'architecture Intel Compute Tile présentant les spécifications.
Architecture Intel Compute Tile mettant en évidence les spécifications de base.
Diagramme d'architecture Intel Compute Tile détaillant les cœurs électroniques Darkmont.

De plus, chaque module intègre 4 Mo de cache L2, soit 24 Mo par tuile de calcul et un total de 288 Mo de cache L2 répartis sur les douze tuiles. Associée au LLC, la puce atteint 864 Mo de cache.

  • 12x tuiles de calcul (Intel 18A)
  • 3x tuiles de base actives (Intel 3)
  • 2x tuiles d’E/S Intel (Intel 7)
  • 12x tuiles EMIB (EMIB 2.5D)

Regard approfondi sur Darkmont E-Core

Examinons maintenant de plus près le Darkmont E-Core, qui est également utilisé dans les processeurs clients Panther Lake.

Diapositive Intel intitulée « Darkmont E-core Deep Dive » par Stephen Robinson, membre d'Intel.

Bien que l’architecture Darkmont présente des similitudes avec la conception Skymont présentée dans les processeurs Lunar Lake et Arrow Lake, elle représente une mise à niveau substantielle par rapport à Crestmont.

Diagramme Intel intitulé « Darkmont E-core » avec des sections étiquetées.

Parmi les améliorations notables apportées au cœur de Darkmont, on compte un bloc de prédiction mis à jour de 128 octets, une récupération d’instructions optimisée et une microarchitecture à 9 bits de large, dotée d’une unité de décodage plus large intégrant 50 % de clusters de décodage en plus par rapport à Crestmont. Parmi les autres améliorations, on compte une capacité de file d’attente Uop accrue et un cache d’instructions plus précis.

Diagramme du moteur Intel Darkmont E-core hors service avec les fonctionnalités d'allocation et de retrait mises en évidence.

Intel a également amélioré le moteur de traitement hors service (OOE).Il dispose d’un mécanisme d’allocation sur 8 bits et d’un mécanisme de retrait sur 16 bits pour une gestion plus rapide des ressources, ainsi que d’une fenêtre de traitement hors service plus importante, avec 416 entrées.

L’expansion sur les ports de répartition a atteint 26, avec le moteur scalaire doté de 8 ALU entières, tandis que le moteur vectoriel comprend 4 ALU flottantes, optimisant les performances sur plusieurs tâches d’exécution.

Affichage du moteur d'exécution Intel illustrant les fonctionnalités de Darkmont E-core.

Les améliorations du sous-système de mémoire reflètent une mise à niveau complète : le doublement de la bande passante du cache L2 et les transferts L1 vers L1 accélérés sont désormais possibles, améliorant l’efficacité de la communication des données.

Grâce à l’élimination des transferts de données externes, le cache L2 peut désormais accéder directement aux données via le cache L1. La fréquence d’horloge de conviction a également été améliorée, passant de 16 à 32 octets par cycle d’horloge.

Tableau comparatif des architectures Crestmont et Darkmont E-Core.

En conclusion, les E-Cores Darkmont présents dans Clearwater Forest offrent une augmentation des performances allant jusqu’à 90 % par rapport au Xeon 6780E « Sierra Forest » à 144 cœurs, atteignant également une augmentation de 23 % de l’efficacité sur des charges variées et prenant en charge une consolidation de serveur jusqu’à 8:1 avec un coût total de possession (TCO) inférieur.

Indicateurs de performance initiaux

Intel a publié des statistiques de performances préliminaires pour les processeurs Clearwater Forest « Xeon 6+ », présentant des comparaisons avec les puces Xeon 6700E « Sierra Forest » à 144 cœurs et les puces Xeon 6900E à 288 cœurs non commercialisées.

Graphique comparant les indicateurs de performance de Clearwater Forest et de Sierra Forest.

Contrairement au Sierra Forest (Xeon 6780E) à 144 cœurs fonctionnant à 330 W, la variante Clearwater Forest avec 288 cœurs et un TDP de 450 W démontre un TDP remarquablement inférieur de 36, 3 %, avec un nombre de cœurs doublé, atteignant des performances supérieures de 112, 7 % et une efficacité améliorée de 54, 7 % par watt.

Par rapport à la puce Sierra Forest à 288 cœurs, qui gère un TDP de 500 W, Clearwater Forest maintient un TDP inférieur de 11 % tout en offrant des performances supérieures de 17 % et des performances par watt supérieures de 30 %.

Mesures de performance et d'efficacité des processeurs Darkmont et Crestmont.

Ces performances accrues sont le fruit des cœurs E-Cores Darkmont avancés, qui augmentent l’IPC de 17 %.La plateforme Clearwater Forest offre ainsi des performances 1, 9 fois supérieures, une efficacité accrue de 23 % et des taux de consolidation de serveurs substantiels par rapport aux systèmes Xeon obsolètes.

Spécifications des processeurs et de la plateforme Intel Xeon 6+

Les processeurs Clearwater Forest « Xeon 6+ » utiliseront le socket LGA 7529, compatible avec les configurations 1S et 2S. Ce socket est identique à celui des processeurs Xeon 6900P « Granite Rapids-AP ».Ces puces fonctionneront avec une plage de TDP de 300 à 500 W, reproduisant les paramètres de fonctionnement des Xeon 6700E et 6900P, dotés de 144 cœurs.

Écran mettant en évidence les spécifications techniques et les fonctionnalités d'Intel Clearwater Forest.

Ces processeurs prendront en charge jusqu’à 12 canaux de mémoire DDR5 avec prise en charge de vitesses allant jusqu’à 8 000 MT/s, ainsi que jusqu’à 6 liaisons UPI 2.0 (jusqu’à 24 GT/s), jusqu’à 96 voies PCIe Gen 5.0 et jusqu’à 64 voies CXL 2.0.

En termes de sécurité, l’architecture intègre les extensions Intel Software Guard (SGX) et Intel Trust Domain Extensions (TDX).De plus, la gestion de l’alimentation est optimisée par les technologies Intel Application Energy Telemetry (AET) et Turbo Rate Limiter. Les processeurs Clearwater Forest prendront en charge les extensions vectorielles avancées 2 (AVX2) avec les fonctionnalités VNNI et INT8.

Caractéristiques du processeur Intel Xeon 6+ montrant 288 cœurs E et des capacités de mémoire DDR5.

En résumé, voici comment Clearwater Forest « Xeon 6+ » se compare à Sierra Forest « Xeon 6 » :

  • Jusqu’à 2 fois le nombre de cœurs
  • Amélioration de 17 % de l’IPC par cœur
  • Plus de 5x le dernier niveau de cache
  • 4 canaux de mémoire supplémentaires
  • 2 autres liens UPI
  • Augmentation de 20 % de la vitesse de la mémoire
Comparaison entre les spécifications Intel® Xeon 6700E et Clearwater Forest.

Le lancement prévu des processeurs Intel Clearwater Forest « Xeon 6+ » est prévu pour le second semestre 2026, et des données de performances et des informations supplémentaires devraient être dévoilées avant la sortie.

Présentation des familles de processeurs Intel Xeon (préliminaire) :

Image de marque familiale Rapides de Diamant Forêt de Clearwater Granite Rapids Forêt de la Sierra Rapides d’Émeraude Rapides de Saphir Lac de glace-SP Cooper Lake-SP Lac Cascade-SP/AP Skylake-SP
Nœud de processus À déterminer Intel 18A Intel 3 Intel 3 Intel 7 Intel 7 10 nm+ 14 nm++ 14 nm++ 14 nm+
Nom de la plateforme Intel Oak Stream Intel Birch Stream Intel Birch Stream Intel Mountain Stream/Intel Birch Stream Intel Eagle Stream Intel Eagle Stream Intel Whitley Intel Cedar Island Intel Purley Intel Purley
Architecture de base Panther Cove-X Mont Sombre Crique de Redwood Sierra Glen Crique des Raptors Crique dorée Sunny Cove Lac Cascade Lac Cascade Skylake
MCP (boîtier multi-puces) WeUs Oui Oui Oui Oui Oui Oui Non Non Oui Non
Douille LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
Nombre maximal de cœurs À déterminer Jusqu’à 288 Jusqu’à 128 Jusqu’à 288 Jusqu’à 64 ans ? Jusqu’à 56 Jusqu’à 40 Jusqu’à 28 Jusqu’à 28 Jusqu’à 28
Nombre maximal de fils À déterminer Jusqu’à 288 Jusqu’à 256 Jusqu’à 288 Jusqu’à 128 Jusqu’à 112 Jusqu’à 80 Jusqu’à 56 Jusqu’à 56 Jusqu’à 56
Max L3 Cache À déterminer À déterminer 480 Mo L3 108 Mo L3 320 Mo L3 105 Mo L3 60 Mo L3 38, 5 Mo L3 38, 5 Mo L3
Prise en charge de la mémoire Jusqu’à 16 canaux DDR5 ? Jusqu’à 12 canaux DDR5-8000 Jusqu’à 12 canaux DDR5-6400/MCR-8800 Jusqu’à 12 canaux DDR5-6400 Jusqu’à 8 canaux DDR5-5600 Jusqu’à 8 canaux DDR5-4800 Jusqu’à 8 canaux DDR4-3200 Jusqu’à 6 canaux DDR4-3200 DDR4-2933 6 canaux DDR4-2666 6 canaux
Prise en charge de la génération PCIe PCIe 6.0 ? PCIe 5.0 (96 voies) PCIe 5.0 (136 voies) PCIe 5.0 (88 voies) PCIe 5.0 (80 voies) PCIe 5.0 (80 voies) PCIe 4.0 (64 voies) PCIe 3.0 (48 voies) PCIe 3.0 (48 voies) PCIe 3.0 (48 voies)
Plage de TDP (PL1) À déterminer Jusqu’à 500 W Jusqu’à 500 W Jusqu’à 350 W Jusqu’à 350 W Jusqu’à 350 W 105-270 W 150W-250W 165W-205W 140W-205W
Module DIMM 3D Xpoint Optane À déterminer N / A Col de Donahue N / A Col du Corbeau Col du Corbeau Col de Barlow Col de Barlow Col d’Apache N / A
Concours AMD EPYC Venise AMD EPYC Turin AMD EPYC Turin AMD EPYC Bergame AMD EPYC Gênes ~5 nm AMD EPYC Gênes ~5 nm AMD EPYC Milan 7 nm+ AMD EPYC Rome 7 nm AMD EPYC Rome 7 nm AMD EPYC Naples 14 nm
Lancement 2025-2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *