
Firma Intel udostępniła dodatkowe informacje na temat nadchodzącej rodziny procesorów Xeon 6+ E-core, znanej jako Clearwater Forest, która może pochwalić się imponującą liczbą rdzeni — aż 288 rdzeni nowej generacji.
Przedstawiamy Intel Clearwater Forest: 288 rdzeni Darkmont E nowej generacji do serwerów obliczeniowych o wysokiej gęstości
Kontynuując postępy poczynione przez swojego poprzednika, Sierra Forest – pierwszy procesor Xeon z rdzeniami E-Core, który oferował zwiększoną gęstość obliczeniową i wydajność – Intel wprowadza znaczący postęp w Clearwater Forest. To znacząca ewolucja w ofercie Intel Xeon, która jest teraz podzielona na oddzielne rodziny dla rdzeni wydajnościowych (P-Core) i rdzeni wydajnych (E-Core).

Clearwater Forest oznacza początek drugiej generacji procesorów E-Core wyłącznie pod marką Xeon 6+.

Zaawansowana technologia: Intel 18A, RibbonFET i Power Via z Foveros Direct3D
Dzięki Clearwater Forest, Intel podnosi poziom swojej rozproszonej architektury i zaawansowanych rozwiązań w zakresie pakowania. Ta nowa struktura układu scalonego wykorzystuje wielowarstwową konstrukcję z różnymi chipletami i komponentami, co świadczy o inżynierskim kunszcie Intela.

Architektura Clearwater Forest integruje dwanaście płytek EMIB w technologii pakowania 2.5D. Ta konfiguracja łączy trzy aktywne płytki bazowe, dwa płytki I/O i łącznie dwanaście płytek obliczeniowych. Płytki I/O są zbudowane na węźle Intel 7, aktywne płytki bazowe wykorzystują węzeł procesowy Intel 3, a chiplety obliczeniowe są produkowane w najnowocześniejszej technologii Intel 18A.

Każdy chiplet obliczeniowy, oparty na konstrukcji Darkmont E-Core, jest wytwarzany w węźle procesowym 18A, który wykorzystuje technologię RibbonFET, optymalizując efektywność energetyczną poprzez redukcję pojemności bramki. Co więcej, proces 18A charakteryzuje się imponującą gęstością ogniw przekraczającą 90% i umożliwia lepsze kierowanie sygnału przez tylne szyny zasilania, znacząco minimalizując straty energii o 4-5%.

Technologia RibbonFET usprawnia zarządzanie prądem elektrycznym i zmniejsza upływ mocy, co przekłada się na znaczne korzyści w zakresie wydajności. Ta innowacja umożliwia lepszą kontrolę prądu elektrycznego przy jednoczesnym utrzymaniu niższych napięć roboczych, a wynikające z tego krótsze długości bramek przyczyniają się do 20% zmniejszenia poboru mocy na tranzystor.

Do najważniejszych cech technologii RibbonFET należą:
- Ulepszona miniaturyzacja komponentów chipowych dla procesorów o dużej gęstości
- Precyzyjna kontrola prądów elektrycznych w kanale tranzystorowym
- Lepsza wydajność na wat i efektywność operacyjna
- Możliwość dostrojenia parametrów za pomocą szerokości wstęgi i różnych typów napięcia progowego
Technologia PowerVia uzupełnia technologię RibbonFET, zwiększając wykorzystanie standardowych ogniw nawet o 10% i wydajność energetyczną ISO o 4%.Takie podejście kieruje energię spod krzemu, poprawiając ogólną wydajność układu.

Najważniejsze cechy technologii PowerVia obejmują:
- Zmniejszone obciążenie dystrybucji mocy, co zwiększa ogólną wydajność układu scalonego
- Ponowne rozmieszczenie metali nawierzchniowych w celu optymalizacji układu
- Integracja tylnej części układu scalonego w celu wydajnego zarządzania energią
- TSV w skali nano dla lepszego rozdziału mocy
- Doskonałe możliwości routingu sygnału
- Ponad 90% gęstości ogniw dla optymalnego wykorzystania przestrzeni
Co więcej, Clearwater Forest będzie pierwszym systemem produkcji wielkoseryjnej wykorzystującym technologię Foveros Direct3D, innowacyjne rozwiązanie do pakowania, które skutecznie łączy moduły obliczeniowe i wejścia/wyjścia na aktywnych modułach bazowych. Technologia ta minimalizuje zużycie energii dzięki odstępowi między modułami wynoszącemu 9 um, umożliwiając efektywny transfer danych między modułami.
Poniższy przegląd konstrukcji 3D ilustruje architekturę procesora Clearwater Forest Xeon 6+:

Eksploracja trzech głównych pól lasu Clearwater
Architektura Clearwater Forest składa się z trzech głównych kafelków: kafelek obliczeniowy, kafelek wejścia/wyjścia i kafelek podstawowy.
Płytka Clearwater Forest I/O
Ten moduł wykorzystuje technologię Intel 7 i integruje osiem akceleratorów w dwóch pakietach, w tym Intel Quick Assist Technology, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator i Intel In-Memory Analytics Accelerator, co daje łącznie 16 akceleratorów.

Każdy moduł I/O jest wyposażony w 48 linii PCIe Gen 5.0 (łącznie 96), 32 linie CXL 2.0 (łącznie 64) i 96 linii UPI 2.0 (łącznie 192).Choć konstrukcja ta nie różni się od Granite Rapids, stanowi znaczącą poprawę w porównaniu z Sierra Forest.
Płytka bazowa Clearwater Forest
Moduł Base Tile, połączony przez EMIB z modułami obliczeniowymi powyżej, wykorzystuje technologię Intel 3 Process do przechowywania trzech modułów Base Tile. Każdy z tych modułów Base Tile zawiera cztery kontrolery pamięci DDR5, co daje łącznie 12 kanałów pamięci. Ponadto zapewniają one współdzieloną pamięć LLC o pojemności 48 MB dla każdego modułu obliczeniowego, co daje łącznie 576 MB pamięci LLC w pakiecie.

Płytka obliczeniowa Clearwater Forest
Kafelki obliczeniowe reprezentują najbardziej zaawansowany aspekt Clearwater Forest, wykorzystując nową technologię procesową 18A. Każdy kafelek składa się z sześciu modułów, z których każdy zawiera cztery rdzenie Darkmont E-Core, co daje łącznie 24 rdzenie E-Core na kafelek obliczeniowy i 288 rdzeni E-Core na wszystkich dwunastu kafelkach.




Co więcej, każdy moduł zawiera 4 MB pamięci podręcznej L2, co przekłada się na 24 MB na kafelek obliczeniowy i łącznie 288 MB pamięci podręcznej L2 w dwunastu kafelkach. W połączeniu z modułem LLC cały układ osiąga 864 MB pamięci podręcznej.
- 12x płytek obliczeniowych (Intel 18A)
- 3x aktywne kafelki bazowe (Intel 3)
- 2x płytki Intel I/O (Intel 7)
- 12x płytek EMIB (EMIB 2.5D)
Szczegółowe spojrzenie na Darkmont E-Core
Przyjrzyjmy się teraz bliżej procesorowi Darkmont E-Core, stosowanemu również w procesorach klienckich Panther Lake.

Choć architektura Darkmont przypomina konstrukcję Skymont zastosowaną w procesorach Lunar Lake i Arrow Lake, to jednak stanowi ona znaczącą modernizację w stosunku do architektury Crestmont.

Do istotnych ulepszeń w rdzeniu Darkmont należą: zaktualizowany blok predykcyjny o pojemności 128 bajtów, ulepszone pobieranie instrukcji oraz mikroarchitektura o szerokości 9 bitów, charakteryzująca się szerszą jednostką dekodującą, która zawiera o 50% więcej klastrów dekodujących w porównaniu z Crestmont. Inne udoskonalenia obejmują zwiększoną pojemność kolejki Uop i udoskonaloną pamięć podręczną instrukcji.

Firma Intel udoskonaliła również mechanizm Out-of-Order Engine (OOE).Oferuje on 8-szeroki mechanizm alokacji i 16-szeroki mechanizm wycofywania, co pozwala na szybsze zarządzanie zasobami, a także znacznie większą pojemność okna Out-of-Order, wynoszącą 416 wpisów.
Liczba rozszerzeń w portach dyspozytorskich osiągnęła 26, przy czym Scalar Engine zawiera 8 jednostek ALU typu Integer, podczas gdy Vector Engine zawiera 4 jednostki ALU typu float, co optymalizuje wydajność w przypadku wielu zadań wykonawczych.

Usprawnienia podsystemu pamięci odzwierciedlają kompleksową modernizację: teraz możliwe jest podwojenie przepustowości pamięci podręcznej L2 i przyspieszenie transferów z L1 do L1, co zwiększa wydajność komunikacji danych.
Dzięki wyeliminowaniu zewnętrznych transferów danych, pamięć podręczna L2 może teraz uzyskiwać bezpośredni dostęp do danych za pośrednictwem pamięci podręcznej L1. Częstotliwość taktowania procesora uległa poprawie z 16 do 32 bajtów w każdym cyklu zegara.

Podsumowując, rdzenie Darkmont E-Cores zastosowane w Clearwater Forest oferują wzrost wydajności nawet o 90% w porównaniu ze 144-rdzeniowym procesorem Xeon 6780E „Sierra Forest”, a także osiągają 23-procentowy wzrost efektywności przy zróżnicowanych obciążeniach i obsługują konsolidację serwerów do 8:1 przy niższym całkowitym koszcie posiadania (TCO).
Początkowe wskaźniki wydajności
Firma Intel opublikowała wstępne statystyki wydajności procesorów Clearwater Forest „Xeon 6+”, prezentując porównania zarówno z 144-rdzeniowym procesorem Xeon 6700E „Sierra Forest”, jak i z niewydanym jeszcze 288-rdzeniowym procesorem Xeon 6900E.

W porównaniu ze 144-rdzeniowym procesorem Sierra Forest (Xeon 6780E) pracującym z mocą 330 W, wariant Clearwater Forest z 288 rdzeniami i TDP na poziomie 450 W charakteryzuje się znacząco niższym TDP o 36, 3%, przy podwojonej liczbie rdzeni, osiągając o 112, 7% wyższą wydajność i o 54, 7% większą sprawność na wat.
W porównaniu do 288-rdzeniowego układu Sierra Forest, który osiąga TDP na poziomie 500 W, Clearwater Forest charakteryzuje się TDP niższym o 11%, a jednocześnie oferuje o 17% lepszą wydajność i o 30% większą wydajność na wat.

Ta wyższa wydajność wynika z zaawansowanych rdzeni Darkmont E-Cores, które zapewniają 17% wzrost IPC. Platforma Clearwater Forest oferuje 1, 9-krotnie wyższą wydajność, 23% wzrost efektywności i obsługuje znaczne wskaźniki konsolidacji serwerów w porównaniu ze starszymi systemami Xeon.
Specyfikacje procesorów i platformy Intel Xeon 6+
Procesory Clearwater Forest „Xeon 6+” będą wykorzystywać gniazdo LGA 7529, dostępne zarówno w konfiguracjach 1S, jak i 2S. Jest to to samo gniazdo, które jest używane w procesorach Xeon 6900P „Granite Rapids-AP”.Układy te będą pracować w zakresie TDP od 300 do 500 W, co odzwierciedla parametry operacyjne procesorów Xeon 6700E i 6900P, które posiadają 144 rdzenie.

Te procesory umożliwią obsługę pamięci DDR5 nawet z 12 kanałami i prędkością do 8000 MT/s, a także do 6 łączy UPI 2.0 (do 24 GT/s), do 96 linii PCIe Gen 5.0 i do 64 linii CXL 2.0.
Jeśli chodzi o funkcje bezpieczeństwa, architektura obejmuje rozszerzenia Intel Software Guard Extensions (SGX) i Intel Trust Domain Extensions (TDX).Ponadto zarządzanie energią jest usprawnione dzięki technologiom Intel Application Energy Telemetry (AET) i Turbo Rate Limiter. Procesory Clearwater Forest będą obsługiwać Advanced Vector Extensions 2 (AVX2) z funkcjami VNNI i INT8.

Podsumowując, oto jak Clearwater Forest „Xeon 6+” wypada w porównaniu z Sierra Forest „Xeon 6”:
- Do 2x większa liczba rdzeni
- 17% poprawy IPC na rdzeń
- Ponad 5-krotna pamięć podręczna ostatniego poziomu
- 4 dodatkowe kanały pamięci
- Jeszcze 2 linki UPI
- O 20% zwiększona prędkość pamięci

Wprowadzenie na rynek procesorów Intel Clearwater Forest „Xeon 6+” planowane jest na drugą połowę 2026 r. Przed premierą spodziewane jest opublikowanie dodatkowych danych dotyczących wydajności i spostrzeżeń.
Przegląd rodzin procesorów Intel Xeon (wstępny):
Branding rodzinny | Diamentowe Rapids | Las Clearwater | Granite Rapids | Las Sierra | Emerald Rapids | Sapphire Rapids | Jezioro Lodowe-SP | Jezioro Coopera-SP | Jezioro Cascade-SP/AP | Skylake-SP |
---|---|---|---|---|---|---|---|---|---|---|
Węzeł procesu | Do ustalenia | Intel 18A | Intel 3 | Intel 3 | Intel 7 | Intel 7 | 10nm+ | 14nm++ | 14nm++ | 14nm+ |
Nazwa platformy | Intel Oak Stream | Intel Birch Stream | Intel Birch Stream | Intel Mountain Stream/Intel Birch Stream | Intel Eagle Stream | Intel Eagle Stream | Intel Whitley | Intel Cedar Island | Intel Purley | Intel Purley |
Architektura rdzeniowa | Panther Cove-X | Darkmont | Redwood Cove | Sierra Glen | Zatoka Drapieżników | Złota Zatoka | Słoneczna Zatoka | Jezioro Kaskadowe | Jezioro Kaskadowe | Skylake |
MCP (pakiet wieloprocesorowy) WeUs | Tak | Tak | Tak | Tak | Tak | Tak | NIE | NIE | Tak | NIE |
Gniazdo | LGA XXXX / 9324 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4710 / 7529 | LGA 4677 | LGA 4677 | LGA 4189 | LGA 4189 | LGA 3647 | LGA 3647 |
Maksymalna liczba rdzeni | Do ustalenia | Do 288 | Do 128 | Do 288 | Do 64? | Do 56 | Do 40 | Do 28 | Do 28 | Do 28 |
Maksymalna liczba wątków | Do ustalenia | Do 288 | Do 256 | Do 288 | Do 128 | Do 112 | Do 80 | Do 56 | Do 56 | Do 56 |
Maksymalna pamięć podręczna L3 | Do ustalenia | Do ustalenia | 480 MB L3 | 108 MB L3 | 320 MB L3 | 105 MB L3 | 60 MB L3 | 38, 5 MB L3 | 38, 5 MB L3 | |
Obsługa pamięci | DDR5 do 16 kanałów? | Do 12 kanałów DDR5-8000 | Do 12 kanałów DDR5-6400/MCR-8800 | Do 12 kanałów DDR5-6400 | Do 8-kanałowej pamięci DDR5-5600 | Do 8-kanałowej pamięci DDR5-4800 | Do 8-kanałowej pamięci DDR4-3200 | Do 6-kanałowej pamięci DDR4-3200 | DDR4-2933 6-kanałowa | DDR4-2666 6-kanałowa |
Wsparcie PCIe Gen | PCIe 6.0? | PCIe 5.0 (96 linii) | PCIe 5.0 (136 linii) | PCIe 5.0 (88 linii) | PCIe 5.0 (80 linii) | PCIe 5.0 (80 linii) | PCIe 4.0 (64 linie) | PCIe 3.0 (48 linii) | PCIe 3.0 (48 linii) | PCIe 3.0 (48 linii) |
Zasięg TDP (PL1) | Do ustalenia | Do 500 W | Do 500 W | Do 350 W | Do 350 W | Do 350 W | 105-270 W | 150W-250W | 165W-205W | 140W-205W |
Moduł 3D Xpoint Optane DIMM | Do ustalenia | Nie dotyczy | Przełęcz Donahue | Nie dotyczy | Przełęcz Crow | Przełęcz Crow | Przełęcz Barlow | Przełęcz Barlow | Przełęcz Apaczów | Nie dotyczy |
Konkurs | AMD EPYC Venice | AMD EPYC Turyn | AMD EPYC Turyn | AMD EPYC Bergamo | AMD EPYC Genoa ~5nm | AMD EPYC Genoa ~5nm | AMD EPYC Milan 7nm+ | AMD EPYC Rome 7 nm | AMD EPYC Rome 7 nm | AMD EPYC Naples 14 nm |
Początek | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 |
Dodaj komentarz