Szczegółowa analiza procesorów Intel Clearwater Forest „Xeon 6+”: wyposażonych w maksymalnie 288 rdzeni Darkmont E, 576 MB pamięci podręcznej i 18 A z technologią Foveros D3D + EMIB 2.5D

Szczegółowa analiza procesorów Intel Clearwater Forest „Xeon 6+”: wyposażonych w maksymalnie 288 rdzeni Darkmont E, 576 MB pamięci podręcznej i 18 A z technologią Foveros D3D + EMIB 2.5D

Firma Intel udostępniła dodatkowe informacje na temat nadchodzącej rodziny procesorów Xeon 6+ E-core, znanej jako Clearwater Forest, która może pochwalić się imponującą liczbą rdzeni — aż 288 rdzeni nowej generacji.

Przedstawiamy Intel Clearwater Forest: 288 rdzeni Darkmont E nowej generacji do serwerów obliczeniowych o wysokiej gęstości

Kontynuując postępy poczynione przez swojego poprzednika, Sierra Forest – pierwszy procesor Xeon z rdzeniami E-Core, który oferował zwiększoną gęstość obliczeniową i wydajność – Intel wprowadza znaczący postęp w Clearwater Forest. To znacząca ewolucja w ofercie Intel Xeon, która jest teraz podzielona na oddzielne rodziny dla rdzeni wydajnościowych (P-Core) i rdzeni wydajnych (E-Core).

Logo firmy Intel obok napisu „Strategiczny przegląd centrów danych” na tle mikroprocesora.

Clearwater Forest oznacza początek drugiej generacji procesorów E-Core wyłącznie pod marką Xeon 6+.

Przedstawiamy procesory Intel Xeon 6+ i Intel Xeon 6, wcześniej znane pod nazwami kodowymi Granite Rapids i Sierra Forest.

Zaawansowana technologia: Intel 18A, RibbonFET i Power Via z Foveros Direct3D

Dzięki Clearwater Forest, Intel podnosi poziom swojej rozproszonej architektury i zaawansowanych rozwiązań w zakresie pakowania. Ta nowa struktura układu scalonego wykorzystuje wielowarstwową konstrukcję z różnymi chipletami i komponentami, co świadczy o inżynierskim kunszcie Intela.

Ekran szczegółów procesora serwerowego Intel Clearwater Forest z informacjami o takich cechach, jak 288 rdzeni E i Intel 18A.

Architektura Clearwater Forest integruje dwanaście płytek EMIB w technologii pakowania 2.5D. Ta konfiguracja łączy trzy aktywne płytki bazowe, dwa płytki I/O i łącznie dwanaście płytek obliczeniowych. Płytki I/O są zbudowane na węźle Intel 7, aktywne płytki bazowe wykorzystują węzeł procesowy Intel 3, a chiplety obliczeniowe są produkowane w najnowocześniejszej technologii Intel 18A.

Schemat architektury Clearwater Forest przedstawiający kafelek Compute 12x z procesorem Intel 18A i innymi komponentami.

Każdy chiplet obliczeniowy, oparty na konstrukcji Darkmont E-Core, jest wytwarzany w węźle procesowym 18A, który wykorzystuje technologię RibbonFET, optymalizując efektywność energetyczną poprzez redukcję pojemności bramki. Co więcej, proces 18A charakteryzuje się imponującą gęstością ogniw przekraczającą 90% i umożliwia lepsze kierowanie sygnału przez tylne szyny zasilania, znacząco minimalizując straty energii o 4-5%.

Infografika przedstawiająca proces Intel 18A, podkreślająca korzyści takie jak większa gęstość ogniw.

Technologia RibbonFET usprawnia zarządzanie prądem elektrycznym i zmniejsza upływ mocy, co przekłada się na znaczne korzyści w zakresie wydajności. Ta innowacja umożliwia lepszą kontrolę prądu elektrycznego przy jednoczesnym utrzymaniu niższych napięć roboczych, a wynikające z tego krótsze długości bramek przyczyniają się do 20% zmniejszenia poboru mocy na tranzystor.

Schemat technologii RibbonFET z wyróżnionymi funkcjami, takimi jak sterowanie prądem elektrycznym.

Do najważniejszych cech technologii RibbonFET należą:

  • Ulepszona miniaturyzacja komponentów chipowych dla procesorów o dużej gęstości
  • Precyzyjna kontrola prądów elektrycznych w kanale tranzystorowym
  • Lepsza wydajność na wat i efektywność operacyjna
  • Możliwość dostrojenia parametrów za pomocą szerokości wstęgi i różnych typów napięcia progowego

Technologia PowerVia uzupełnia technologię RibbonFET, zwiększając wykorzystanie standardowych ogniw nawet o 10% i wydajność energetyczną ISO o 4%.Takie podejście kieruje energię spod krzemu, poprawiając ogólną wydajność układu.

Schemat Intel PowerVia przedstawiający najważniejsze cechy.

Najważniejsze cechy technologii PowerVia obejmują:

  • Zmniejszone obciążenie dystrybucji mocy, co zwiększa ogólną wydajność układu scalonego
  • Ponowne rozmieszczenie metali nawierzchniowych w celu optymalizacji układu
  • Integracja tylnej części układu scalonego w celu wydajnego zarządzania energią
  • TSV w skali nano dla lepszego rozdziału mocy
  • Doskonałe możliwości routingu sygnału
  • Ponad 90% gęstości ogniw dla optymalnego wykorzystania przestrzeni

Co więcej, Clearwater Forest będzie pierwszym systemem produkcji wielkoseryjnej wykorzystującym technologię Foveros Direct3D, innowacyjne rozwiązanie do pakowania, które skutecznie łączy moduły obliczeniowe i wejścia/wyjścia na aktywnych modułach bazowych. Technologia ta minimalizuje zużycie energii dzięki odstępowi między modułami wynoszącemu 9 um, umożliwiając efektywny transfer danych między modułami.

Poniższy przegląd konstrukcji 3D ilustruje architekturę procesora Clearwater Forest Xeon 6+:

Schemat konstrukcyjny procesora Intel Clearwater Forest 3D z opisanymi chipletami.

Eksploracja trzech głównych pól lasu Clearwater

Architektura Clearwater Forest składa się z trzech głównych kafelków: kafelek obliczeniowy, kafelek wejścia/wyjścia i kafelek podstawowy.

Płytka Clearwater Forest I/O

Ten moduł wykorzystuje technologię Intel 7 i integruje osiem akceleratorów w dwóch pakietach, w tym Intel Quick Assist Technology, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator i Intel In-Memory Analytics Accelerator, co daje łącznie 16 akceleratorów.

Schemat architektury Intel I/O Tile przedstawiający szczegóły technologiczne.

Każdy moduł I/O jest wyposażony w 48 linii PCIe Gen 5.0 (łącznie 96), 32 linie CXL 2.0 (łącznie 64) i 96 linii UPI 2.0 (łącznie 192).Choć konstrukcja ta nie różni się od Granite Rapids, stanowi znaczącą poprawę w porównaniu z Sierra Forest.

Płytka bazowa Clearwater Forest

Moduł Base Tile, połączony przez EMIB z modułami obliczeniowymi powyżej, wykorzystuje technologię Intel 3 Process do przechowywania trzech modułów Base Tile. Każdy z tych modułów Base Tile zawiera cztery kontrolery pamięci DDR5, co daje łącznie 12 kanałów pamięci. Ponadto zapewniają one współdzieloną pamięć LLC o pojemności 48 MB dla każdego modułu obliczeniowego, co daje łącznie 576 MB pamięci LLC w pakiecie.

Płytka obliczeniowa Clearwater Forest

Kafelki obliczeniowe reprezentują najbardziej zaawansowany aspekt Clearwater Forest, wykorzystując nową technologię procesową 18A. Każdy kafelek składa się z sześciu modułów, z których każdy zawiera cztery rdzenie Darkmont E-Core, co daje łącznie 24 rdzenie E-Core na kafelek obliczeniowy i 288 rdzeni E-Core na wszystkich dwunastu kafelkach.

Slajd z Intel Tech Tour przedstawiający architekturę kafelkową Compute ze szczegółowymi informacjami na temat modułów i rdzeni E.
Infografika prezentująca specyfikacje architektury Intel Compute Tile Architecture.
Architektura kafelkowa Intel Compute podkreśla podstawowe specyfikacje.
Schemat architektury Intel Compute Tile przedstawiający rdzenie Darkmont E.

Co więcej, każdy moduł zawiera 4 MB pamięci podręcznej L2, co przekłada się na 24 MB na kafelek obliczeniowy i łącznie 288 MB pamięci podręcznej L2 w dwunastu kafelkach. W połączeniu z modułem LLC cały układ osiąga 864 MB pamięci podręcznej.

  • 12x płytek obliczeniowych (Intel 18A)
  • 3x aktywne kafelki bazowe (Intel 3)
  • 2x płytki Intel I/O (Intel 7)
  • 12x płytek EMIB (EMIB 2.5D)

Szczegółowe spojrzenie na Darkmont E-Core

Przyjrzyjmy się teraz bliżej procesorowi Darkmont E-Core, stosowanemu również w procesorach klienckich Panther Lake.

Slajd firmy Intel zatytułowany „Darkmont E-core Deep Dive” autorstwa Stephena Robinsona, pracownika firmy Intel.

Choć architektura Darkmont przypomina konstrukcję Skymont zastosowaną w procesorach Lunar Lake i Arrow Lake, to jednak stanowi ona znaczącą modernizację w stosunku do architektury Crestmont.

Diagram firmy Intel zatytułowany „Darkmont E-core” z opisanymi sekcjami.

Do istotnych ulepszeń w rdzeniu Darkmont należą: zaktualizowany blok predykcyjny o pojemności 128 bajtów, ulepszone pobieranie instrukcji oraz mikroarchitektura o szerokości 9 bitów, charakteryzująca się szerszą jednostką dekodującą, która zawiera o 50% więcej klastrów dekodujących w porównaniu z Crestmont. Inne udoskonalenia obejmują zwiększoną pojemność kolejki Uop i udoskonaloną pamięć podręczną instrukcji.

Schemat nieuporządkowanego działania silnika Intel Darkmont E-core z wyróżnionymi funkcjami alokacji i wycofywania.

Firma Intel udoskonaliła również mechanizm Out-of-Order Engine (OOE).Oferuje on 8-szeroki mechanizm alokacji i 16-szeroki mechanizm wycofywania, co pozwala na szybsze zarządzanie zasobami, a także znacznie większą pojemność okna Out-of-Order, wynoszącą 416 wpisów.

Liczba rozszerzeń w portach dyspozytorskich osiągnęła 26, przy czym Scalar Engine zawiera 8 jednostek ALU typu Integer, podczas gdy Vector Engine zawiera 4 jednostki ALU typu float, co optymalizuje wydajność w przypadku wielu zadań wykonawczych.

Silnik wykonawczy Intela ilustrujący funkcje rdzenia Darkmont E.

Usprawnienia podsystemu pamięci odzwierciedlają kompleksową modernizację: teraz możliwe jest podwojenie przepustowości pamięci podręcznej L2 i przyspieszenie transferów z L1 do L1, co zwiększa wydajność komunikacji danych.

Dzięki wyeliminowaniu zewnętrznych transferów danych, pamięć podręczna L2 może teraz uzyskiwać bezpośredni dostęp do danych za pośrednictwem pamięci podręcznej L1. Częstotliwość taktowania procesora uległa poprawie z 16 do 32 bajtów w każdym cyklu zegara.

Tabela porównawcza architektur Crestmont i Darkmont E-Core.

Podsumowując, rdzenie Darkmont E-Cores zastosowane w Clearwater Forest oferują wzrost wydajności nawet o 90% w porównaniu ze 144-rdzeniowym procesorem Xeon 6780E „Sierra Forest”, a także osiągają 23-procentowy wzrost efektywności przy zróżnicowanych obciążeniach i obsługują konsolidację serwerów do 8:1 przy niższym całkowitym koszcie posiadania (TCO).

Początkowe wskaźniki wydajności

Firma Intel opublikowała wstępne statystyki wydajności procesorów Clearwater Forest „Xeon 6+”, prezentując porównania zarówno z 144-rdzeniowym procesorem Xeon 6700E „Sierra Forest”, jak i z niewydanym jeszcze 288-rdzeniowym procesorem Xeon 6900E.

Wykres porównujący wskaźniki wydajności Clearwater Forest i Sierra Forest.

W porównaniu ze 144-rdzeniowym procesorem Sierra Forest (Xeon 6780E) pracującym z mocą 330 W, wariant Clearwater Forest z 288 rdzeniami i TDP na poziomie 450 W charakteryzuje się znacząco niższym TDP o 36, 3%, przy podwojonej liczbie rdzeni, osiągając o 112, 7% wyższą wydajność i o 54, 7% większą sprawność na wat.

W porównaniu do 288-rdzeniowego układu Sierra Forest, który osiąga TDP na poziomie 500 W, Clearwater Forest charakteryzuje się TDP niższym o 11%, a jednocześnie oferuje o 17% lepszą wydajność i o 30% większą wydajność na wat.

Metryki wydajności i efektywności procesorów Darkmont i Crestmont.

Ta wyższa wydajność wynika z zaawansowanych rdzeni Darkmont E-Cores, które zapewniają 17% wzrost IPC. Platforma Clearwater Forest oferuje 1, 9-krotnie wyższą wydajność, 23% wzrost efektywności i obsługuje znaczne wskaźniki konsolidacji serwerów w porównaniu ze starszymi systemami Xeon.

Specyfikacje procesorów i platformy Intel Xeon 6+

Procesory Clearwater Forest „Xeon 6+” będą wykorzystywać gniazdo LGA 7529, dostępne zarówno w konfiguracjach 1S, jak i 2S. Jest to to samo gniazdo, które jest używane w procesorach Xeon 6900P „Granite Rapids-AP”.Układy te będą pracować w zakresie TDP od 300 do 500 W, co odzwierciedla parametry operacyjne procesorów Xeon 6700E i 6900P, które posiadają 144 rdzenie.

Zrzut ekranu przedstawiający specyfikację techniczną i funkcje procesora Intel Clearwater Forest.

Te procesory umożliwią obsługę pamięci DDR5 nawet z 12 kanałami i prędkością do 8000 MT/s, a także do 6 łączy UPI 2.0 (do 24 GT/s), do 96 linii PCIe Gen 5.0 i do 64 linii CXL 2.0.

Jeśli chodzi o funkcje bezpieczeństwa, architektura obejmuje rozszerzenia Intel Software Guard Extensions (SGX) i Intel Trust Domain Extensions (TDX).Ponadto zarządzanie energią jest usprawnione dzięki technologiom Intel Application Energy Telemetry (AET) i Turbo Rate Limiter. Procesory Clearwater Forest będą obsługiwać Advanced Vector Extensions 2 (AVX2) z funkcjami VNNI i INT8.

Procesor Intel Xeon 6+ charakteryzuje się 288 rdzeniami E i obsługą pamięci DDR5.

Podsumowując, oto jak Clearwater Forest „Xeon 6+” wypada w porównaniu z Sierra Forest „Xeon 6”:

  • Do 2x większa liczba rdzeni
  • 17% poprawy IPC na rdzeń
  • Ponad 5-krotna pamięć podręczna ostatniego poziomu
  • 4 dodatkowe kanały pamięci
  • Jeszcze 2 linki UPI
  • O 20% zwiększona prędkość pamięci
Porównanie specyfikacji Intel® Xeon 6700E i Clearwater Forest.

Wprowadzenie na rynek procesorów Intel Clearwater Forest „Xeon 6+” planowane jest na drugą połowę 2026 r. Przed premierą spodziewane jest opublikowanie dodatkowych danych dotyczących wydajności i spostrzeżeń.

Przegląd rodzin procesorów Intel Xeon (wstępny):

Branding rodzinny Diamentowe Rapids Las Clearwater Granite Rapids Las Sierra Emerald Rapids Sapphire Rapids Jezioro Lodowe-SP Jezioro Coopera-SP Jezioro Cascade-SP/AP Skylake-SP
Węzeł procesu Do ustalenia Intel 18A Intel 3 Intel 3 Intel 7 Intel 7 10nm+ 14nm++ 14nm++ 14nm+
Nazwa platformy Intel Oak Stream Intel Birch Stream Intel Birch Stream Intel Mountain Stream/Intel Birch Stream Intel Eagle Stream Intel Eagle Stream Intel Whitley Intel Cedar Island Intel Purley Intel Purley
Architektura rdzeniowa Panther Cove-X Darkmont Redwood Cove Sierra Glen Zatoka Drapieżników Złota Zatoka Słoneczna Zatoka Jezioro Kaskadowe Jezioro Kaskadowe Skylake
MCP (pakiet wieloprocesorowy) WeUs Tak Tak Tak Tak Tak Tak NIE NIE Tak NIE
Gniazdo LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
Maksymalna liczba rdzeni Do ustalenia Do 288 Do 128 Do 288 Do 64? Do 56 Do 40 Do 28 Do 28 Do 28
Maksymalna liczba wątków Do ustalenia Do 288 Do 256 Do 288 Do 128 Do 112 Do 80 Do 56 Do 56 Do 56
Maksymalna pamięć podręczna L3 Do ustalenia Do ustalenia 480 MB L3 108 MB L3 320 MB L3 105 MB L3 60 MB L3 38, 5 MB L3 38, 5 MB L3
Obsługa pamięci DDR5 do 16 kanałów? Do 12 kanałów DDR5-8000 Do 12 kanałów DDR5-6400/MCR-8800 Do 12 kanałów DDR5-6400 Do 8-kanałowej pamięci DDR5-5600 Do 8-kanałowej pamięci DDR5-4800 Do 8-kanałowej pamięci DDR4-3200 Do 6-kanałowej pamięci DDR4-3200 DDR4-2933 6-kanałowa DDR4-2666 6-kanałowa
Wsparcie PCIe Gen PCIe 6.0? PCIe 5.0 (96 linii) PCIe 5.0 (136 linii) PCIe 5.0 (88 linii) PCIe 5.0 (80 linii) PCIe 5.0 (80 linii) PCIe 4.0 (64 linie) PCIe 3.0 (48 linii) PCIe 3.0 (48 linii) PCIe 3.0 (48 linii)
Zasięg TDP (PL1) Do ustalenia Do 500 W Do 500 W Do 350 W Do 350 W Do 350 W 105-270 W 150W-250W 165W-205W 140W-205W
Moduł 3D Xpoint Optane DIMM Do ustalenia Nie dotyczy Przełęcz Donahue Nie dotyczy Przełęcz Crow Przełęcz Crow Przełęcz Barlow Przełęcz Barlow Przełęcz Apaczów Nie dotyczy
Konkurs AMD EPYC Venice AMD EPYC Turyn AMD EPYC Turyn AMD EPYC Bergamo AMD EPYC Genoa ~5nm AMD EPYC Genoa ~5nm AMD EPYC Milan 7nm+ AMD EPYC Rome 7 nm AMD EPYC Rome 7 nm AMD EPYC Naples 14 nm
Początek 2025-2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *