Análise aprofundada dos processadores Intel Clearwater Forest “Xeon 6+”: com até 288 núcleos Darkmont E, cache de 576 MB e 18A com tecnologia Foveros D3D + EMIB 2.5D

Análise aprofundada dos processadores Intel Clearwater Forest “Xeon 6+”: com até 288 núcleos Darkmont E, cache de 576 MB e 18A com tecnologia Foveros D3D + EMIB 2.5D

A Intel forneceu informações adicionais sobre sua próxima família de CPUs Xeon 6+ E-core, conhecida como Clearwater Forest, que ostenta uma impressionante contagem de núcleos de até 288 núcleos de última geração.

Apresentando o Intel Clearwater Forest: 288 núcleos Darkmont E de última geração para servidores de computação de alta densidade

Dando continuidade aos avanços alcançados por seu antecessor, o Sierra Forest — a primeira CPU Xeon dedicada a processadores E-Core que oferecia densidade computacional aprimorada e eficiência de desempenho — a Intel está fazendo avanços significativos com o Clearwater Forest. Isso marca uma evolução notável na linha Xeon da Intel, que agora está organizada em famílias separadas para Núcleos de Desempenho (P-Core) e Núcleos Eficientes (E-Core).

Logotipo da Intel ao lado de "Visão geral estratégica do data center" em um fundo de microchip.

A Clearwater Forest marca o início da segunda geração de CPUs somente E-Core sob a marca Xeon 6+.

Apresentando as CPUs Intel Xeon 6+ e Intel Xeon 6, anteriormente codinomes Granite Rapids e Sierra Forest.

Tecnologia avançada: Intel 18A, RibbonFET e Power Via com Foveros Direct3D

Com o Clearwater Forest, a Intel aprimora sua arquitetura desagregada e soluções avançadas de encapsulamento. Essa nova estrutura de chip emprega um design multicamadas com vários chiplets e componentes, demonstrando a proeza de engenharia da Intel.

Tela de detalhes da CPU do servidor Intel Clearwater Forest com recursos como 288 núcleos E e Intel 18A.

A arquitetura Clearwater Forest integra doze blocos EMIB usando tecnologia de encapsulamento 2.5D. Essa configuração conecta três blocos de base ativos, dois blocos de E/S e um total de doze blocos de computação. Os blocos de E/S são construídos no nó Intel 7, os blocos de base ativos utilizam o nó de processo Intel 3 e os chiplets de computação são produzidos com a tecnologia de ponta Intel 18A.

Diagrama de arquitetura da Clearwater Forest mostrando 12x bloco de computação com Intel 18A e outros componentes.

Cada chiplet computacional, com o design Darkmont E-Core, é fabricado utilizando o nó de processo 18A, que emprega a tecnologia RibbonFET, otimizando a eficiência energética por meio da redução da capacitância da porta. Além disso, o processo 18A apresenta uma impressionante densidade de células de mais de 90% e facilita o roteamento aprimorado do sinal pelos trilhos de alimentação traseiros, minimizando significativamente as perdas de energia em 4-5%.

Infográfico do processo Intel 18A destacando benefícios como maior densidade de células.

A tecnologia RibbonFET aprimora o gerenciamento da corrente elétrica e reduz o vazamento de energia, gerando benefícios notáveis ​​de desempenho. Essa inovação permite um controle mais preciso das correntes elétricas, mantendo tensões operacionais mais baixas, com os comprimentos de porta mais curtos contribuindo para uma redução de 20% no consumo de energia por transistor.

Diagrama da tecnologia RibbonFET com recursos destacados, como controle de corrente elétrica.

Os principais recursos da tecnologia RibbonFET incluem:

  • Miniaturização aprimorada de componentes de chip para CPUs de alta densidade
  • Controle preciso sobre correntes elétricas no canal do transistor
  • Melhor desempenho por watt e eficiência operacional
  • Parâmetros ajustáveis ​​habilitados por meio de larguras de fita e vários tipos de tensão de limite

A tecnologia PowerVia complementa o RibbonFET, elevando a utilização da célula padrão em até 10% e o desempenho de energia ISO em 4%.Essa abordagem canaliza a energia por baixo do silício, aprimorando o desempenho geral do chip.

Diagrama do Intel PowerVia descrevendo os principais recursos.

Os destaques da tecnologia PowerVia incluem:

  • Redução do congestionamento na distribuição de energia, aumentando o desempenho geral do chip
  • Redistribuição de metais de pitch de curso para otimizar o layout
  • Integração da matriz traseira para gerenciamento eficiente de energia
  • TSVs em nanoescala para distribuição de energia aprimorada
  • Capacidades superiores de roteamento de sinal
  • Mais de 90% de densidade celular para utilização otimizada do espaço

Além disso, a Clearwater Forest deverá ser a primeira em produção de alto volume a utilizar o Foveros Direct3D, uma solução de encapsulamento inovadora que conecta efetivamente blocos de computação e E/S aos blocos ativos de base. Essa tecnologia minimiza o consumo de energia com um passo de 9 um, permitindo uma transferência eficiente de dados entre blocos.

A visão geral da construção 3D a seguir ilustra a arquitetura da CPU Clearwater Forest Xeon 6+:

Diagrama de construção 3D do Intel Clearwater Forest com chiplets rotulados.

Explorando os três blocos principais da Floresta Clearwater

A arquitetura do Clearwater Forest é composta por três blocos principais: Compute Tile, I/O Tile e Base Tile.

Bloco de E/S da Floresta de Clearwater

Este bloco utiliza a tecnologia de processo Intel 7 e integra oito aceleradores em dois pacotes, incluindo Intel Quick Assist Technology, Intel Dynamic Load Balancer, Intel Data Streaming Accelerator e Intel In-Memory Analytics Accelerator, totalizando 16 aceleradores.

Diagrama da arquitetura Intel I/O Tile apresentando detalhes tecnológicos.

Cada bloco de E/S vem equipado com 48 pistas PCIe Gen 5.0 (totalizando 96), 32 pistas CXL 2.0 (totalizando 64) e 96 pistas UPI 2.0 (totalizando 192).Embora inalterado em relação ao Granite Rapids, este design representa uma melhoria significativa em relação ao Sierra Forest.

Azulejo de base Clearwater Forest

O Bloco Base, conectado via EMIB aos blocos de computação acima, utiliza a tecnologia de processo Intel 3 para abrigar três Blocos Base. Cada um desses Blocos Base contém quatro controladores de memória DDR5, resultando em um total de 12 canais de memória. Além disso, eles fornecem um LLC compartilhado com 48 MB para cada bloco de computação, totalizando 576 MB de LLC no pacote.

Bloco de computação da Floresta de Clearwater

Os blocos de computação representam o aspecto mais avançado do Clearwater Forest, apresentando a nova tecnologia de processo 18A. Cada bloco é estruturado com seis módulos, cada um hospedando quatro núcleos Darkmont, totalizando 24 núcleos por bloco de computação e 288 núcleos em todos os doze blocos.

Slide do Intel Tech Tour exibindo a arquitetura Compute Tile com detalhes sobre módulos e E-cores.
Infográfico da arquitetura Intel Compute Tile apresentando especificações.
Arquitetura Intel Compute Tile destacando especificações principais.
Diagrama da arquitetura Intel Compute Tile detalhando os núcleos E Darkmont.

Além disso, cada módulo inclui 4 MB de cache L2, o que equivale a 24 MB por bloco de computação e um total de 288 MB de cache L2 nos doze blocos. Quando combinado com o LLC, o chip inteiro atinge 864 MB de cache.

  • 12x blocos de computação (Intel 18A)
  • 3x Blocos de Base Ativos (Intel 3)
  • 2x Intel I/O Tiles (Intel 7)
  • 12x peças EMIB (EMIB 2.5D)

Uma análise aprofundada do Darkmont E-Core

Agora vamos nos aprofundar no Darkmont E-Core, que também é empregado nas CPUs do cliente Panther Lake.

Slide da Intel intitulado 'Darkmont E-core Deep Dive' pelo Intel Fellow Stephen Robinson.

Embora a arquitetura Darkmont tenha semelhanças com o design Skymont apresentado nas CPUs Lunar Lake e Arrow Lake, ela representa uma atualização substancial em relação ao Crestmont.

Diagrama da Intel intitulado 'Darkmont E-core' com seções rotuladas.

Melhorias notáveis ​​no núcleo Darkmont incluem um bloco de predição atualizado com 128 bytes, busca de instruções aprimorada e uma microarquitetura de 9 polegadas com uma unidade de decodificação mais ampla que incorpora 50% mais clusters de decodificação em comparação com o Crestmont. Outras melhorias incluem maior capacidade da fila Uop e um cache de instruções mais refinado.

Diagrama do mecanismo Intel Darkmont E-core fora de ordem com recursos de alocação e desativação destacados.

A Intel também aprimorou o Out-of-Order Engine (OOE).Ele apresenta um mecanismo de alocação de 8 entradas e um mecanismo de retirada de 16 entradas para um gerenciamento mais rápido de recursos, além de uma capacidade de janela fora de ordem mais substancial, com 416 entradas.

A expansão entre portas de despacho atingiu 26, com o Scalar Engine apresentando 8 ALUs inteiras, enquanto o Vector Engine inclui 4 ALUs flutuantes, otimizando o desempenho em diversas tarefas de execução.

Exibição do mecanismo de execução Intel ilustrando os recursos do Darkmont E-core.

Os aprimoramentos do subsistema de memória refletem uma atualização abrangente: a duplicação da largura de banda do cache L2 e transferências aceleradas de L1 para L1 agora são possíveis, aumentando a eficiência da comunicação de dados.

Com a eliminação das transferências externas de dados de malha, o cache L2 agora pode acessar dados diretamente por meio do cache L1. A taxa de clock de convicção também melhorou de 16 bytes para 32 bytes a cada ciclo de clock.

Tabela comparativa das arquiteturas Crestmont e Darkmont E-Core.

Concluindo, os Darkmont E-Cores encontrados em Clearwater Forest oferecem um aumento de desempenho de até 90% em comparação ao Xeon 6780E ‘Sierra Forest’ de 144 núcleos, alcançando também um aumento de 23% na eficiência em cargas variadas e suportando consolidação de servidores de até 8:1 com menor custo total de propriedade (TCO).

Métricas de desempenho inicial

A Intel divulgou estatísticas preliminares de desempenho para as CPUs Clearwater Forest ‘Xeon 6+’, apresentando comparações com os chips Xeon 6700E ‘Sierra Forest’ de 144 núcleos e os chips Xeon 6900E de 288 núcleos ainda não lançados.

Gráfico comparando métricas de desempenho de Clearwater Forest versus Sierra Forest.

Em contraste com o Sierra Forest de 144 núcleos (Xeon 6780E) operando a 330 W, a variante Clearwater Forest com 288 núcleos e um TDP de 450 W demonstra um TDP 36, 3% menor, com contagem de núcleos dobrada, alcançando desempenho 112, 7% maior e eficiência 54, 7% melhor por watt.

Comparado ao chip Sierra Forest de 288 núcleos, que gerencia um TDP de 500 W, o Clearwater Forest mantém um TDP 11% menor, ao mesmo tempo em que oferece desempenho 17% melhor e 30% maior de desempenho por watt.

Métricas de desempenho e eficiência das CPUs Darkmont vs Crestmont.

Esse desempenho elevado se deve aos avançados núcleos Darkmont E-Cores, que proporcionam um aumento de 17% no IPC. A plataforma Clearwater Forest, portanto, apresenta desempenho 1, 9x melhor, um aumento de 23% na eficiência e suporta taxas de consolidação de servidores substanciais em comparação com sistemas Xeon desatualizados.

Especificações para CPUs e plataforma Intel Xeon 6+

As CPUs “Xeon 6+” da Clearwater Forest utilizarão o soquete LGA 7529, aplicável nas configurações 1S e 2S. Este é o mesmo soquete usado pelas CPUs Xeon 6900P “Granite Rapids-AP”.Esses chips operarão em uma faixa de TDP de 300 a 500 W, espelhando os parâmetros operacionais dos Xeon 6700E e 6900P, que possuem 144 núcleos.

Tela destacando especificações técnicas e recursos do Intel Clearwater Forest.

Essas CPUs suportarão até 12 canais de memória DDR5 com suporte para velocidades de até 8000 MT/s, além de acomodar até 6 links UPI 2.0 (até 24 GT/s), até 96 pistas PCIe Gen 5.0 e até 64 pistas CXL 2.0.

Em termos de recursos de segurança, a arquitetura inclui Intel Software Guard Extensions (SGX) e Intel Trust Domain Extensions (TDX).Além disso, o gerenciamento de energia é aprimorado pelas tecnologias Application Energy Telemetry (AET) e Turbo Rate Limiter da Intel. As CPUs Clearwater Forest suportarão Advanced Vector Extensions 2 (AVX2) com recursos VNNI e INT8.

O Intel Xeon 6+ apresenta 288 núcleos E e recursos de memória DDR5.

Em resumo, aqui está como o Clearwater Forest “Xeon 6+” se compara ao Sierra Forest “Xeon 6”:

  • Até 2x a contagem de núcleos
  • Melhoria de 17% no IPC por núcleo
  • Mais de 5x o cache do último nível
  • 4 canais de memória adicionais
  • Mais 2 links UPI
  • 20% de aumento na velocidade da memória
Comparação entre as especificações do Intel® Xeon 6700E e do Clearwater Forest.

O lançamento previsto para as CPUs “Xeon 6+” Clearwater Forest da Intel está programado para o segundo semestre de 2026, com dados de desempenho e insights adicionais que devem ser revelados antes do lançamento.

Visão geral das famílias de CPU Intel Xeon (preliminar):

Branding Familiar Diamond Rapids Floresta Clearwater Granite Rapids Sierra Forest Corredeiras Esmeralda Sapphire Rapids Ice Lake-SP Cooper Lake-SP Lago Cascade-SP/AP Skylake-SP
Nó de Processo A definir Intel 18A Intel 3 Intel 3 Intel 7 Intel 7 10 nm+ 14 nm++ 14 nm++ 14 nm+
Nome da plataforma Fluxo Intel Oak Intel Birch Stream Intel Birch Stream Fluxo Intel Mountain/Fluxo Intel Birch Fluxo Intel Eagle Fluxo Intel Eagle Intel Whitley Intel Cedar Island Intel Purley Intel Purley
Arquitetura central Enseada Pantera-X Darkmont Enseada Redwood Sierra Glen Enseada Raptor Enseada Dourada Enseada ensolarada Lago Cascade Lago Cascade Lago Skylake
MCP (Pacote Multi-Chip) WeUs Sim Sim Sim Sim Sim Sim Não Não Sim Não
Soquete LGA XXXX / 9324 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4710 / 7529 LGA 4677 LGA 4677 LGA 4189 LGA 4189 LGA 3647 LGA 3647
Contagem máxima de núcleos A definir Até 288 Até 128 Até 288 Até 64? Até 56 Até 40 Até 28 Até 28 Até 28
Contagem máxima de fios A definir Até 288 Até 256 Até 288 Até 128 Até 112 Até 80 Até 56 Até 56 Até 56
Cache L3 máximo A definir A definir 480 MB L3 108 MB L3 320 MB L3 105 MB L3 60 MB L3 38, 5 MB L3 38, 5 MB L3
Suporte de memória Até 16 canais DDR5? Até 12 canais DDR5-8000 Até 12 canais DDR5-6400/MCR-8800 Até 12 canais DDR5-6400 Até 8 canais DDR5-5600 Até 8 canais DDR5-4800 Até 8 canais DDR4-3200 Até 6 canais DDR4-3200 DDR4-2933 6 canais DDR4-2666 6 canais
Suporte PCIe Gen PCIe 6.0? PCIe 5.0 (96 pistas) PCIe 5.0 (136 pistas) PCIe 5.0 (88 pistas) PCIe 5.0 (80 pistas) PCIe 5.0 (80 pistas) PCIe 4.0 (64 pistas) PCIe 3.0 (48 pistas) PCIe 3.0 (48 pistas) PCIe 3.0 (48 pistas)
Faixa de TDP (PL1) A definir Até 500W Até 500W Até 350W Até 350W Até 350W 105-270W 150W-250W 165W-205W 140W-205W
3D Xpoint Optane DIMM A definir N / D Passo Donahue N / D Crow Pass Crow Pass Passo Barlow Passo Barlow Passo Apache N / D
Concorrência AMD EPYC Veneza AMD EPYC Turim AMD EPYC Turim AMD EPYC Bérgamo AMD EPYC Gênova ~5 nm AMD EPYC Gênova ~5 nm AMD EPYC Milão 7nm+ AMD EPYC Roma 7nm AMD EPYC Roma 7nm AMD EPYC Nápoles 14nm
Lançar 2025-2026 2026 2024 2024 2023 2022 2021 2020 2018 2017

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *