Visão geral abrangente da arquitetura HBM de última geração: HBM4 a HBM8 com largura de banda de até 64 TB/s, capacidade de 240 GB por pilha 24-Hi e resfriamento integrado

Visão geral abrangente da arquitetura HBM de última geração: HBM4 a HBM8 com largura de banda de até 64 TB/s, capacidade de 240 GB por pilha 24-Hi e resfriamento integrado

A evolução dos padrões de memória de alta largura de banda (HBM) viu avanços notáveis ​​com HBM4 até HBM8, impulsionando as inovações necessárias para atender às crescentes demandas por inteligência artificial (IA) e desempenho de data center.

Expansão dos padrões HBM visa atender às demandas de IA e data center

Uma apresentação recente do Instituto Coreano de Ciência e Tecnologia Avançada (KAIST) e do Tera (Terabyte Interconnection and Package Laboratory) lançou luz sobre o ambicioso roteiro para tecnologias HBM. Com tecnologias como HBM4, HBM5, HBM6, HBM7 e HBM8, melhorias substanciais estão por vir, prometendo larguras de banda de até 64 TB/s.

Começando com o HBM4, este padrão está pronto para dar suporte às próximas iniciativas de GPU de IA e tecnologias de data center programadas para lançamento em 2026. Confirmações de players notáveis ​​como AMD e NVIDIA sobre a integração do HBM em produtos como as séries MI400 e Rubin demonstram sua importância.

2025-06-14_15-22-222025-06-14_15-22-30

O próximo roteiro de GPUs da NVIDIA, detalhado pelas empresas de pesquisa envolvidas, fornece insights cruciais, especialmente considerando a expertise da Tera em interconexão e encapsulamento HBM. A memória HBM4 foi projetada estrategicamente para as GPUs Rubin da NVIDIA e MI500 da AMD.

GPUs Rubin da NVIDIA e MI500 da AMD: um olhar mais atento ao HBM4

A série Rubin da NVIDIA utilizará as tecnologias HBM4 e HBM4e, com o Rubin apresentando oito núcleos HBM4, enquanto o Rubin Ultra conta com 16 núcleos. Cada variante apresenta diferentes seções transversais de matriz, com o Ultra oferecendo o dobro da densidade computacional.

De acordo com a análise, a GPU Rubin terá uma área de matriz de 728 mm², consumindo cerca de 800 W. Seu interposer mede 2194 mm² e suporta uma capacidade de memória de 288 a 384 GB, proporcionando uma largura de banda impressionante que varia de 16 a 32 TB/s, com um consumo total de energia de cerca de 2200 W — quase o dobro do observado nas GPUs Blackwell B200 anteriores.

Principais recursos do padrão HBM4

  • Taxa de dados: aproximadamente 8 Gbps
  • Contagem de E/S: 2048 (até 4096)
  • Largura de banda total: 2, 0 TB/s
  • Pilhas de dados: 12/16-Hi
  • Capacidade por Die: 24 Gb
  • Capacidade por HBM: Até 36/48 GB
  • Potência por pacote HBM: 75 W
  • Método de embalagem: Microbump (MR-MUF)
  • Método de resfriamento: resfriamento líquido direto no chip (D2C)
  • Arquitetura de matriz de base HBM personalizada
  • Processador NMC + LPDDR na matriz base
  • Plataformas suportadas: NVIDIA Rubin e Instinct MI400

A AMD também está elevando o nível com seu Instinct MI400, que reúne substanciais 432 GB de HBM4, além de capacidades de largura de banda que chegam a 19, 6 TB/s — um salto notável em relação às ofertas da NVIDIA.

Em termos de especificações para o HBM4, a tecnologia deve fornecer uma taxa de dados de 8 Gbps, E/S de 2.048 bits e uma largura de banda de 2, 0 TB/s por pilha, além de uma capacidade máxima de memória de 48 GB. Ele foi projetado com um pacote de energia de 75 W por pilha e utiliza resfriamento líquido para desempenho ideal.

Avanços com HBM5, HBM6, HBM7 e HBM8

No horizonte, o HBM5 tem previsão de lançamento para 2029 e deverá manter uma taxa de dados de 8 Gbps enquanto expande as faixas de E/S para 4.096. Com largura de banda total estimada em 4 TB/s, esse padrão aproveitará pilhas de 16-Hi, oferecendo uma capacidade de até 80 GB.

Principais recursos do padrão HBM5

  • Taxa de dados: 8 Gbps
  • Contagem de E/S: 4096
  • Largura de banda total: 4, 0 TB/s
  • Pilhas de dados: 16-Hi
  • Capacidade por Die: 40 Gb
  • Capacidade por HBM: 80 GB
  • Potência por pacote HBM: 100 W
  • Método de embalagem: Microbump (MR-MUF)
  • Método de resfriamento: Resfriamento por imersão, via térmica (TTV)
  • Características especiais: Base HBM personalizada com NMC-HBM 3D e cache empilhado

A Feynman da NVIDIA está projetada para ser a primeira GPU a usar HBM5, com uma meta de preço de lançamento oficial em 2029, permitindo uma configuração de produção adequada.

A GPU Feynman supostamente contará com uma matriz de 750 mm² com um consumo de energia de 900 W, e espera-se que ela inclua quatro GPUs com 400 a 500 GB de memória HBM5, alcançando uma potência térmica total de design (TDP) de 4400 W.

Inovações de última geração com HBM6 e além

Após o HBM5, o próximo salto surge com o HBM6, previsto para ser lançado após a arquitetura Feynman. Esta versão deverá implementar uma atualização significativa de taxas de dados de 16 Gbps, juntamente com pistas de E/S de 4.096 bits, permitindo avanços notáveis ​​em largura de banda e capacidades de memória.

Principais recursos do padrão HBM6

  • Taxa de dados: 16 Gbps
  • Contagem de E/S: 4096
  • Largura de banda total: 8, 0 TB/s
  • Pilhas de matrizes: até 20-Hi
  • Capacidade por Die: 48 Gb
  • Capacidade por HBM: 96/120 GB
  • Potência por pacote HBM: 120 W
  • Método de embalagem: colagem direta Cu-Cu sem impacto
  • Método de resfriamento: resfriamento por imersão
  • Recursos avançados: Arquitetura HBM multitorre personalizada

Com o HBM6, esperamos ganhos em largura de banda e eficiência energética, abrindo caminho para um potencial encapsulamento de GPU de até 6014 mm², proporcionando capacidades de largura de banda e capacidade de memória fenomenais.

HBM7 e HBM8: O futuro da memória de alta largura de banda

Olhando para o futuro, projeta-se que o HBM7 e o HBM8 redefinirão a tecnologia de memória. O HBM7 pode ostentar uma taxa de dados de 24 Gbps e uma impressionante contagem de 8192 IO, aumentando drasticamente a capacidade de largura de banda para 24 TB/s.

Principais recursos do padrão HBM7

  • Taxa de dados: 24 Gbps
  • Contagem de E/S: 8192
  • Largura de banda total: 24, 0 TB/s
  • Pilhas de dados: 20/24-Hi
  • Capacidade por Die: 64 Gb
  • Capacidade por HBM: 160/192 GB
  • Potência por pacote HBM: 160 W
  • Método de embalagem: colagem direta Cu-Cu sem impacto
  • Método de resfriamento: resfriamento incorporado
  • Arquitetura: Arquitetura HBM Híbrida com matrizes de buffer

Por fim, o HBM8 elevará os padrões além do nosso conhecimento atual, prometendo taxas de dados que chegam a 32 Gbps com capacidade aprimorada, com lançamento previsto para 2038. Olhando para o futuro, os padrões HBM7 e HBM8 estão prontos para inaugurar uma era de capacidades de computação sem precedentes.

Soluções inovadoras de resfriamento atendem à arquitetura HBM

Adaptações, como a arquitetura Flash de Alta Largura de Banda (HBF), visam otimizar aplicações que exigem uso intensivo de memória, como a geração de modelos de linguagem de grande porte. Essa inovação emprega configurações NAND avançadas e estratégias de interconexão, oferecendo integração perfeita com pilhas HBM para desempenho aprimorado.

2025-06-14_15-23-322025-06-14_15-23-552025-06-14_15-24-062025-06-14_15-24-162025-06-14_15-24-292025-06-14_15-24-392025-06-14_15-27-042025-06-14_15-27-16

À medida que entramos em uma era marcada por aplicações com uso intensivo de dados, a complexa interação entre arquitetura inovadora e soluções de resfriamento especializadas fornecerá a estrutura necessária para a computação de próxima geração. O futuro da HBM parece promissor, com desenvolvimentos substanciais à vista, e os próximos anos proporcionarão uma visão empolgante da evolução da tecnologia de memória.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *