
A evolução dos padrões de memória de alta largura de banda (HBM) viu avanços notáveis com HBM4 até HBM8, impulsionando as inovações necessárias para atender às crescentes demandas por inteligência artificial (IA) e desempenho de data center.
Expansão dos padrões HBM visa atender às demandas de IA e data center
Uma apresentação recente do Instituto Coreano de Ciência e Tecnologia Avançada (KAIST) e do Tera (Terabyte Interconnection and Package Laboratory) lançou luz sobre o ambicioso roteiro para tecnologias HBM. Com tecnologias como HBM4, HBM5, HBM6, HBM7 e HBM8, melhorias substanciais estão por vir, prometendo larguras de banda de até 64 TB/s.

Começando com o HBM4, este padrão está pronto para dar suporte às próximas iniciativas de GPU de IA e tecnologias de data center programadas para lançamento em 2026. Confirmações de players notáveis como AMD e NVIDIA sobre a integração do HBM em produtos como as séries MI400 e Rubin demonstram sua importância.


O próximo roteiro de GPUs da NVIDIA, detalhado pelas empresas de pesquisa envolvidas, fornece insights cruciais, especialmente considerando a expertise da Tera em interconexão e encapsulamento HBM. A memória HBM4 foi projetada estrategicamente para as GPUs Rubin da NVIDIA e MI500 da AMD.

GPUs Rubin da NVIDIA e MI500 da AMD: um olhar mais atento ao HBM4
A série Rubin da NVIDIA utilizará as tecnologias HBM4 e HBM4e, com o Rubin apresentando oito núcleos HBM4, enquanto o Rubin Ultra conta com 16 núcleos. Cada variante apresenta diferentes seções transversais de matriz, com o Ultra oferecendo o dobro da densidade computacional.

De acordo com a análise, a GPU Rubin terá uma área de matriz de 728 mm², consumindo cerca de 800 W. Seu interposer mede 2194 mm² e suporta uma capacidade de memória de 288 a 384 GB, proporcionando uma largura de banda impressionante que varia de 16 a 32 TB/s, com um consumo total de energia de cerca de 2200 W — quase o dobro do observado nas GPUs Blackwell B200 anteriores.
Principais recursos do padrão HBM4
- Taxa de dados: aproximadamente 8 Gbps
- Contagem de E/S: 2048 (até 4096)
- Largura de banda total: 2, 0 TB/s
- Pilhas de dados: 12/16-Hi
- Capacidade por Die: 24 Gb
- Capacidade por HBM: Até 36/48 GB
- Potência por pacote HBM: 75 W
- Método de embalagem: Microbump (MR-MUF)
- Método de resfriamento: resfriamento líquido direto no chip (D2C)
- Arquitetura de matriz de base HBM personalizada
- Processador NMC + LPDDR na matriz base
- Plataformas suportadas: NVIDIA Rubin e Instinct MI400

A AMD também está elevando o nível com seu Instinct MI400, que reúne substanciais 432 GB de HBM4, além de capacidades de largura de banda que chegam a 19, 6 TB/s — um salto notável em relação às ofertas da NVIDIA.
Em termos de especificações para o HBM4, a tecnologia deve fornecer uma taxa de dados de 8 Gbps, E/S de 2.048 bits e uma largura de banda de 2, 0 TB/s por pilha, além de uma capacidade máxima de memória de 48 GB. Ele foi projetado com um pacote de energia de 75 W por pilha e utiliza resfriamento líquido para desempenho ideal.
Avanços com HBM5, HBM6, HBM7 e HBM8
No horizonte, o HBM5 tem previsão de lançamento para 2029 e deverá manter uma taxa de dados de 8 Gbps enquanto expande as faixas de E/S para 4.096. Com largura de banda total estimada em 4 TB/s, esse padrão aproveitará pilhas de 16-Hi, oferecendo uma capacidade de até 80 GB.

Principais recursos do padrão HBM5
- Taxa de dados: 8 Gbps
- Contagem de E/S: 4096
- Largura de banda total: 4, 0 TB/s
- Pilhas de dados: 16-Hi
- Capacidade por Die: 40 Gb
- Capacidade por HBM: 80 GB
- Potência por pacote HBM: 100 W
- Método de embalagem: Microbump (MR-MUF)
- Método de resfriamento: Resfriamento por imersão, via térmica (TTV)
- Características especiais: Base HBM personalizada com NMC-HBM 3D e cache empilhado
A Feynman da NVIDIA está projetada para ser a primeira GPU a usar HBM5, com uma meta de preço de lançamento oficial em 2029, permitindo uma configuração de produção adequada.
A GPU Feynman supostamente contará com uma matriz de 750 mm² com um consumo de energia de 900 W, e espera-se que ela inclua quatro GPUs com 400 a 500 GB de memória HBM5, alcançando uma potência térmica total de design (TDP) de 4400 W.
Inovações de última geração com HBM6 e além
Após o HBM5, o próximo salto surge com o HBM6, previsto para ser lançado após a arquitetura Feynman. Esta versão deverá implementar uma atualização significativa de taxas de dados de 16 Gbps, juntamente com pistas de E/S de 4.096 bits, permitindo avanços notáveis em largura de banda e capacidades de memória.

Principais recursos do padrão HBM6
- Taxa de dados: 16 Gbps
- Contagem de E/S: 4096
- Largura de banda total: 8, 0 TB/s
- Pilhas de matrizes: até 20-Hi
- Capacidade por Die: 48 Gb
- Capacidade por HBM: 96/120 GB
- Potência por pacote HBM: 120 W
- Método de embalagem: colagem direta Cu-Cu sem impacto
- Método de resfriamento: resfriamento por imersão
- Recursos avançados: Arquitetura HBM multitorre personalizada
Com o HBM6, esperamos ganhos em largura de banda e eficiência energética, abrindo caminho para um potencial encapsulamento de GPU de até 6014 mm², proporcionando capacidades de largura de banda e capacidade de memória fenomenais.
HBM7 e HBM8: O futuro da memória de alta largura de banda
Olhando para o futuro, projeta-se que o HBM7 e o HBM8 redefinirão a tecnologia de memória. O HBM7 pode ostentar uma taxa de dados de 24 Gbps e uma impressionante contagem de 8192 IO, aumentando drasticamente a capacidade de largura de banda para 24 TB/s.

Principais recursos do padrão HBM7
- Taxa de dados: 24 Gbps
- Contagem de E/S: 8192
- Largura de banda total: 24, 0 TB/s
- Pilhas de dados: 20/24-Hi
- Capacidade por Die: 64 Gb
- Capacidade por HBM: 160/192 GB
- Potência por pacote HBM: 160 W
- Método de embalagem: colagem direta Cu-Cu sem impacto
- Método de resfriamento: resfriamento incorporado
- Arquitetura: Arquitetura HBM Híbrida com matrizes de buffer
Por fim, o HBM8 elevará os padrões além do nosso conhecimento atual, prometendo taxas de dados que chegam a 32 Gbps com capacidade aprimorada, com lançamento previsto para 2038. Olhando para o futuro, os padrões HBM7 e HBM8 estão prontos para inaugurar uma era de capacidades de computação sem precedentes.
Soluções inovadoras de resfriamento atendem à arquitetura HBM
Adaptações, como a arquitetura Flash de Alta Largura de Banda (HBF), visam otimizar aplicações que exigem uso intensivo de memória, como a geração de modelos de linguagem de grande porte. Essa inovação emprega configurações NAND avançadas e estratégias de interconexão, oferecendo integração perfeita com pilhas HBM para desempenho aprimorado.








À medida que entramos em uma era marcada por aplicações com uso intensivo de dados, a complexa interação entre arquitetura inovadora e soluções de resfriamento especializadas fornecerá a estrutura necessária para a computação de próxima geração. O futuro da HBM parece promissor, com desenvolvimentos substanciais à vista, e os próximos anos proporcionarão uma visão empolgante da evolução da tecnologia de memória.
Deixe um comentário