
A NVIDIA revelou recentemente seu superchip GB10 de última geração, que utiliza a arquitetura de GPU Blackwell, alimentando os mais recentes supercomputadores DGX AI Mini.
NVIDIA GB10 Superchip: Uma arquitetura revolucionária de SoC e GPU
Atualmente, os holofotes estão voltados para o DGX Spark da NVIDIA, o sistema pioneiro equipado com o superchip GB10, marcando uma entrada significativa no mercado de “PCs para IA”.Após seu anúncio, diversas empresas começaram a desenvolver suas próprias plataformas de PC para IA utilizando a tecnologia GB10. Durante a conferência Hot Chips 2025, a NVIDIA ofereceu uma análise aprofundada do superchip GB10, demonstrando como ele dimensiona efetivamente a arquitetura Blackwell para estações de trabalho e desenvolvedores Mini.

O DGX Spark foi concebido para servir como um mini supercomputador de IA, construído em torno da arquitetura avançada Blackwell.

Principais recursos da estação de trabalho DGX Spark
A estação de trabalho DGX Spark incorpora vários recursos de destaque:
- GB10 Grace Blackwell Superchip: otimizado para tarefas de IA, ciência de dados, computação, renderização e visualização.
- Memória de sistema unificada coerente de 128 GB: capaz de lidar com grandes modelos de IA com até 200 bilhões de parâmetros e ajustar modelos com até 70 bilhões de parâmetros.
- Rede ConnectX-7: facilita a interconexão entre dois sistemas DGX Spark, permitindo a colaboração em modelos de até 405 bilhões de parâmetros.
- DGX Base OS e NVIDIA AI Software Stack: Isso garante uma transferência tranquila de cargas de trabalho entre o DGX Spark e o DGX Cloud ou qualquer infraestrutura de nuvem acelerada.
- Opções versáteis de implantação: pode ser configurado como uma estação de trabalho de IA ou uma nuvem de IA pessoal conectada à rede.
- Experiência de usuário aprimorada: oferece suporte para monitores multifacetados e diversas opções de conectividade.
- Design compacto e com baixo consumo de energia: cabe confortavelmente em qualquer mesa e funciona com uma tomada de parede padrão.

Mergulhando mais fundo: Especificações do superchip GB10
Analisando o GB10 Superchip mais detalhadamente, descobrimos que seu System-on-Chip (SoC) é projetado com dois dielets: o S-Dielet, que abriga a CPU e o subsistema de memória, e o G-Dielet, dedicado ao núcleo da GPU. Ambos os dielets utilizam a tecnologia de encapsulamento 2.5D avançada e são fabricados com o processo de 3 nm de última geração da TSMC.

A arquitetura da CPU é baseada no design ARM v9.2, com um total de 20 núcleos, configurados em dois clusters. Cada núcleo se beneficia de um cache L2 dedicado, além de um cache L3 coletivo de 32 MB compartilhado entre os clusters.

A parte da GPU do chip, que utiliza a arquitetura GB100 Blackwell, funciona como uma GPU integrada (iGPU) devido ao seu posicionamento no mesmo encapsulamento do chip. Ela possui recursos avançados, incluindo núcleos Tensor de 5ª geração com suporte a DLSS 4 e núcleos RTX Ray Tracing, proporcionando uma capacidade computacional impressionante de até 31 TFLOPs para operações FP32 e 1000 TOPS para operações NVFP4 (FP4), adaptadas para aplicações de IA. Além disso, a GPU inclui um cache L2 de 24 MB para aprimorar o desempenho.
Em termos de capacidade de memória, o superchip NVIDIA GB10 suporta LPDDR5x (Unified Memory Architecture) de 256 bits com velocidades de acesso que chegam a 9400 MT/s, o que se traduz em uma notável largura de banda bruta de até 301 GB/s. Essa configuração permite uma capacidade máxima de memória de 128 GB. Sua malha coerente de alto desempenho é ajustada para o Protocolo de Coerência CHI-E, fornecendo à GPU uma ampla largura de banda agregada do sistema de 600 GB/s pela interface C2X.

Além disso, o GB10 possui um cache de nível de sistema de 16 MB, projetado como L4 para a CPU, o que promove o compartilhamento de dados com eficiência energética entre vários mecanismos SoC. A interface C2C de alta largura de banda e baixo consumo de energia utiliza a tecnologia NVLINK da NVIDIA.
As opções de conectividade são robustas, com suporte para PCIe, USB e Ethernet sobre PCIe. Ele suporta até quatro monitores simultâneos (3 DisplayPort + 1 HDMI) em resoluções de até 4K a 120 Hz usando o modo DP Alt, e ainda suporta 8K a 120 Hz com HDMI 2.1a. A segurança também é priorizada, com suporte para Dual Secure Root, um processador SROOT, um processador OSROOT e compatibilidade com fTPM e TPM discreto. O chip opera com uma potência total de projeto (TDP) de 140 W.

Escalabilidade do Superchip GB10
Outro recurso notável do Superchip GB10 é sua escalabilidade. Vários chips GB10 podem ser interconectados por meio da Tecnologia ConnectX da NVIDIA, permitindo maior rendimento, largura de banda e capacidades de DRAM cruciais para suportar modelos de IA maiores. Cada Placa de Interface de Rede (NIC) ConnectX se conecta ao SoC GB10 por meio de uma interface PCIe Gen5 x8, com as unidades se comunicando por meio de uma estrutura Ethernet.

A NVIDIA descreve o SoC GB10 Superchip como uma parceria de sucesso com a Mediatek, utilizando a propriedade intelectual da CPU da Mediatek. O chip passou por modelagem detalhada de desempenho das interações de memória da GPU dentro da infraestrutura de memória da Mediatek.

Perspectivas futuras do superchip GB10
O aspecto mais empolgante do superchip GB10 é seu potencial para eventualmente atingir mercados de consumo, como laptops e mini PCs. Relatos sugerem que os próximos SoCs N1X e N1 podem ser os primeiros SoCs da NVIDIA voltados para o consumidor, com o GB10 oferecendo uma prévia dos recursos que esses chips podem oferecer.
Deixe um comentário