Na CES 2025, a NVIDIA forneceu uma análise aprofundada de sua arquitetura de GPU Blackwell de próxima geração, definida para alimentar as próximas placas de vídeo gamer RTX 50. Este design inovador promete avanços significativos em relação à arquitetura Ada anterior, aprimorando o desempenho, a eficiência e as capacidades gráficas tanto para jogadores quanto para criadores de conteúdo.
Explorando a arquitetura da GPU NVIDIA GeForce RTX 50 “Blackwell”
A arquitetura Blackwell é adaptada para ambientes de jogos de alta demanda e aplicativos criativos, apresentando componentes inovadores que facilitam o desempenho superior. O lançamento da série RTX 50 é esperado para o final deste mês, trazendo uma arquitetura criada no nó de processo de 4 nm da TSMC. Este design de GPU de ponta incorpora impressionantes 92 bilhões de transistores, fornecendo até 4000 AI TOPS, 380 RT TFLOPs e 125 TFLOPS de poder de computação FP32. Além disso, ele ostenta a interface de memória GDDR7 mais rápida, alcançando larguras de banda de até 1,8 TB/s, tudo alojado em uma estética Founders Edition redesenhada.
Visão geral detalhada da arquitetura Blackwell
A arquitetura Blackwell da NVIDIA visa elevar a proeza gráfica da próxima geração de jogos ao focar em capacidades neurais avançadas e cargas de trabalho. Isso inclui uma redução substancial na pegada de memória, eficiência energética aprimorada e recursos inovadores de qualidade de serviço. Os principais aprimoramentos incluem:
- Introdução dos Tensor Cores de 5ª geração, oferecendo computação FP4 de alta velocidade com até 4000 AI TOPS.
- Núcleos de Ray Tracing (RT) de 4ª geração com impressionantes 360 RT TFLOPs, projetados especificamente para Mega Geometry.
- Um processador de gerenciamento de IA de última geração que permite a execução simultânea de modelos de IA e cargas de trabalho gráficas.
- Novos multiprocessadores de streaming (SM) da Blackwell capazes de 125 TFLOPS de computação FP32 de pico.
- A inclusão de memória GDDR7, oferecendo as velocidades mais rápidas até o momento, de até 30 Gbps na RTX 5080.
Recursos adicionais da arquitetura RTX Blackwell incluem DisplayPort 2.1, compatibilidade com PCIe Gen5 e recursos 4K NVDEC/NVENC com profundidade de cor aprimorada.
Melhorias de desempenho e avanços tecnológicos
Ao comparar os Streaming Multiprocessors (SM) da Blackwell com os da arquitetura Ada, fica evidente que a NVIDIA efetivamente dobrou o throughput da GPU INT32, aprimorando o desempenho de cargas de trabalho como Work Graphs e Shader Execution. A nova arquitetura também permite uma execução mais eficiente de múltiplas cargas de trabalho, melhorando significativamente o Shader Execution Reordering (SER) por um fator de dois.
Além disso, o GDDR7 supera a memória GDDR6/X mais antiga em desempenho, oferecendo o dobro de largura de banda e taxas de dados, ao mesmo tempo em que é mais eficiente em termos de energia. Essa tecnologia de memória inovadora suporta sinalização PAM4, posicionando a série RTX 50 como a primeira arquitetura capaz de aproveitar totalmente o GDDR7 e o PCIe 5.0.
Tecnologias avançadas de rastreamento de raios
Os avanços arquitetônicos se estendem ao ray tracing também. A introdução dos RT Cores de 4ª geração apresenta o Triangle Cluster Intersection Engine, otimizado especificamente para processamento de Mega Geometry. Esta atualização permite melhor manuseio de cenas complexas, mantendo um menor consumo de memória.
Além disso, o inovador mecanismo Mega Geometry incorpora um formato Triangle Cluster Compression, gerenciando eficientemente os dados necessários para tarefas extensivas de ray tracing. Isso resulta em uma taxa de interseção de triângulos de raios de 8x, minimizando a utilização de memória.
A introdução do formato FP4 nos Tensor Cores de 5ª geração da Blackwell oferece um aumento drástico no rendimento, fornecendo uma vantagem de desempenho de 32x sobre GPUs Pascal e um aumento de 2x em comparação com GPUs da geração Ada. Esse aprimoramento oferece suporte a técnicas avançadas de Neural Shading usadas em títulos de jogos de última geração.
Agendamento inovador e gerenciamento de energia
Uma introdução significativa dentro da arquitetura Blackwell é o Coprocessador programável conhecido como Amp. Este componente facilita a interação eficiente e a distribuição de carga de trabalho entre vários núcleos de GPU, garantindo desempenho ideal.
O Blackwell também adota modos sofisticados de gerenciamento de energia, permitindo que a árvore de clock da GPU seja desabilitada durante estados ociosos. Essa capacidade permite economias significativas de energia, particularmente benéficas para designs móveis, como a série “Max-Q”. A arquitetura aprimora o desempenho enquanto otimiza o consumo de energia por meio de um trilho secundário que permite diferentes operações de voltagem para núcleos e sistemas de memória.
Além disso, a Blackwell aprimora sua capacidade de resposta de frequência em notáveis 1000x, permitindo alocação eficiente de frequências com base no tipo de carga de trabalho. Isso leva a uma melhoria de frequência de clock de até 300 MHz em comparação com GPUs Ada.
Capacidades de exibição e vídeo
A arquitetura Blackwell também reforça os recursos de processamento de vídeo e exibição. Ela introduz suporte para DisplayPort 2.1b, aprimorando a entrega de quadros por meio de técnicas avançadas de medição de inversão de hardware. A arquitetura inclui o codificador de 9ª geração e o decodificador de 6ª geração, compatíveis com codecs avançados como AV1 e HEVC, garantindo qualidade e desempenho de vídeo de primeira linha.
Avanços em DLSS: DLSS 4
Dando continuidade à evolução da tecnologia de aprendizado profundo, o DLSS 4 representa um salto significativo desde seu início em 2018. Esta iteração vê a NVIDIA alavancando supercomputadores avançados para aprimorar continuamente o modelo DLSS, resultando em melhorias substanciais na qualidade da imagem e na capacidade de resposta.
Com o DLSS 4, a NVIDIA faz a transição para uma nova arquitetura neural robusta, completa com um mecanismo transformador capaz de lidar com múltiplos conjuntos de dados de forma mais eficaz. O novo modo Multi-Frame Generation (MFG) permite a geração de até cinco modelos por quadro, melhorando significativamente a qualidade da renderização.
Essa abordagem inovadora prepara o cenário para que o DLSS 4 esteja disponível com suporte inicial para 75 jogos, a maior biblioteca de títulos aprimorados por DLSS lançada simultaneamente. Os desenvolvedores que já utilizam o DLSS 3 ou 3.5 encontrarão integração direta, garantindo suporte robusto em linhas de títulos novas e existentes.
Reduzindo a latência com o Reflex 2
A tecnologia Reflex 2 da NVIDIA tem como objetivo melhorar a capacidade de resposta para jogadores, particularmente em ambientes competitivos. Ao utilizar a tecnologia Frame Warp, o Reflex 2 diminui a latência do sistema em 75%, melhorando a experiência geral de jogo.
Este aprimoramento permite amostragem em tempo real das posições do mouse antes da renderização do quadro, otimizando significativamente a responsividade. O Reflex 2 terá suporte nativo em vários títulos de alto desempenho, garantindo que todos os usuários de GPU RTX possam se beneficiar deste avanço.
Revolucionando os jogos com a IA RTX
A arquitetura Blackwell da NVIDIA enfatiza a integração de IA em jogos. Ao colaborar com a Microsoft para acessar os recursos de renderização neural do DirectX, a NVIDIA está pronta para liberar desempenho incomparável das GPUs RTX 50. As inovações incluem Neural Shaders e manuseio avançado de materiais, prometendo uma mudança transformadora de gráficos tradicionais para gráficos baseados em IA.
Por meio de novas tecnologias, como Neural Radiance Cache (NRC) e RTX Mega Geometry, a NVIDIA está redefinindo a maneira como a luz interage com objetos em uma cena, oferecendo realismo e interatividade incomparáveis em ambientes de jogos. A introdução de recursos aprimorados por IA para renderização de personagens ressalta ainda mais o compromisso de trazer detalhes realistas para mundos virtuais.
O futuro dos jogos é elevado pelas capacidades da Blackwell, com aplicações avançadas em materiais neurais e otimização de iluminação definidas para aumentar drasticamente a fidelidade visual e a eficiência. À medida que a NVIDIA continua avançando, a comunidade de jogos pode esperar avanços sem precedentes em desempenho gráfico e integração de IA.
Deixe um comentário