A NVIDIA afirma que a aquisição da Groq aprimorará sua arquitetura como um acelerador de decodificação de baixa latência, semelhante ao da Mellanox.

O setor está em polvorosa com discussões sobre as estratégias futuras da NVIDIA para a tecnologia LPU (Unidade de Processamento Latente) da Groq. Durante a recente teleconferência de resultados do quarto trimestre de 2026, o CEO Jensen Huang insinuou desenvolvimentos empolgantes, prenunciando uma evolução significativa no cenário tecnológico da NVIDIA.

Unidades de processamento latente (LPUs) Groq da NVIDIA: fortalecendo a liderança em ambientes sensíveis à latência.

A NVIDIA embarcou em uma estratégia agressiva de aquisições este ano, marcada notavelmente por uma parceria monumental com a Groq, avaliada em até US$ 20 bilhões. Este acordo, que não envolve licenciamento e foi revelado na véspera de Natal, ainda não foi totalmente detalhado. No entanto, durante a teleconferência de resultados, Jensen Huang deu algumas pistas sobre como as LPUs da Groq podem se integrar às futuras iniciativas de IA da NVIDIA.

Com relação à nossa visão sobre o Groq e o decodificador de baixa latência, tenho algumas ótimas ideias que gostaria de compartilhar com vocês na GTC.

Então, o que faremos com o Groq é o seguinte: vocês verão o GTC, mas o que faremos é estender nossa arquitetura com o Groq como um acelerador, de maneira muito semelhante à forma como estendemos a arquitetura da NVIDIA com a Mellanox.

– Jensen Huang, CEO da NVIDIA

O principal objetivo da aquisição da Groq gira em torno da resolução de cargas de trabalho sensíveis à latência — um desafio premente no cenário computacional atual, particularmente na inferência de IA.À medida que a IA continua a evoluir, a demanda por taxas de resposta ultrarrápidas torna a latência um fator crítico para os provedores de serviços. Embora a NVIDIA tenha se destacado no domínio do treinamento com suas arquiteturas Hopper e Blackwell, ela busca maior domínio na inferência por meio de sua futura tecnologia Vera Rubin, com as unidades LPU da Groq posicionadas para serem fundamentais nessa estratégia.

Huang comparou a importância da Groq à aquisição anterior da Mellanox, que resolveu obstáculos cruciais de rede para a empresa. As contribuições da Mellanox facilitaram o desenvolvimento conjunto e abrangente das estratégias de data center da NVIDIA. Da mesma forma, a Groq está preparada para aprimorar a arquitetura da NVIDIA, potencialmente integrando LPUs em escala de rack, reforçando assim sua posição no setor de IA.

Uma pessoa está em um palco exibindo várias unidades de servidor abertas com sistemas de refrigeração e componentes de hardware visíveis. — Créditos da imagem: NVIDIA

Em IA, a decodificação e o preenchimento prévio são etapas cruciais da inferência, sendo a decodificação cada vez mais vital em ambientes multiagentes.À medida que os sistemas de IA se tornam mais interconectados, a capacidade de decodificar informações de forma rápida e eficaz torna-se essencial. A NVIDIA pretende aproveitar as LPUs Groq para aprimorar essa capacidade. A integração da tecnologia SRAM on-die, que oferece uma largura de banda interna impressionante, já está causando impacto, como demonstrado pelas implementações de empresas como Cerebras e Microsoft.

Existem possibilidades intrigantes em relação à integração das LPUs da Groq na arquitetura da NVIDIA. Uma teoria predominante sugere que a NVIDIA poderia criar nós de computação híbridos com múltiplas LPUs conectadas por meio de uma interconexão unificada, aumentando a eficiência computacional.

Imagens lado a lado de um semicondutor rotulado como 'LPU' e outro rotulado como 'GPU', detalhando seus circuitos complexos.

Segundo analistas da GF Securities ( via Jukan ), a NVIDIA pode revelar um “rack LPX” no próximo evento GTC, potencialmente exibindo até 256 unidades LPU em uma única configuração. Os analistas especulam que a empresa poderá empregar um protocolo plesiosíncrono nativo para comunicação interna das LPUs, juntamente com o NVLink Fusion para facilitar o processamento robusto de dados da GPU durante a inferência.

Uma visão detalhada de uma placa de servidor com componentes identificados, incluindo 'CPU', 'GPUs', 'NVLink Fusion' e 'LPUs'. — Renderização preliminar da bandeja de computação híbrida LPU da NVIDIA | Créditos da imagem: Wccftech

Em última análise, as LPUs da Groq têm o potencial de replicar o impacto transformador da Mellanox em redes, permitindo que a NVIDIA conquiste uma vantagem competitiva em aplicações sensíveis à latência. Huang indicou que tanto o poder computacional quanto a receita estão atualmente em trajetória ascendente, impulsionados pela rápida evolução das aplicações de IA. Observadores aguardam ansiosamente o lançamento formal desses avanços durante a próxima conferência GTC.

Fonte e imagens