A OpenAI se tornará a maior cliente do chip de IA NVIDIA-Groq, com 3 GW de capacidade dedicada para inferência.

A OpenAI consolidou recentemente sua colaboração com a NVIDIA, destacando não apenas a iniciativa Vera Rubin, mas também impulsionando as capacidades de inferência por meio da aguardada solução NVIDIA-Groq.

A OpenAI direciona seu foco para a NVIDIA em inferência, abrindo portas com a solução Groq.

No cenário dinâmico da inteligência artificial, a OpenAI busca ativamente acordos de financiamento com diversos parceiros de infraestrutura. Recentemente, a organização anunciou um impressionante aporte de US$ 110 bilhões, com o apoio significativo de líderes do setor como NVIDIA, SoftBank e Amazon. A OpenAI considera esses investimentos essenciais para manter seu ímpeto no setor de IA, permitindo que a empresa garanta os recursos computacionais necessários para seus ambiciosos projetos. Notavelmente, uma reportagem do WSJ indica que a NVIDIA planeja apresentar seu processador com foco na arquitetura Groq durante o próximo evento GTC 2026, confirmando especulações anteriores sobre sua importância para aprimorar as capacidades de processamento de IA.

À medida que a OpenAI se posiciona estrategicamente entre seus parceiros, ela emergirá como o principal cliente para essa solução de próxima geração. Essa colaboração, particularmente em torno do compromisso da NVIDIA, é intrigante. Divulgações recentes indicam que a OpenAI utilizará 3 GW de capacidade dedicada à inferência, possivelmente proveniente dos próximos anúncios da NVIDIA em março. Relatos sugerem que a inferência tem sido uma questão crítica para a OpenAI ultimamente, levando a certa insatisfação com as ofertas anteriores da NVIDIA nessa área.

A OpenAI concordou em se tornar uma das maiores clientes do novo processador, segundo algumas fontes, o que representa uma grande vitória para a Nvidia. A criadora do ChatGPT, que é uma das maiores clientes da Nvidia, passou os últimos meses buscando alternativas mais eficientes aos chips da Nvidia.

– WSJ

Em paralelo, a OpenAI explorava parcerias com empresas como Cerebras e Groq para garantir o desempenho ideal para aplicações sensíveis à latência. No entanto, a decisão de focar na NVIDIA sugere que a futura solução da Groq, particularmente suas LPUs (Unidades de Processamento de Baixa Latência), demonstrou potencial suficiente para que a OpenAI se comprometesse com a substancial capacidade de 3 GW. Análises sobre essa colaboração entre NVIDIA e Groq preveem uma sofisticada configuração híbrida de computação, um tema em discussão entre especialistas do setor.

Uma pessoa está em um palco exibindo várias unidades de servidor abertas com sistemas de refrigeração e componentes de hardware visíveis.
Créditos da imagem: NVIDIA

Olhando para o futuro, anúncios importantes da NVIDIA são esperados na GTC deste ano. Os destaques esperados incluem desenvolvimentos em torno da iniciativa Vera Rubin, avanços potencialmente inovadores relacionados à próxima geração do Feynman e detalhes sobre a solução baseada em Groq, tudo isso apontando para um futuro promissor para as capacidades de IA.

Fonte e imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *