CEO da AI afirma que o laboratório chinês DeepSeek possui 50.000 GPUs NVIDIA H100 para desenvolvimento avançado de IA

CEO da AI afirma que o laboratório chinês DeepSeek possui 50.000 GPUs NVIDIA H100 para desenvolvimento avançado de IA

Observe que este conteúdo não constitui aconselhamento de investimento. O autor não detém posições nas ações discutidas aqui.

Modelo de IA R1 da DeepSeek: Competindo com gigantes globais

DeepSeek, um laboratório de inteligência artificial pioneiro na China, atraiu atenção significativa com o lançamento de seu modelo R1, que está repercutindo em toda a indústria. Esta tecnologia de IA de ponta supostamente tem acesso a dezenas de milhares de GPUs da NVIDIA para treinamento, posicionando-se ao lado de modelos renomados como o o1 da OpenAI e o Llama da Meta. O CEO da Scale AI, Alexandr Wang, destacou recentemente as conquistas da DeepSeek em uma entrevista perspicaz com a CNBC.

Cenário avançado de GPU da NVIDIA

Wang revelou que a série Hopper da NVIDIA, que inclui as mais recentes GPUs H100 e H200, representa o estado atual de sua tecnologia.À medida que a NVIDIA aumenta as remessas dos esperados chips Blackwell, essas GPUs Hopper continuam sendo fundamentais para impulsionar os avanços da IA ​​globalmente. De acordo com Wang, o modelo R1 não apenas atingiu, mas superou o desempenho dos modelos de IA de primeira linha durante avaliações rigorosas conduzidas por sua organização.

Insights do “Último Exame da Humanidade”

Durante sua conversa com Andrew Ross Sorkin da CNBC, Wang elaborou uma estrutura de testes intensiva apelidada de “Último Exame da Humanidade”, projetada para avaliar a proeza da IA ​​por meio de consultas complexas de professores conceituados em áreas como matemática, física, biologia e química. Wang observou que os resultados indicaram o R1 da DeepSeek como o de melhor desempenho ou comparável aos principais modelos americanos como o o1.

Competição de IA entre EUA e China: um paradigma em mudança

Abordando a rivalidade atual em IA entre os Estados Unidos e a China, Wang reconheceu a liderança histórica dos Estados Unidos no campo, mas enfatizou que os avanços do DeepSeek sinalizam uma mudança potencial no cenário. Ele comentou sobre o momento estratégico do lançamento do R1, observando sua revelação no dia de Natal, um período tipicamente marcado por festividades no Ocidente.

Desempenho da GPU NVIDIA

O debate sobre a disponibilidade da GPU

A conversa então girou para a disponibilidade de GPUs na China. Wang comentou sobre a demanda global pelas poderosas GPUs da NVIDIA, que se tornaram pontos focais das regulamentações de exportação dos EUA. Notavelmente, a administração Biden impôs restrições a partir de 2022 na venda desses chips premium para a China, levando ao desenvolvimento de modelos alternativos pela NVIDIA, incluindo o H800 e o A800, que enfrentaram restrições semelhantes em outubro de 2023.

Cache de GPU do DeepSeek e desafios futuros

De acordo com Wang, embora existam capacidades significativas dentro dos laboratórios chineses, a realidade de acessar essas GPUs avançadas é diferenciada. Ele estimou que a DeepSeek possui aproximadamente 50.000 H100s, desafiando percepções comuns de suas limitações de recursos. No entanto, Wang reconheceu as restrições iminentes que esses laboratórios podem enfrentar sob os controles de exportação existentes, afirmando: “No futuro, eles serão limitados pelos controles de chip e pelos controles de exportação que temos em vigor”.

À medida que o cenário global da IA ​​evolui, a competição entre esses gigantes tecnológicos, sem dúvida, moldará o futuro do desenvolvimento da inteligência artificial.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *