
O debate em andamento sobre as despesas de treinamento associadas ao modelo R1 da DeepSeek desencadeou uma volatilidade significativa no mercado, revelando uma camada de engano que antes não era reconhecida. As implicações financeiras reais são de fato mais impressionantes do que inicialmente alegado.
Insights revisados sobre as despesas de treinamento da DeepSeek ultrapassando os “US$ 5 milhões” relatados
Um estudo abrangente da SemiAnalysis desafiou a narrativa predominante de que o modelo R1 da DeepSeek otimizou drasticamente as eficiências, diminuindo assim a necessidade de recursos de computação robustos, como os oferecidos pela NVIDIA. Inicialmente, analistas do setor relataram que as despesas da DeepSeek para seu modelo R1 totalizaram apenas “US$ 5 milhões” — um valor comparável aos custos associados aos modelos GPT da OpenAI. Essa revelação instigou uma onda de pânico entre investidores de varejo que influenciou negativamente o mercado de ações dos EUA. No entanto, à medida que mais informações surgiram, um exame mais profundo dos verdadeiros custos envolvidos é justificado.
Para colocar as coisas em perspectiva, a DeepSeek começou como uma subsidiária do fundo de hedge chinês High-Flyer. De acordo com a SemiAnalysis, em 2021, a DeepSeek adquiriu 10.000 unidades de GPUs A100 da NVIDIA antes que controles rigorosos de exportação fossem aplicados. Após a decisão da empresa controladora de desmembrar o projeto, a DeepSeek expandiu rapidamente suas operações, aumentando significativamente suas capacidades computacionais.

As descobertas indicam que a DeepSeek está equipada com cerca de 10.000 GPUs H800 AI “específicas da China”, juntamente com 10.000 chips H100 AI de ponta. Além disso, a organização investiu nos aceleradores H20 AI da NVIDIA, criando um “pool” substancial de recursos compartilhados entre os empreendimentos da DeepSeek e da High-Flyer para atividades que incluem negociação, pesquisa, treinamento e inferência. Cumulativamente, o CapEx para a DeepSeek é estimado em aproximadamente US$ 1, 6 bilhão, com rumores de que as despesas operacionais chegam a cerca de US$ 944 milhões — números que são até 400 vezes maiores do que os cálculos anteriores do mercado.

É importante notar que a estimativa de custo inicial provavelmente representou apenas uma fração dos custos totais de treinamento associados à execução do modelo R1. Notavelmente, a DeepSeek demonstrou aptidão para atrair talentos locais ao sediar eventos de recrutamento em universidades de prestígio, com funcionários selecionados recebendo salários superiores a US$ 1, 3 milhão. Essa estratégia capacitou a equipe de desenvolvimento da DeepSeek a projetar soluções competitivas capazes de enfrentar gigantes do setor como a OpenAI. Infelizmente, os números financeiros relatados incorretamente forneceram o ímpeto para o chamado evento cisne negro no mercado na semana passada.
A SemiAnalysis realizou avaliações abrangentes do modelo de IA do DeepSeek; os leitores são incentivados a explorar essas descobertas para obter mais insights e detalhes complexos.
Deixe um comentário