
Aviso Legal: Este artigo não constitui aconselhamento de investimento. O autor não detém posições em nenhuma das ações mencionadas.
A estreia do modelo de IA R1 da DeepSeek desencadeou uma mudança transformadora no cenário tecnológico nos Estados Unidos e na Europa. Essas regiões, há muito acostumadas a uma sensação de segurança devido aos rigorosos controles de exportação dos EUA que limitam o acesso da China à tecnologia avançada de semicondutores, agora enfrentam um desafio significativo. A China está alavancando estrategicamente essa oportunidade ao prometer investimentos substanciais voltados para acelerar seu crescente setor de IA.
Deepseek R1 é o momento Sputnik da IA.
— Marc Andreessen 🇺🇸 (@pmarca) 26 de janeiro de 2025
Frequentemente chamado de “momento Sputnik da IA”, o modelo R1 de código aberto da DeepSeek já está causando impacto, pois não apenas corresponde, mas frequentemente supera o desempenho de modelos de IA renomados como o o1 da OpenAI. Esse desenvolvimento representa uma conjuntura crítica na pesquisa e implementação de IA.
Primeiro, a equipe do DeepSeek é incrível e vem produzindo um trabalho absolutamente fantástico desde seu primeiro modelo, especialmente em relação à eficiência. O MLA permite ~10x de eficiência de memória do cache KV. Eles obtiveram MoE eficiente com >8 especialistas trabalhando com quase perfeito…
-Armen Aghajanyan (@ArmenAgha) 26 de janeiro de 2025
Em uma reviravolta notável de eventos, a oferta da DeepSeek é notada por sua eficiência, exigindo apenas cerca de 1/50 dos custos de treinamento associados a modelos comparáveis de empresas ocidentais. Quando pareado com a natureza de código aberto do R1, ele cria uma proposta atraente para desenvolvedores e usuários.
esse cara faz o PRIMEIRO argumento técnico neste Deep Copendemonium. Kudos!> Você está fazendo um desserviço a todos; não importa se são 50k H100s, ou 30k, ou 10k. Seja o que for, certamente NÃO são apenas 2k H800s por US$ 5 milhões de treinamento, talvez. Minha matemática rende 22, 4% MFU https://t.co/HD3iNLFxbA pic.twitter.com/TeZexTHyby
A DeepSeek afirma que seu modelo R1 foi treinado usando apenas 2000 GPUs H800. No entanto, análises de vários especialistas em tecnologia sugerem que o cluster de treinamento real provavelmente era significativamente maior. No entanto, as preocupações em torno da eficiência de custos da DeepSeek permanecem altamente relevantes, especialmente à luz do fato de que a empresa cobra apenas 3% do que a OpenAI normalmente exige por recursos premium semelhantes.
Compromisso da China com o investimento em IA
Essa situação é ainda mais complicada à medida que os gigantes da tecnologia dos Estados Unidos lidam com incertezas decorrentes do triunfo da DeepSeek. Sem exceção, ações de empresas como a NVIDIA tiveram declínios acentuados — a NVIDIA, por exemplo, caiu 13% no início do pregão. Em forte contraste, a China está pronta para investir 1 trilhão de yuans em seu setor de IA:
“O Banco da China planeja fornecer suporte financeiro especial abrangente com uma escala total de não menos que 1 trilhão de yuans para várias entidades em toda a cadeia da indústria de inteligência artificial nos próximos cinco anos…”
Este financiamento visa aumentar a autossuficiência da China em tecnologia de IA, melhorar as capacidades de infraestrutura relacionadas à IA (como data centers) e promover a inovação em todo o setor.
Paralelamente, os EUA revelaram seu ambicioso projeto Stargate, projetando um mínimo de US$ 500 bilhões em investimentos nos próximos quatro anos para reforçar sua própria infraestrutura de IA.
Você acredita que o modelo R1 da DeepSeek significa uma transformação crucial na indústria de IA? Agradecemos suas opiniões na seção de comentários abaixo.
Deixe um comentário