
A empresa chinesa de tecnologia DeepSeek parece pronta para lançar em breve seu mais recente modelo de IA, o “DeepSeek R2”.Os primeiros detalhes surgiram, despertando interesse na comunidade tecnológica.
DeepSeek R2: Uma revolução na IA impulsionada pela tecnologia Huawei
O primeiro modelo de IA da DeepSeek, o R1, consolidou a capacidade da China de competir no cenário de IA de ponta, desafiando a suposta supremacia tecnológica das empresas ocidentais. A divulgação do R1 causou impacto no mercado de ações dos EUA, contribuindo para perdas bilionárias e revelando que o desenvolvimento de IA avançada nem sempre exige os orçamentos exorbitantes que empresas como a OpenAI sugeriram. Recentemente, veículos de comunicação chineses começaram a circular rumores sobre o próximo modelo R2, sugerindo que o setor ocidental de IA pode ser novamente pego de surpresa pelos avanços inovadores da China.
🚨Rumores virais do DeepSeek R2 vazaram!
—1, 2 T param, 78 B ativo, MoE híbrido—97, 3% mais barato que GPT 4o (US$ 0, 07/M em entrada, US$ 0, 27/M em saída)—5, 2 PB de dados de treinamento.89, 7% em C-Eval2.0—Melhor visão.92, 4% em COCO—82% de utilização no Huawei Ascend 910B
Grande mudança na cadeia de suprimentos dos EUA.pic.twitter.com/Jncg0PvEYU
— Deedy (@deedydas) 26 de abril de 2025
Embora o burburinho em torno do modelo R2 seja animador, é crucial abordar esses relatos com cautela, já que a DeepSeek ainda não confirmou oficialmente nenhum detalhe. Segundo fontes, o DeepSeek R2 empregará uma arquitetura híbrida de Mistura de Especialistas (MoE), uma iteração aprimorada que potencialmente integra mecanismos de controle avançados com camadas densas tradicionais. Essa arquitetura está projetada para quase dobrar a contagem de parâmetros, resultando em impressionantes 1, 2 trilhão de parâmetros.

A contagem de parâmetros por si só posiciona o R2 como um concorrente formidável contra modelos como o GPT-4 Turbo da OpenAI e o Gemini 2.0 Pro do Google. No entanto, as implicações financeiras são igualmente significativas; relatórios sugerem que o DeepSeek R2 oferecerá custos de processamento de tokens até 97, 4% menores que os do GPT-4, com preço definido em aproximadamente US$ 0, 07 por milhão de tokens de entrada e US$ 0, 27 por milhão de tokens de saída. Essa estratégia de preço indica que o R2 pode facilmente se tornar a solução de IA economicamente mais viável disponível, remodelando a dinâmica do mercado.
Além disso, vale ressaltar que o modelo R2 deverá utilizar 82% dos recursos computacionais do cluster de chips Ascend 910B da Huawei, apresentando uma robusta capacidade de computação de 512 PetaFLOPS com precisão FP16. Essa escolha estratégica de utilizar chips internos sinaliza o compromisso da DeepSeek em consolidar sua cadeia de suprimentos de IA e otimizar o gerenciamento de recursos.
Embora os desenvolvimentos em torno do DeepSeek R2 permaneçam especulativos, os insights preliminares traçam o panorama de um produto que pode representar desafios substanciais para players consolidados no campo da IA. O lançamento antecipado pode muito bem ser um ponto de virada, influenciando não apenas o avanço tecnológico, mas também a economia da IA nos mercados globais.
Deixe um comentário