
Google revela o modelo Gemini 2.5 Flash com recursos aprimorados
Na semana passada, durante o aguardado evento Cloud Next, o Google fez um anúncio empolgante sobre o lançamento do modelo Gemini 2.5 Flash. Esta nova iteração promete avanços substanciais e já está disponível para visualização por meio da API Gemini nos ambientes Google AI Studio e Vertex AI. Os usuários do Gemini podem acessar este modelo convenientemente usando o seletor de modelos, que se integra perfeitamente ao Canvas, aprimorando o processo de refinamento de documentos e código.
Melhorias em relação ao seu antecessor
Com base na base lançada por seu antecessor, o Gemini 2.0 Flash, a versão 2.5 apresenta melhorias notáveis nos recursos de raciocínio, mantendo a acessibilidade e minimizando a latência. De acordo com o Google, este novo modelo foi projetado para oferecer uma excelente relação custo-benefício. Aqui estão os detalhes de preço:
- US$ 0, 15 para cada 1 milhão de tokens de entrada
- US$ 0, 60 para cada milhão de tokens de saída sem justificativa
- US$ 3, 50 para cada milhão de tokens de saída com raciocínio
Esta é uma versão inicial do Flash 2.5, mas já apresenta enormes ganhos em relação ao Flash 2.0. Você pode parar de pensar completamente, se necessário, e usar este modelo como um substituto imediato para o Flash 2.0. Ele está disponível na API Gemini, no AI Studio, no Vertex e no aplicativo Gemini!
— Logan Kilpatrick (@OfficialLoganK) 17 de abril de 2025
Apresentando Capacidades de Raciocínio Híbrido
O modelo Gemini 2.5 Flash representa um marco significativo como o primeiro modelo de raciocínio totalmente híbrido do Google, permitindo que os desenvolvedores ativem ou desativem as funcionalidades de raciocínio. Essa flexibilidade permite que os desenvolvedores otimizem seus aplicativos, adaptando as compensações entre qualidade, custo e latência de resposta de acordo com as necessidades específicas do projeto.

Insights comparativos de desempenho
Conforme ilustrado na tabela de benchmark anexa, o modelo Gemini 2.5 Flash compete efetivamente com os principais modelos da Anthropic e da Grok, apesar de sua estrutura de custo mais baixa. Embora o o4-mini, lançado recentemente pela OpenAI, apresente desempenho superior em comparação com a prévia do Gemini 2.5 Flash, ele tem um preço significativamente mais alto, destacando a competitividade da oferta do Google no cenário atual.
Para obter informações mais detalhadas e insights sobre este modelo inovador, consulte a fonte original.
Deixe um comentário