Google revela Gemini 2.5 Pro Deep Think, superando os modelos O3 e O4 da OpenAI

Google I/O 2025: Principais melhorias na série Gemini 2.5 reveladas

No recente evento Google I/O 2025, o Google apresentou avanços significativos em sua série de modelos Gemini 2.5, com destaque para a introdução do modo Deep Think do Gemini 2.5 Pro. Essa inovação promete superar o desempenho das séries de modelos o3 e o4 mais recentes da OpenAI em benchmarks importantes de IA, marcando uma conquista notável no campo da inteligência artificial.

Melhorias nas capacidades de raciocínio

Embora não tenham sido anunciadas atualizações para o modelo Gemini 2.5 Pro, que passou por atualizações substanciais recentemente, o lançamento do modo Deep Think representa uma mudança de paradigma em suas capacidades de raciocínio. Este novo modo emprega técnicas avançadas de pesquisa para avaliar múltiplas hipóteses antes de gerar uma resposta, permitindo maior profundidade na compreensão e na resolução de problemas.

Desempenho de referência do 2.5 Pro Deep Think

O Google revelou resultados de benchmark impressionantes para o modo Deep Think do Gemini 2.5 Pro, estabelecendo novos padrões de excelência:

49, 4% nos padrões de matemática da USAMO de 2025.
80, 4% no benchmark de codificação de nível competitivo do LiveCodeBench.
84, 0% no benchmark de raciocínio multimodal do MMMU.

Essas conquistas estabelecem o modo Deep Think do 2.5 Pro como o mais avançado (SOTA), superando as capacidades das ofertas atuais da OpenAI. O acesso a este modelo avançado será inicialmente restrito a testadores confiáveis por meio da API Gemini.

Introdução ao Gemini 2.5 Flash

Além das atualizações do 2.5 Pro, o Google lançou o modelo Gemini 2.5 Flash, projetado para uso econômico. O modelo Flash demonstrou melhorias de desempenho em todos os principais benchmarks em comparação com seu antecessor, e os desenvolvedores podem visualizá-lo no Google AI Studio, no Vertex AI para aplicativos corporativos e no aplicativo Gemini, com um lançamento mais amplo agendado para junho.

Melhorias na experiência do desenvolvedor

Para aprimorar a plataforma Gemini para desenvolvedores, o Google também anunciou diversas melhorias importantes:

Uma nova prévia da Live API que oferece suporte a vários locutores, facilitando funcionalidades de conversão de texto em fala com vozes duplas por meio de saída de áudio nativa.
Integração das definições do Model Context Protocol (MCP) na API Gemini para interoperabilidade perfeita com ferramentas de código aberto.
Disponibilidade geral do Gemini 2.5 Pro com orçamentos razoáveis, em breve pronto para aplicações de produção estáveis.
Os recursos de computação do Projeto Mariner serão integrados à API Gemini e ao Vertex AI.
Os modelos 2.5 Pro e Flash agora fornecerão resumos de ideias por meio da API Gemini e do Vertex AI.

Para obter informações mais detalhadas sobre esses desenvolvimentos, você pode ver o anúncio aqui.

https://www.youtube.com/watch?v=n3LPxbVzVeo

Native Audio Outputs (https://www.youtube.com/watch?v=n3LPxbVzVeo)

Fonte e Imagens