O modelo Gemini do Google reivindica a posição nº 1 na arena de chatbots em todos os domínios

O modelo Gemini do Google reivindica a posição nº 1 na arena de chatbots em todos os domínios

O confronto da IA: OpenAI vs. Google esquenta

A rivalidade entre a OpenAI e o Google está se intensificando, pois ambas as empresas competem continuamente pelo domínio no cenário de IA. Seus grandes modelos de linguagem estão consistentemente ocupando posições de destaque em vários benchmarks de IA, exibindo suas capacidades e avanços.

Desenvolvimentos recentes em benchmarks de IA

Notavelmente, em 21 de novembro, o ChatGPT-4o (20241120) ascendeu ao topo da tabela de classificação do Chatbot Arena , ultrapassando o modelo Gemini-Exp-1114 do Google, que estreou poucos dias antes, em 15 de novembro. Em uma resposta rápida, o Google revelou o modelo experimental Gemini-Exp-1206, que agora recuperou a primeira posição, superando o ChatGPT-4o (20241120).

“Hoje marca o aniversário de um ano do lançamento do nosso primeiro modelo Gemini! E nunca pareceu melhor.”

Visão geral do modelo Gemini-Exp-1206

O modelo Gemini mais recente, Gemini-Exp-1206, não é apenas o modelo de melhor desempenho geral, mas também empata com o modelo da OpenAI na categoria de codificação. Ele lidera as classificações em várias categorias cruciais de desempenho, incluindo:

  • Geral com controle de estilo
  • Prompts difíceis
  • Prompts difíceis com controle de estilo
  • Codificação
  • Matemática
  • Escrita Criativa
  • Instrução a seguir
  • Consulta mais longa
  • Interações multi-turno
Chatbot Arena Gemini 1206

Os desenvolvedores podem acessar o modelo Gemini-Exp-1206 por meio do Google AI Studio e da API Gemini, expandindo sua usabilidade para uma variedade de aplicações.

Entrada do Meta: O modelo de código aberto Llama 3.3 70B

Em um desenvolvimento paralelo, a Meta introduziu o modelo de código aberto Llama 3.3 70B, que promete desempenho de primeira linha para tarefas baseadas em texto. A Meta alega que este último modelo opera com um custo de inferência significativamente reduzido em comparação com alternativas tradicionais de código fechado, tornando-o uma opção atraente para desenvolvedores.

“À medida que continuamos a explorar novas técnicas de pós-treinamento, estamos lançando o Llama 3.3 — um novo modelo de código aberto que oferece desempenho e qualidade líderes em casos de uso baseados em texto, como geração de dados sintéticos, por uma fração do custo de inferência.”

Este inovador modelo Llama 3.3 70B oferece desempenho que rivaliza com o Llama 3.1 405B e pode operar eficientemente em estações de trabalho de desenvolvedores padrão. Ele agora está disponível no Hugging Face e em breve será lançado no Azure e outras plataformas de nuvem proeminentes. Com o surgimento de modelos de código aberto poderosos e economicamente viáveis ​​como o Llama 3.3, o futuro do desenvolvimento de IA parece brilhante e acessível a uma gama mais ampla de desenvolvedores.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *