Google apresenta Gemini Robotics com o novo modelo Gemini 2.0 para melhor desempenho de robôs

Google apresenta Gemini Robotics com o novo modelo Gemini 2.0 para melhor desempenho de robôs

Google DeepMind se aventura na robótica com Gemini 2.0

O Google DeepMind continua a fazer avanços significativos em inteligência artificial (IA), apresentando avanços em modelos como Gemini, Imagen, Veo, Gemma e AlphaFold. Em um anúncio recente, a equipe entrou oficialmente no setor de robótica com a introdução de dois modelos inovadores baseados no Gemini 2.0: Gemini Robotics e Gemini Robotics-ER.

Apresentando a Gemini Robotics

Gemini Robotics representa um modelo de visão-linguagem-ação (VLA) de ponta que integra ações físicas como uma modalidade de saída, projetada especificamente para controle robótico. Este modelo inovador, construído na arquitetura Gemini 2.0, demonstra uma capacidade extraordinária de compreender situações que não encontrou durante seu treinamento.

De acordo com o Google, a Gemini Robotics se destaca em desempenho, alcançando o dobro da taxa de sucesso em comparação a outros modelos VLA líderes em benchmarks de generalização extensivos. Essa capacidade é aprimorada por sua compreensão robusta de linguagem natural em vários idiomas, permitindo que ela interprete comandos humanos de forma mais eficaz.

Destreza inigualável

Uma das características de destaque da Gemini Robotics é sua destreza. O Google afirma que este modelo pode lidar com tarefas complexas e multietapas que exigem manuseio preciso. Exemplos notáveis ​​incluem dobrar origami e embalar lanches em sacos Ziploc.

Capacidades da Gemini Robotics-ER

Por outro lado, o Gemini Robotics-ER serve como um modelo avançado de visão-linguagem adaptado para raciocínio espacial. Este modelo equipa roboticistas com uma solução pronta para uso para controlar robôs, abrangendo funções essenciais como percepção, estimativa de estado, consciência espacial, planejamento e geração de código.

Esforços colaborativos no desenvolvimento de robótica

Para ampliar o potencial desses novos modelos robóticos, o Google fez uma parceria com a Apptronik para desenvolver robôs humanoides que alavancam os recursos do Gemini 2.0. Além disso, o Google está colaborando com alguns líderes confiáveis ​​do setor, incluindo Agile Robots, Agility Robotics, Boston Dynamics e Enchanted Tools, enquanto exploram as possibilidades futuras do Gemini Robotics-ER.

Pioneirismo no futuro da robótica

Ao equipar robôs com a capacidade de entender e executar tarefas complexas com maior precisão e flexibilidade, o Google DeepMind está abrindo caminho para um futuro em que os robôs podem se integrar perfeitamente a vários aspectos da vida cotidiana, aprimorando ambientes pessoais e profissionais.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *