Google revela DolphinGemma: LLM inovador para decifrar a comunicação dos golfinhos

Google revela DolphinGemma: LLM inovador para decifrar a comunicação dos golfinhos

Google revela DolphinGemma: avançando na pesquisa de comunicação com golfinhos

Após o lançamento do Deep Research, desenvolvido pelo Gemini 2.5 Pro Experimental, o Google lançou o DolphinGemma, um modelo de linguagem de ponta. Esta ferramenta inovadora de IA visa auxiliar pesquisadores a examinar a comunicação dos golfinhos, com o objetivo final de decodificar suas vocalizações.

Esforços colaborativos com o Projeto Golfinho Selvagem

Em colaboração com pesquisadores da Georgia Tech e do Wild Dolphin Project (WDP), liderado pela Dra. Denise Herzing, o Google está trabalhando neste ambicioso projeto. A missão do WDP concentra-se em monitorar e documentar os comportamentos, estruturas sociais, padrões de comunicação e ecossistemas de golfinhos selvagens, estudando especificamente o golfinho-pintado-do-atlântico (Stenella frontalis), por meio de métodos de pesquisa de campo não invasivos e de longo prazo.

Insights dos dados de comportamento dos golfinhos

Ao longo de anos de pesquisa de campo, o WDP acumulou dados valiosos que correlacionam sons específicos de golfinhos com seus comportamentos. Comportamentos dignos de nota incluem:

  • Apitos de assinatura, que servem como identificadores únicos para que mães e filhotes se reúnam
  • “Gritos” de pulso explosivo, comumente registrados durante encontros agressivos
  • Clique em “zumbidos”, frequentemente utilizados em situações de namoro ou durante a perseguição de presas

Utilizando IA avançada para comunicação com golfinhos

O Google afirma que a tarefa de analisar os intrincados padrões de comunicação dos golfinhos apresenta desafios significativos. Felizmente, o extenso conjunto de dados rotulados do WDP representa uma plataforma perfeita para aplicações avançadas de IA. O DolphinGemma utiliza o inovador tokenizador SoundStream do Google, que traduz vocalizações complexas dos golfinhos em unidades de áudio menores e mais fáceis de gerenciar.

Essa abordagem simplificada opera em uma arquitetura de IA especialmente projetada que processa essas sequências de áudio para análise. Com cerca de 400 milhões de parâmetros, o DolphinGemma é otimizado para funcionar com eficiência, mesmo em dispositivos Pixel que os pesquisadores carregam durante o trabalho de campo.

Apitos esquerdos e pulsos de explosão à direita gerados durante os primeiros testes do DolphinGemma

O mecanismo por trás do DolphinGemma

O DolphinGemma se diferencia dos modelos convencionais de aprendizado de máquina, pois se concentra estritamente na entrada e saída de áudio. Em vez de interpretar palavras ou imagens, ele processa sequências vocais de golfinhos, empregando metodologias inspiradas na forma como grandes modelos de linguagem compreendem a fala humana. O modelo prevê sons subsequentes com base em sequências existentes.

A Dra. Denise Herzing traça um paralelo com o conceito de preenchimento automático para sons de golfinhos, onde o modelo identifica padrões, estruturas e progressão em vocalizações, assim como modelos de texto preveem palavras futuras em frases com base no contexto.

Construindo uma linguagem comum com CHAT

Antes do advento do DolphinGemma, os pesquisadores do WDP utilizavam o CHAT (Telemetria de Aumento da Audição de Cetáceos) para investigar a viabilidade da comunicação bidirecional com golfinhos. O CHAT visava criar um vocabulário mais simples e compartilhado para interação, em vez de decifrar toda a complexidade da linguagem dos golfinhos.

Esse sistema gerou novos apitos sintéticos vinculados a itens específicos de interesse dos golfinhos — como sargaço, ervas marinhas e até lenços coloridos — na esperança de que, por meio da exposição repetida, os golfinhos começassem a imitar esses sons para “solicitar” os itens.

Equipado com o Google Pixel 6, o CHAT processou com eficiência dados de áudio de alta qualidade em tempo real, sem a necessidade de equipamentos personalizados, agilizando as operações de pesquisa em ambientes oceânicos abertos. Para a próxima temporada de pesquisa, a transição para o Pixel 9 aprimorará ainda mais os recursos, graças ao hardware de áudio aprimorado que suporta modelos sofisticados de aprendizado profundo e reconhecimento de padrões simultaneamente.

Um Google Pixel 9 dentro do mais recente hardware do sistema CHAT
Um Google Pixel 9 dentro do mais recente hardware do sistema CHAT.

O Futuro da Pesquisa de Mamíferos Marinhos

O Google planeja lançar o DolphinGemma como um modelo aberto ainda neste verão, com o objetivo de equipar pesquisadores em todo o mundo com ferramentas para explorar seus próprios conjuntos de dados acústicos. Esta iniciativa busca acelerar a identificação de padrões e aprimorar nossa compreensão coletiva dessas criaturas marinhas inteligentes.

DolphinGemma é a mais recente adição à família Gemma de modelos de linguagem leves e grandes do Google, que agora inclui modelos de vários tamanhos, variando de 1 bilhão a 27 bilhões de parâmetros.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *