Google stellt DolphinGemma vor: Innovatives LLM zur Entschlüsselung der Delfinkommunikation

Google stellt DolphinGemma vor: Innovatives LLM zur Entschlüsselung der Delfinkommunikation

Google stellt DolphinGemma vor: Förderung der Delfinkommunikationsforschung

Nach der Einführung von Deep Research mit Gemini 2.5 Pro Experimental hat Google DolphinGemma veröffentlicht, ein hochmodernes Sprachmodell. Dieses innovative KI-Tool unterstützt Forscher bei der Untersuchung der Delfinkommunikation mit dem Ziel, ihre Lautäußerungen zu entschlüsseln.

Zusammenarbeit mit dem Wild Dolphin Project

In Zusammenarbeit mit Forschern des Georgia Institute of Technology und des Wild Dolphin Project (WDP) unter der Leitung von Dr. Denise Herzing arbeitet Google an diesem ehrgeizigen Projekt. Die Mission des WDP konzentriert sich auf die Überwachung und Dokumentation des Verhaltens, der Sozialstrukturen, der Kommunikationsmuster und der Ökosysteme wildlebender Delfine, insbesondere des Fleckendelfins (Stenella frontalis), durch nicht-invasive, langfristige Feldforschungsmethoden.

Erkenntnisse aus Daten zum Verhalten von Delfinen

Durch jahrelange Feldforschung hat das WDP wertvolle Daten gesammelt, die bestimmte Delfingeräusche mit ihrem Verhalten in Zusammenhang bringen. Zu den bemerkenswerten Verhaltensweisen gehören:

  • Signaturpfeifen, die als eindeutige Erkennungszeichen für die Wiedervereinigung von Müttern und Kälbern dienen
  • Burst-Pulse-„Kreischen“, das häufig bei aggressiven Begegnungen aufgezeichnet wird
  • Klickgeräusche, die häufig in Balzsituationen oder bei der Jagd nach Beute eingesetzt werden

Nutzung fortschrittlicher KI für die Delfinkommunikation

Google betont, dass die Analyse der komplexen Kommunikationsmuster von Delfinen eine große Herausforderung darstellt. Glücklicherweise bietet der umfangreiche Datensatz des WDP eine ideale Plattform für fortschrittliche KI-Anwendungen. DolphinGemma nutzt Googles innovativen SoundStream-Tokenizer, der komplexe Delfinlaute in kleinere, handhabbare Audioeinheiten übersetzt.

Dieser optimierte Ansatz basiert auf einer speziell entwickelten KI-Architektur, die diese Audiosequenzen für die Analyse verarbeitet. Mit rund 400 Millionen Parametern ist DolphinGemma für einen effizienten Betrieb optimiert, selbst auf Pixel-Geräten, die Forscher bei ihrer Feldarbeit mit sich führen.

Links Pfeifen links und Burst-Impulse rechts, die während der frühen Tests von DolphinGemma erzeugt wurden

Der Mechanismus hinter DolphinGemma

DolphinGemma unterscheidet sich von herkömmlichen Modellen des maschinellen Lernens, da es sich ausschließlich auf Audio-Input und -Output konzentriert. Anstatt Wörter oder Bilder zu interpretieren, verarbeitet es Sprachsequenzen von Delfinen und setzt dabei Methoden ein, die von der Art und Weise inspiriert sind, wie große Sprachmodelle menschliche Sprache verstehen. Das Modell prognostiziert nachfolgende Laute anhand vorhandener Sequenzen.

Dr. Denise Herzing zieht eine Parallele zum Konzept der Autovervollständigung für Delfinlaute, bei dem das Modell Muster, Strukturen und Abläufe in Lautäußerungen erkennt, ähnlich wie Textmodelle kommende Wörter in Sätzen kontextbasiert vorhersagen.

Aufbau einer gemeinsamen Sprache mit CHAT

Vor der Einführung von DolphinGemma nutzten die WDP-Forscher CHAT (Cetacean Hearing Augmentation Telemetry), um die Machbarkeit der wechselseitigen Kommunikation mit Delfinen zu untersuchen. CHAT zielte darauf ab, ein einfacheres, gemeinsames Vokabular für die Interaktion zu schaffen, anstatt die gesamte Komplexität der Delfinsprache zu entschlüsseln.

Dieses System erzeugte neue, synthetische Pfiffe, die mit bestimmten Gegenständen verknüpft waren, die für Delfine von Interesse waren – wie Sargassum, Seegras und sogar bunte Schals – in der Hoffnung, dass Delfine durch wiederholte Exposition beginnen würden, diese Geräusche nachzuahmen, um die Gegenstände zu „erbitten“.

Angetrieben vom Google Pixel 6 verarbeitete CHAT hochwertige Audiodaten effizient in Echtzeit, ohne dass spezielle Ausrüstung erforderlich war, und optimierte so Forschungsarbeiten im offenen Meer. Für die kommende Forschungssaison wird der Umstieg auf das Pixel 9 die Fähigkeiten dank verbesserter Audio-Hardware, die gleichzeitig anspruchsvolle Deep-Learning-Modelle und Mustererkennung unterstützt, weiter verbessern.

Ein Google Pixel 9 in der neuesten CHAT-Systemhardware
Ein Google Pixel 9 mit der neuesten CHAT-Systemhardware.

Die Zukunft der Meeressäugerforschung

Google plant, DolphinGemma noch in diesem Sommer als offenes Modell zu veröffentlichen. Ziel ist es, Forschern weltweit Werkzeuge zur Erforschung ihrer eigenen akustischen Datensätze bereitzustellen. Diese Initiative soll die Erkennung von Mustern beschleunigen und unser gemeinsames Verständnis dieser intelligenten Meeresbewohner verbessern.

DolphinGemma ist die neueste Ergänzung der Gemma-Familie leichtgewichtiger großer Sprachmodelle von Google, die jetzt Modelle unterschiedlicher Größe von 1 Milliarde bis 27 Milliarden Parameter umfasst.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert