
Google stellt DolphinGemma vor: Förderung der Delfinkommunikationsforschung
Nach der Einführung von Deep Research mit Gemini 2.5 Pro Experimental hat Google DolphinGemma veröffentlicht, ein hochmodernes Sprachmodell. Dieses innovative KI-Tool unterstützt Forscher bei der Untersuchung der Delfinkommunikation mit dem Ziel, ihre Lautäußerungen zu entschlüsseln.
Zusammenarbeit mit dem Wild Dolphin Project
In Zusammenarbeit mit Forschern des Georgia Institute of Technology und des Wild Dolphin Project (WDP) unter der Leitung von Dr. Denise Herzing arbeitet Google an diesem ehrgeizigen Projekt. Die Mission des WDP konzentriert sich auf die Überwachung und Dokumentation des Verhaltens, der Sozialstrukturen, der Kommunikationsmuster und der Ökosysteme wildlebender Delfine, insbesondere des Fleckendelfins (Stenella frontalis), durch nicht-invasive, langfristige Feldforschungsmethoden.
Erkenntnisse aus Daten zum Verhalten von Delfinen
Durch jahrelange Feldforschung hat das WDP wertvolle Daten gesammelt, die bestimmte Delfingeräusche mit ihrem Verhalten in Zusammenhang bringen. Zu den bemerkenswerten Verhaltensweisen gehören:
- Signaturpfeifen, die als eindeutige Erkennungszeichen für die Wiedervereinigung von Müttern und Kälbern dienen
- Burst-Pulse-„Kreischen“, das häufig bei aggressiven Begegnungen aufgezeichnet wird
- Klickgeräusche, die häufig in Balzsituationen oder bei der Jagd nach Beute eingesetzt werden
Nutzung fortschrittlicher KI für die Delfinkommunikation
Google betont, dass die Analyse der komplexen Kommunikationsmuster von Delfinen eine große Herausforderung darstellt. Glücklicherweise bietet der umfangreiche Datensatz des WDP eine ideale Plattform für fortschrittliche KI-Anwendungen. DolphinGemma nutzt Googles innovativen SoundStream-Tokenizer, der komplexe Delfinlaute in kleinere, handhabbare Audioeinheiten übersetzt.
Dieser optimierte Ansatz basiert auf einer speziell entwickelten KI-Architektur, die diese Audiosequenzen für die Analyse verarbeitet. Mit rund 400 Millionen Parametern ist DolphinGemma für einen effizienten Betrieb optimiert, selbst auf Pixel-Geräten, die Forscher bei ihrer Feldarbeit mit sich führen.

Der Mechanismus hinter DolphinGemma
DolphinGemma unterscheidet sich von herkömmlichen Modellen des maschinellen Lernens, da es sich ausschließlich auf Audio-Input und -Output konzentriert. Anstatt Wörter oder Bilder zu interpretieren, verarbeitet es Sprachsequenzen von Delfinen und setzt dabei Methoden ein, die von der Art und Weise inspiriert sind, wie große Sprachmodelle menschliche Sprache verstehen. Das Modell prognostiziert nachfolgende Laute anhand vorhandener Sequenzen.
Dr. Denise Herzing zieht eine Parallele zum Konzept der Autovervollständigung für Delfinlaute, bei dem das Modell Muster, Strukturen und Abläufe in Lautäußerungen erkennt, ähnlich wie Textmodelle kommende Wörter in Sätzen kontextbasiert vorhersagen.
Aufbau einer gemeinsamen Sprache mit CHAT
Vor der Einführung von DolphinGemma nutzten die WDP-Forscher CHAT (Cetacean Hearing Augmentation Telemetry), um die Machbarkeit der wechselseitigen Kommunikation mit Delfinen zu untersuchen. CHAT zielte darauf ab, ein einfacheres, gemeinsames Vokabular für die Interaktion zu schaffen, anstatt die gesamte Komplexität der Delfinsprache zu entschlüsseln.
Dieses System erzeugte neue, synthetische Pfiffe, die mit bestimmten Gegenständen verknüpft waren, die für Delfine von Interesse waren – wie Sargassum, Seegras und sogar bunte Schals – in der Hoffnung, dass Delfine durch wiederholte Exposition beginnen würden, diese Geräusche nachzuahmen, um die Gegenstände zu „erbitten“.
Angetrieben vom Google Pixel 6 verarbeitete CHAT hochwertige Audiodaten effizient in Echtzeit, ohne dass spezielle Ausrüstung erforderlich war, und optimierte so Forschungsarbeiten im offenen Meer. Für die kommende Forschungssaison wird der Umstieg auf das Pixel 9 die Fähigkeiten dank verbesserter Audio-Hardware, die gleichzeitig anspruchsvolle Deep-Learning-Modelle und Mustererkennung unterstützt, weiter verbessern.

Die Zukunft der Meeressäugerforschung
Google plant, DolphinGemma noch in diesem Sommer als offenes Modell zu veröffentlichen. Ziel ist es, Forschern weltweit Werkzeuge zur Erforschung ihrer eigenen akustischen Datensätze bereitzustellen. Diese Initiative soll die Erkennung von Mustern beschleunigen und unser gemeinsames Verständnis dieser intelligenten Meeresbewohner verbessern.
DolphinGemma ist die neueste Ergänzung der Gemma-Familie leichtgewichtiger großer Sprachmodelle von Google, die jetzt Modelle unterschiedlicher Größe von 1 Milliarde bis 27 Milliarden Parameter umfasst.
Schreibe einen Kommentar