
Google przedstawia DolphinGemma: rozwijanie badań nad komunikacją delfinów
Po wprowadzeniu Deep Research zasilanego przez Gemini 2.5 Pro Experimental, Google uruchomiło DolphinGemma, najnowocześniejszy duży model językowy. To innowacyjne narzędzie AI ma na celu pomóc badaczom w badaniu komunikacji delfinów, a ostatecznym celem jest odkodowanie ich wokalizacji.
Współpraca z Wild Dolphin Project
Współpracując z badaczami z Georgia Tech i Wild Dolphin Project (WDP), kierowanym przez dr Denise Herzing, Google pracuje nad tym ambitnym projektem. Misja WDP koncentruje się na monitorowaniu i dokumentowaniu zachowań, struktur społecznych, wzorców komunikacji i ekosystemów dzikich delfinów, w szczególności badając delfina plamistego atlantyckiego (Stenella frontalis), za pomocą nieinwazyjnych, długoterminowych metod badań terenowych.
Wnioski z danych o zachowaniu delfinów
Przez lata badań terenowych WDP zgromadziło cenne dane, które korelują konkretne dźwięki delfinów z ich zachowaniami. Godne uwagi zachowania obejmują:
- Gwizdki sygnaturowe, które służą jako unikalne identyfikatory dla matek i cieląt, aby mogły się ponownie połączyć
- „Skrzeczenia” o charakterze impulsów, często rejestrowane podczas agresywnych spotkań
- Kliknięcie „brzęczy”, często wykorzystywane w sytuacjach zalotów lub podczas pościgu za zdobyczą
Wykorzystanie zaawansowanej sztucznej inteligencji do komunikacji z delfinami
Google podkreśla, że zadanie analizy skomplikowanych wzorców komunikacji delfinów stanowi poważne wyzwanie. Na szczęście obszerny zestaw danych WDP z etykietami stanowi doskonałą platformę dla zaawansowanych aplikacji AI. DolphinGemma wykorzystuje innowacyjny tokenizator SoundStream firmy Google, który tłumaczy złożone wokalizacje delfinów na mniejsze, łatwe w zarządzaniu jednostki audio.
To usprawnione podejście działa na specjalnie zaprojektowanej architekturze AI, która przetwarza te sekwencje audio do analizy. Z około 400 milionami parametrów DolphinGemma jest zoptymalizowany, aby działać wydajnie, nawet na urządzeniach Pixel, które badacze noszą ze sobą podczas pracy w terenie.

Mechanizm stojący za DolphinGemma
DolphinGemma różni się od konwencjonalnych modeli uczenia maszynowego, ponieważ ściśle koncentruje się na wejściu i wyjściu audio. Zamiast interpretować słowa lub obrazy, przetwarza sekwencje wokalne delfinów, stosując metodologie inspirowane tym, jak duże modele językowe rozumieją mowę ludzką. Model przewiduje kolejne dźwięki na podstawie istniejących sekwencji.
Dr Denise Herzing przytacza analogię do koncepcji automatycznego uzupełniania dźwięków wydawanych przez delfiny, w której model identyfikuje wzorce, struktury i progresję wokalizacji, podobnie jak modele tekstowe przewidują kolejne słowa w zdaniach na podstawie kontekstu.
Budowanie wspólnego języka z CHAT
Przed pojawieniem się DolphinGemma badacze WDP wykorzystali CHAT (Cetacean Hearing Augmentation Telemetry) do zbadania wykonalności dwukierunkowej komunikacji z delfinami. CHAT miał na celu stworzenie prostszego, wspólnego słownictwa do interakcji, a nie rozszyfrowywanie całej złożoności języka delfinów.
System ten generował nowe, syntetyczne gwizdy powiązane z konkretnymi przedmiotami interesującymi delfiny — takimi jak sargassy, trawa morska, a nawet kolorowe szaliki — mając nadzieję, że dzięki powtarzającej się ekspozycji delfiny zaczną naśladować te dźwięki, aby „poprosić” o te przedmioty.
Dzięki Google Pixel 6, CHAT sprawnie przetwarzał wysokiej jakości dane audio w czasie rzeczywistym bez potrzeby niestandardowego sprzętu, usprawniając operacje badawcze w środowiskach otwartego oceanu. W nadchodzącym sezonie badawczym przejście na Pixel 9 jeszcze bardziej zwiększy możliwości dzięki ulepszonemu sprzętowi audio, który obsługuje jednocześnie zaawansowane modele głębokiego uczenia się i rozpoznawanie wzorców.

Przyszłość badań nad ssakami morskimi
Google planuje udostępnić DolphinGemma jako otwarty model pod koniec tego lata, mając na celu wyposażenie badaczy na całym świecie w narzędzia do eksploracji własnych zestawów danych akustycznych. Ta inicjatywa ma na celu przyspieszenie identyfikacji wzorców i poszerzenie naszego zbiorowego zrozumienia tych inteligentnych stworzeń morskich.
DolphinGemma to najnowszy dodatek do rodziny Gemma lekkich modeli językowych firmy Google, która obecnie obejmuje modele o różnych rozmiarach, od 1 miliarda do 27 miliardów parametrów.
Dodaj komentarz