
Google presenta DolphinGemma: la ricerca sulla comunicazione con i delfini
Dopo l’introduzione di Deep Research powered by Gemini 2.5 Pro Experimental, Google ha lanciato DolphinGemma, un modello linguistico di grandi dimensioni all’avanguardia. Questo innovativo strumento di intelligenza artificiale mira ad assistere i ricercatori nell’analisi della comunicazione dei delfini, con l’obiettivo finale di decodificarne le vocalizzazioni.
Sforzi di collaborazione con il Wild Dolphin Project
In collaborazione con i ricercatori del Georgia Tech e del Wild Dolphin Project (WDP), guidato dalla Dott.ssa Denise Herzing, Google sta lavorando a questo ambizioso progetto. La missione del WDP si concentra sul monitoraggio e la documentazione dei comportamenti, delle strutture sociali, dei modelli di comunicazione e degli ecosistemi dei delfini selvatici, studiando in particolare il delfino maculato atlantico (Stenella frontalis), attraverso metodi di ricerca sul campo non invasivi e a lungo termine.
Approfondimenti dai dati sul comportamento dei delfini
Nel corso di anni di ricerca sul campo, il WDP ha raccolto dati preziosi che correlano specifici suoni dei delfini con i loro comportamenti. Tra i comportamenti degni di nota figurano:
- Fischietti distintivi, che servono come identificatori univoci per le madri e i vitelli per riunirsi
- “Squawk” a impulsi esplosivi, comunemente registrati durante gli incontri aggressivi
- I “ronzi” di clic vengono spesso utilizzati in situazioni di corteggiamento o durante l’inseguimento della preda
Utilizzo dell’intelligenza artificiale avanzata per la comunicazione con i delfini
Google afferma che l’analisi degli intricati schemi di comunicazione dei delfini presenta sfide significative. Fortunatamente, l’ampio set di dati etichettati del WDP rappresenta una piattaforma perfetta per applicazioni di intelligenza artificiale avanzate. DolphinGemma utilizza l’innovativo tokenizzatore SoundStream di Google, che traduce le complesse vocalizzazioni dei delfini in unità audio più piccole e gestibili.
Questo approccio semplificato si basa su un’architettura di intelligenza artificiale appositamente progettata che elabora queste sequenze audio per l’analisi. Con circa 400 milioni di parametri, DolphinGemma è ottimizzato per funzionare in modo efficiente, anche sui dispositivi Pixel utilizzati dai ricercatori durante il lavoro sul campo.

Il meccanismo alla base di DolphinGemma
DolphinGemma si distingue dai modelli di apprendimento automatico convenzionali, poiché si concentra esclusivamente sull’input e sull’output audio. Invece di interpretare parole o immagini, elabora sequenze vocali dei delfini, impiegando metodologie ispirate al modo in cui i modelli linguistici di grandi dimensioni comprendono il linguaggio umano. Il modello prevede i suoni successivi in base alle sequenze esistenti.
La Dott.ssa Denise Herzing traccia un parallelo con il concetto di completamento automatico per i suoni dei delfini, in cui il modello identifica schemi, strutture e progressione nelle vocalizzazioni, proprio come i modelli di testo prevedono le parole successive nelle frasi in base al contesto.
Costruire un linguaggio comune con CHAT
Prima dell’avvento di DolphinGemma, i ricercatori del WDP utilizzavano CHAT (Cetacean Hearing Augmentation Telemetry) per testare la fattibilità della comunicazione bidirezionale con i delfini. CHAT mirava a creare un vocabolario più semplice e condiviso per l’interazione, piuttosto che a decifrare l’intera complessità del linguaggio dei delfini.
Questo sistema ha generato nuovi fischi sintetici associati a specifici oggetti di interesse per i delfini, come sargassi, fanerogame marine e persino sciarpe colorate, nella speranza che, attraverso l’esposizione ripetuta, i delfini iniziassero a imitare questi suoni per “richiedere” quegli oggetti.
Grazie al Google Pixel 6, CHAT ha elaborato in modo efficiente dati audio di alta qualità in tempo reale, senza la necessità di apparecchiature personalizzate, semplificando le operazioni di ricerca in ambienti oceanici aperti. Per la prossima stagione di ricerca, il passaggio a Pixel 9 ne migliorerà ulteriormente le capacità, grazie a un hardware audio migliorato che supporta contemporaneamente sofisticati modelli di deep learning e riconoscimento di pattern.

Il futuro della ricerca sui mammiferi marini
Google prevede di rilasciare DolphinGemma come modello aperto entro la fine dell’estate, con l’obiettivo di fornire ai ricercatori di tutto il mondo gli strumenti per esplorare i propri set di dati acustici. Questa iniziativa mira ad accelerare l’identificazione di modelli e ad arricchire la nostra comprensione collettiva di queste intelligenti creature marine.
DolphinGemma è l’ultima aggiunta alla famiglia Gemma di modelli linguistici leggeri di grandi dimensioni di Google, che ora include modelli di varie dimensioni che vanno da 1 a 27 miliardi di parametri.
Lascia un commento