
구글, 돌고래 의사소통 연구 발전 위한 ‘돌핀젬마’ 공개
제미니 2.5 프로 익스페리멘탈 기반의 딥 리서치(Deep Research)를 선보인 데 이어, 구글은 최첨단 대규모 언어 모델인 돌핀젬마(DolphinGemma)를 출시했습니다.이 혁신적인 AI 도구는 연구자들이 돌고래의 의사소통을 연구하고, 궁극적으로는 돌고래의 발성을 해독하는 데 도움을 주는 것을 목표로 합니다.
야생 돌고래 프로젝트와의 협력 노력
구글은 조지아 공대 연구진과 데니스 허징 박사가 이끄는 야생 돌고래 프로젝트(WDP) 연구진과 협력하여 이 야심찬 프로젝트를 진행하고 있습니다. WDP의 임무는 야생 돌고래의 행동, 사회 구조, 의사소통 패턴, 생태계를 모니터링하고 기록하는 데 중점을 두고 있으며, 특히 대서양알락돌고래(Stenella frontalis)를 비침습적이고 장기적인 현장 연구 방법을 통해 연구합니다.
돌고래 행동 데이터의 통찰력
WDP는 수년간의 현장 연구를 통해 특정 돌고래 소리와 행동의 상관관계를 보여주는 귀중한 데이터를 축적했습니다.주목할 만한 행동은 다음과 같습니다.
- 어미와 송아지가 재결합할 때 고유한 식별자 역할을 하는 시그니처 휘파람
- 공격적인 만남 중에 일반적으로 기록되는 버스트 펄스 “삐걱거림”
- 구애 상황이나 먹이를 쫓을 때 자주 사용되는 “윙윙거리는 소리”를 클릭합니다.
돌고래 소통을 위한 고급 AI 활용
구글은 돌고래의 복잡한 의사소통 패턴을 분석하는 작업이 상당한 어려움을 안고 있다고 밝혔습니다.다행히 WDP의 방대한 레이블 데이터 세트는 고급 AI 애플리케이션을 위한 완벽한 플랫폼을 제공합니다. DolphinGemma는 구글의 혁신적인 SoundStream 토크나이저를 사용하여 복잡한 돌고래 발성을 작고 관리하기 쉬운 오디오 단위로 변환합니다.
이 간소화된 접근 방식은 특별히 설계된 AI 아키텍처를 기반으로 작동하며, 이러한 오디오 시퀀스를 분석용으로 처리합니다.약 4억 개의 매개변수를 가진 DolphinGemma는 연구자들이 현장 작업 중에 휴대하는 Pixel 기기에서도 효율적으로 작동하도록 최적화되어 있습니다.

DolphinGemma의 메커니즘
DolphinGemma는 오디오 입력 및 출력에만 집중한다는 점에서 기존 머신러닝 모델과 다릅니다.단어나 이미지를 해석하는 대신, 대규모 언어 모델이 인간의 음성을 이해하는 방식에서 영감을 받은 방법론을 활용하여 돌고래의 음성 시퀀스를 처리합니다.이 모델은 기존 시퀀스를 기반으로 후속 소리를 예측합니다.
데니스 허징 박사는 돌고래 소리에 대한 자동 완성 개념과 유사점을 제시합니다.이 모델은 발성의 패턴, 구조, 진행을 식별하는데, 이는 텍스트 모델이 맥락에 기반하여 문장에서 나올 단어를 예측하는 것과 비슷합니다.
CHAT로 공통 언어 구축
돌핀젬마(DolphinGemma)가 등장하기 전, WDP 연구진은 CHAT(고래 청각 증강 원격 측정)를 활용하여 돌고래와의 양방향 소통 가능성을 조사했습니다. CHAT은 돌고래 언어의 복잡한 전체를 이해하기보다는, 상호작용을 위한 더 간단하고 공통적인 어휘를 만드는 것을 목표로 했습니다.
이 시스템은 돌고래가 관심을 갖는 특정 품목(예: 사르가섬, 해초, 심지어 화려한 스카프)과 연결된 새로운 합성 호루라기를 만들어냈습니다.반복적인 노출을 통해 돌고래가 이러한 소리를 모방하여 품목을 “요청”할 수 있기를 바랐던 것입니다.
Google Pixel 6 기반의 CHAT은 맞춤형 장비 없이도 고품질 오디오 데이터를 실시간으로 효율적으로 처리하여 외해 환경에서의 연구 운영을 간소화합니다.다가오는 연구 시즌에는 Pixel 9로의 전환을 통해 정교한 딥 러닝 모델과 패턴 인식을 동시에 지원하는 향상된 오디오 하드웨어 덕분에 성능이 더욱 향상될 것입니다.

해양 포유류 연구의 미래
구글은 올여름 말 DolphinGemma를 공개 모델로 출시하여 전 세계 연구자들이 자신만의 음향 데이터 세트를 탐색할 수 있는 도구를 제공할 계획입니다.이 이니셔티브는 패턴 식별을 가속화하고 이러한 지능형 해양 생물에 대한 우리의 집단적 이해를 증진하는 것을 목표로 합니다.
DolphinGemma는 Google의 경량 대규모 언어 모델인 Gemma 제품군에 가장 최근에 추가된 제품으로, 현재 10억 개에서 270억 개에 이르는 다양한 크기의 매개변수 모델을 포함하고 있습니다.
답글 남기기