TaPick #023
1. 언젠가는 인간이 돌고래의 말을 알아들을 수 있는 날이 올까요? 구글은 최근 AI를 활용한 '이종 간 소통' 실험의 한 가운데에 있습니다. 조지아 공대, 야생 돌고래 프로젝트(WDP)와 협업한 '돌핀젬마(DolphinGemma)'는 구글의 오픈모델 '젬마(Gemma)'를 기반으로 개발된 오디오 중심 AI입니다. 대서양 점박이 돌고래의 소리를 학습하고 유사한 소리 시퀀스를 생성할 수 있는 모델인데요. 인간이 언어의 문법과 구조를 학습하듯, AI가 돌고래의 소리 패턴을 예측하고 분석할 수 있도록 설계되었습니다.
2. 돌고래는 단순한 동물이 아닙니다. 개체마다 고유한 휘파람, 사회적 맥락에 따라 변하는 소리, 행동과 연결된 발성 등 언어와 매우 유사한 의사소통 체계를 갖추고 있어요. 문제는 인간이 이를 해석하기 어렵다는 것입니다. 구글은 40년에 걸쳐 수집된 WDP의 방대한 수중 데이터셋을 AI에 학습시켜 이 구조를 파악하고, 의미 단위를 추론하려는 시도를 하고 있습니다. 복잡한 고주파 소리를 처리할 수 있도록 '사운드스트림' 기술도 함께 적용됐죠.
3. 재미있는 점은 이 기술이 복잡한 장비 없이 우리가 갖고 있는 스마트폰에서도 충분히 작동한다는 것입니다. 구글의 스마트폰인 픽셀폰은 AI 모델을 구동하고, 실시간으로 돌고래의 소리를 듣고 반응할 수 있어요. 연구진은 실제로 돌고래가 좋아하는 물체에 '합성 휘파람'을 대응시키고, 돌고래가 이를 반복해서 요청하는 실험을 준비하고 있습니다.
4. 핵심은 단순히 동물을 모방하거나 훈련시키는 것이 아니라 돌고래가 내는 음성 패턴 속에서 의미 있는 단위값을 추출하고, 이것을 바탕으로 진정한 상호작용의 가능성을 탐색하는 것이죠. 인간의 언어모델이 단어의 다음 순서를 예측하듯, 돌핀젬마는 소리의 다음 순서를 예측합니다. 반복되는 소리, 문법적 구조, 행동과의 연계를 파악하면서 점차 의미의 연결고리를 만들어가는 것입니다. '듣는' 것에서 '이해하는' 것으로 넘어가는 기술적 전환이 일어나는 셈아죠.
5. 돌핀젬마 프로젝트는 AI 기술의 진보를 넘어, 인간과 자연 사이의 새로운 연결을 만들어가고 있어요. 언어는 서로 다른 종을 연결하는 가장 강력한 도구고, AI는 그 매개가 될 수 있다는 점에서 의미가 있죠. 바다 너머에서 울리는 휘파람이, 이제는 단순한 소리가 아니라 하나의 메시지로 해석되는 시대가 아마 곧 다가올 지도 모릅니다. 기술이 언어를 배우고, 언어가 관계를 만든다면, 우리는 이제 AI와 함께 더 넓은 대화를 시작할 준비를 이미 마친 셈이죠. '이해'라는 것의 의미를 다시 한번 새길 수 있는 좋은 기회가 되었으면 하네요.
https://techcrunch.com/2025/04/14/googles-newest-ai-model-is-designed-to-help-study-dolphin-speech/
하루 하나의 뉴스, 하루 하나의 명화로 당신의 하루를 더 풍요롭게❤️
호아킨 소로야, 자베아의 하얀 배(The white boat, Javea), 1905.
잘 읽으셨다면 클립 & 구독, 팀어바웃의 링크드인 페이지를 방문해주세요!