brunch

You can make anything
by writing

C.S.Lewis

by 장순규 Nov 05. 2024

가수 목소리의 생성형 AI 기반 음원 커버 서비스

불법을 합법화할 방법을 고민해 보기

생성형 AI와 음악 커버


최근 인공지능 기술의 발달로 가수 목소리 데이터 학습을 한 AI를 통해 저작권자들의 허락 없는 음원 커버를 만드는 문제가 일어나고 있다. 하지만 자신이 좋아하는 가수의 목소리로 다른 음악을 부르는 AI 음원 커버에 대한 관심도 늘어나는 중이다.  AI 음원 커버는 사회적 이슈를 유발하고 있다. 이는 긍정적인 측면과 부정적인 측면이 함께 다뤄지고 있다.


고인이 된 유명 가수의 목소리로 듣는 요즘 노래는 묘한 감성을 만들기도 한다. 가수에 대한 그리움일지 혹은 그 가수였다면 어떤 목소리로 어떻게 불렀을자. 한국에서는 SBS의 다큐멘터리에서 고 김광석이 김범수의 '보고 싶다' 노래를 커버한 사례가 방영된 적이 있다. 이러한 사례는 점차 유튜브에서도 쉽게 찾아볼 수 있게 되었다. 요즘 보법이 다른 천마라 불리는 마이클 잭슨이 K-pop 가수 음악을 커버한다면. 이러한 상상을 이제 쉽게 찾아볼 수 있는 시대가 되었다.




AI의 목소리 딥러닝 현황


최근 AI는 약 3시간 정도 음원 파일 혹은 실제 사람의 발화를 녹음하고 분석하여, 그 인물의 말투와 습관을 유사하게 구현하는 기술이 등장하였다. 이러한 기술로 네이버는 엄마의 목소리를 구현해 동화책을 읽어주는 서비스를 제시했다. 이러한 AI의 목소리 생성은 사회적으로 많은 이슈를 유발하고 있다. 이는 고인이 된 가수의 목소리를 딥러닝 한 AI가 타 가수의 음악을 커버한 곡에서 고인의 존엄성에 대한 문제와 음악 저작권자의 윤리적 측면의 어떻게 바라볼지에 대한 문제다.


고인이 된 가수의 목소리로 음원을 커버하고, 콘서트를 개최하는 것은 팬들의 입장에서 고인을 다른 방식으로 추모하는 방식일 수 있기 때문에, 기술적 윤리 기준을 현대 시대상을 반영하고 새로운 형태로 제정할 필요성이 제시된다. 하지만 이를 기술의 발전이 만든 세상의 한 형태로서, 기술과 휴머니즘이 가지는 새로운 패러다임으로서 봐야 하지 않을까.



AI가 생성한 음원 커버 현황


음원 커버는 기존에 발표된 곡을 다른 가수가 다시 부르는 것을 뜻하는 신조어다. 이러한 음원 커버는 기존에 발표된 곡의 멜로디 일부나 가사를 편곡하여 다른 가수가 부르는 음원을 뜻한다. 음원 커버는 최근 방송 및 영상 콘텐츠에서 쉽게 찾아볼 수 있다. 이는 특정 가수가 출시된 유명한 명곡을 부르고, 이러한 음원은 유튜브와 같은 영상 콘텐츠로 재구성되어 사람들이 즐길 수 있기 때문이다.


최근 유튜브에서 AI음원 커버를 검색하면 유튜버가 딥러닝으로 학습시킨 가수의 목소리로 음원 커버를 한 사례를 쉽게 찾아볼 수 있다. 검색된 국내 유튜버 중 조회수가 높은 AI 음원 커버 콘텐츠를 찾아보면, 40만 회 이상 조회 된 것을 확인할 수 있다.



이러한 AI 음원 커버에 대해, 가수의 목소리는 저작물이 아니기 때문에 저작권 침해에 자유로울 수 있다. 하지만, 2018년에 헌법상 기본권에 있어 목소리 소유자의 동의 없는 의사에 반한 음성권에 활용은 문제로서 해석했다. 유튜브와 같은 공개적 채널에 저작권자 허락 없이 딥러닝한 AI가 특정 가수의 목소리로 음원 커버하여 업로드하여 수익 창출을 한다면 저작권법 위반 문제가 될 수 있다.



음원 스트리밍 서비스


과거 소리바다가 등장하고 P2P 서비스가 대중적으로 이용되던 시기에 음악 파일은 누구나 쉽게 다운로드할 수 있는 파일로 다뤄졌다. 이 시기에 음원의 저작권에 대한 여러 법적 제약과 윤리적 측면을 강조했다. 그럼에도 쉽게 사라지지 않은 불법 다운로드의 문화를 개선하게 된 것은 아이튠즈다. 애플의 아이팟에 음원을 넣기 위해서 아이튠즈에서 1곡에 적당한 가격에 음원을 구매하는 행위는 불법 다운로드의 방식을 개선할 긍정적인 시스템으로 다뤄졌다.


스마트폰이 등장하고 언제 어디서든 인터넷에 접속할 수 있는 현대 사회에서 음악을 감상하기 위해서 대부분 구독제 서비스를 이용한다. 구독제 서비스에서 음악을 듣게 되면, 감상 횟수에 맞게 비용을 작곡가와 저작권자, 가수에게 돌아가게 된다. 이처럼 음원의 저작권과 관련한 이해관계자에게 비용이 지불될 수 있다면 AI 음원 커버도 공식화된 서비스로 탈바꿈할 수 있지 않을까.



콘셉트 서비스 구축 및 탐구


상기의 상상을 바탕으로 구독제를 기반으로 한 AI 음원 커버 서비스를 구현해 보고 그 가능성을 탐구하고자 했다. 과거 음원 파일을 불법으로 다운로드하고 공유하던 시기가 있듯, 현재 AI 음원 커버를 합법화된 방식으로 더 긍정적이고 재미있게 운영할 수 있을 것이란 생각이 들었기 때문이다.


그래서 저작권자에 해당하는 작곡가, 가수 외 목소리에도 저작권을 활용하면 어떨까 한다. 특정 가수의 목소리 활용에도 비용이 들어간다면, 현재 음원 서비스처럼 이용할 수 있을 것이라 예측한다. 이에 AI 목소리로 커버된 음원을 찾고 듣는 과정의 시나리오를 기반으로 한 콘셉트 서비스를 다음과 같이 구현했다.




실험은 사용자 시나리오를 기반으로 한 UI 설명과 태스크 과정 전달 및 가상 앱 상황의 영상을 통해서 이뤄졌다. 앱의 가능성은 서비스 출시 전 빠르고 비교적 명확한 테스트를 할 수 있는 사용성 검정(SUS)을 통해서 확인했다. SUS 테스트 결과에서 쓸만한 사용성 기준인 75점 이상을 확인했다.



이처럼 상상에서 멈추지 않고, 서비스의 가능성을 마음껏 탐구해 보면 어떨까. 생성형 AI를 직접 개발하고 딥러닝할 수 없다면, 기존에 볼 수 있는 파일과 자료를 바탕으로 미래의 서비스를 구현하고 가능성을 탐구해 볼 수 있을 것이다.



프로젝트

이승언, 이성도, 안창우, 최재현, 장순규. (2024). 가수 목소리를 딥러닝 한 생성형 AI의 보이스 기반의 음원 스트리밍 서비스 연구. 한국 HCI학회 학술대회, 291-296.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari