스포티파이, 빅데이터, 큐레이션...

스포티파이에서 엿보는 온라인 음악 서비스의 미래

Apr 14. 2016

I. 우버 택시를 타면 자신의 스포티파이 뮤직 리스트를 불러와 들을 수 있게 된 지 1년이 넘어간다. 이것이 확장성의 의미를 넘어 얼마만큼 활성화되고 있는지는 잘 모르겠지만 덕분에 카카오 택시를 타면 멜론 플레이 리스트를 불러와 들을 수 있지 않을까라는 질문을 할 수 있게 되었다. 하지만 그 답은 '아니다'이다. 기술적으로야 큰 어려움은 없다. 기사/승객의 문화 차이와 주행 환경 등 많은 것이 다르지만 무엇보다 그 과정을 감수할 만큼의 니즈가 없다고 본다. 누가 카카오 택시에서도 자신의 플레이 리스트를 듣고 싶겠나. 아니 국내 음악 사이트에 언제 어디서나 듣고 싶은 '나만의' 플레이 리스트를 갖고 있는 사람이 얼마나 되겠는가.

II. 스포티파이를 다시 쓴지 2개월 만에 계정에 문제가 생겼는지 접속이 되지 않았다. IP 문제도 아니였다. 어차피 무료 계정이니 ID를 다시 생성하면 되지만 지난 2개월간 스포티파이에 설정해 놓은 앨범들과 북마크들 그것과 연결된 추천 리스트와 친구 목록까지 정성과 시간을 들여 입력한 정보들이 리셋되게 생겼으니 난감해졌다. 스트리밍 사이트를 사용하기 위해 음악 DB사이트를 검색하고 공부하면서 입력한 정보라니... 잘 이해가 가지 않겠지만 그 이유는 단 하나였다. 내가 정보를 입력할수록 나에게 추천해주는 추천들이 정교하다는 믿음(경험) 때문이다. 실제 스포티파이가 추천(Discover Weekly 외...) 해주는 음악 리스트들은 한동안 내 음악 소비를 독점할 정도였다.

goldberg variation - spotify

III. 스포티파이에서 바흐의 골드베르크 변주곡을 검색하면 무려 269장의 앨범이 올라온다. 이미 글렌 굴드를 생각하고 검색을 했거나 그 외 어떤 연주자의 앨범을 들어야 할지 알고 검색한 사람을 제외하고는 이런 결과에 당황할 수 밖에 없다. 무엇부터 들어야 하나. 글렌 굴드 다음으로는 어떤 연주를 들어야 할지, 끊임없이 새롭게 재해석 되는 고전의 새로운 명연은 어떤 것인지 알고 싶지만 오히려 스포티파이에서는 알기 어렵다. 조금은 극단적인 경우이지만 개인적으로 느끼는 스포티파이의 아쉬움 중 하나.

빅데이터가 주목받고 있다. 소셜 미디어에서 상상할 수 없을 만큼 매시간 쌓여지고 있는 데이터들은 개인의 취향을 파악할 수 있는 근거가 된다. 특히 음악 사이트에서 쌓이는 데이터들은 음악 소비자들의 취향을 분석하여 어떤 음악을 누구에게 언제 어떻게 전달하고 판매할지를 분석할 수 있는 아주 직접적인 바탕이 된다. 이를 통해 음원 판매량을 늘리고 시장을 키울 수 있는 자산이 되길 기대한다. 문제는 지금 국내 음악 사이트들에서 쌓이고 있는 데이터들을 빅데이터라고 할 수 있느냐이다. 멜론의 빅데이터를 활용한 파트너 센터(멜론 이용자들의 이용 데이터를 정리해 기획/제작사들에게 분석 툴로 제공) 같은 경우 아주 유의미한 서비스이지만 사실 그와 비슷한 데이터와 서비스는 다른 경쟁 사이트들에서도 충분히 가능하다. 멜론의 데이터가 대표성을 갖는 건 점유율 때문일 것이다. 취향의 확장이나 개인화, 편의성 확대에 기여하지 못하는 빅데이터가 무슨 의미가 있을까 그건 차트일 뿐이다. 빅데이터의 '빅(big)'은 '매스(mass)'가 아니다.

사실 음악 서비스에서 빅데이터는 생각보다 오래 전부터 화두였다. 관련 글을 아래 발췌한다.

"아직 빅데이터라는 개념이 존재하기 전인 1995년 MIT의 샤다난드(Shardanand)와 메이스(Maes)는 링고(Ringo)라는 이름의 음악 추천 시스템(recommender system)을 개발했습니다. 이 시스템의 목적은 특정한 사용자의 음악 취향을 추론해 그의 취향에 적합한 새로운 음악을 추천해주는 것입니다. 이를 위해 그들이 사용한 알고리즘은 아주 간단하지만, 상당히 효율적인 아이디어에 입각하고 있었습니다. 소비자가 새로운 음악을 찾으려고 할 때 자신과 비슷한 취향을 가진 사람들에게 추천을 받는 입소문(word-of-mouth)의 메커니즘을 자동화한 것입니다. 일단 링고는 사용자에게 특정한 노래에 대한 그 사람의 선호가 어떠한지를 7점 척도(아주 좋다 7점~보통 4점~아주 안 좋다 1점)로 평가하게 합니다. 이렇게 사용자의 프로필을 만들고 나면 이제 그것을 바탕으로 개인 간의 취향 유사도를 계산합니다. 예를 들어 A라는 사용자의 취향이 {소녀시대 : 7점, EXO : 6점, 비틀스 : 1점}이라면 이 사용자의 취향은 {소녀시대: 2점, EXO : 3점, 비틀스 : 7점}인 B보다 {소녀시대 : 5점, EXO: 5점, 비틀스 : 2점}인 C와 더 유사하게 판단되는 것입니다. 이렇게 A와 C가 유사하게 판단되면, 이제 C가 높게 평가한 것 중에 아직 A가 평가하지 않은 것(즉, 들어보지 못한 것)을 추천해 주는 것입니다. 요컨대 A와 C의 취향이 비슷하므로 C가 좋아하는 것은 A도 좋아할 것이라는 가정에 입각한 것입니다.

이러한 아이디어는 향후 협업 필터링(collaborative filtering)이라는 이름의 알고리즘으로 정립된 이후 실용화 과정에서 ‘노래를 들었다=좋아한다, 노래를 많이 들었다=많이 좋아한다’는 식으로 평점을 매기는 과정까지 생략한 단순한 알고리즘이 사용됩니다. 대표적인 예가 영국의 음악 추천 서비스인 라스트닷에프엠(Last.fm)입니다. 라스트닷에프엠은 취향을 분석하기 위해 오디오스크러블러(Audioscrobbler)라는 응용 프로그램을 이용, 사용자가 컴퓨터나 모바일 장치, 혹은 특정한 웹 서비스에서 들은 음악의 목록을 모두 긁어모읍니다. 한 사람의 음악 청취 이력이 고스란히 모이는 것입니다. 데이터가 많아질수록 사용자의 취향에 대한 분석은 한층 정확해질 것이고, 이렇게 분석한 취향을 바탕으로 협업 필터링 알고리즘을 통해 유사한 취향을 가진 다른 사용자의 재생 목록을 이용해 추천하는 것입니다. 이렇게 모인 데이터의 양은 얼마나 될까요? 노래 한 곡당 평균 3분이라 생각하고, 한 사용자가 하루에 1시간씩 노래를 듣는다고 치면 하루 한 사람에게 누적되는 데이터는 20곡의 재생 목록입니다. 4,000만 명이 사용한다는 라스트닷에프엠의 통계를 보면 하루에 8억 곡의 청취 이력이 누적된다고 볼 수 있습니다. 이미 2000년대 중후반부터 빅데이터라고 일컬을 수 있는 양의 데이터를 수집해 그것을 바탕으로 서비스를 구현하고 있었던 것입니다." ('빅데이터로 보는 음악의 또 다른 가능성' http://koreancontent.kr/m/post/2228 2015.1.16 - 고건혁 붕가붕가레코드 대표)

감탄하며 쓰던 게 엊그제 같은데 벌써 추억의 이름이 되어버린 라스트에프엠(last.fm). 개인적으로 라스트에프엠이 망가진 건 여러 가지 다양한 이유가 있겠지만 추천 음악가나 다른 사람의 라이브러리 등 가장 핵심 기능인 추천 기능의 퇴보였다고 생각한다. 추천이 핵심이었는데 정작 쉽게 파악도 되지 않고 그러다 보니 결국 시간이 더 오래 걸린다는 점이 컸다. 그리고 지금 라스트에프엠의 아쉬움을 채워주고 있는 음악 추천 서비스의 성공모델은 단연 스포티파이다. 스포티파이의 성공에는 전 세계 수없이 많은 곡들을 무료로(광고 청취를 하지만)들을 수 있다는 이유가 가장 크겠지만 실제 스포티파이의 높은 만족도는 바로 이 추천 서비스에 있는게 아닐까.

스포티파이가 2014년 머신 러닝을 이용해 음악을 분석하는 기술 기업인 Echo Nest를 인수해 내놓은 결과물이 바로 'Discover Weekly'이다. 매주 스포티파이의 8천만 이용자들은 30개의 추천 음악 리스트를 받는다.

genre map - spotify

실제 이 음악들이 각 이용자들에게 얼마나 큰 만족을 주고 있는지는 조금만 검색해봐도 쉽게 파악할 수 있다. 'Discover Weekly' 또한 예전 비슷한 추천 서비스들과 같은 맥락의 협업 필터링을 활용하는데 이처럼 높은 적합(만족)도를 보이는건 무엇 때문일까. 그 답은 머신 러닝으로 6천만 개의 곡을 분석하고 정리해서 만들어낸 1,387개의 서브 장르(사진 참조 : 장르맵)다. '장르'라는 대중음악의 역사에서 오랜 기간 사용되고 합의된 기준의 존재는 빅데이터와 이용자의 취향을 연결하는 고리이자 키(key)가 된다. (스포티파이의 빅데이터 분석과 그 결과물인 'Discover Weekly'에 대한 설명은 브런치 글 '음악과 기술의 결합, Spotify'을 참조하길 바란다. https://brunch.co.kr/@hmin0606/7 )

이제 국내로 돌아가 보자. 국내 음원 사이트들이 음악가들과 음악 관계자들에게 공공의 적이 된지는 오래다. 무엇보다 불합리한 요율 문제 탓이다. 개인적으로는 요율만큼이나 낮은 음원 가격이 문제라고 생각하지만 누구도 풀기 쉽지 않은 문제가 되어버렸다. 거기에는 차별성 없는 국내 음원 사이트들의 경쟁력에도 큰 이유가 있다고 생각한다. 경쟁은 치열하지만 정작 소비자들은 멜론이나 네이버 뮤직이나 벅스나 비트나 다르게 인식하지 않는다는 현실. 이 획일성은 결국 이벤트 같은 할인 경쟁을 강요하는 상황을 만든다. 멜론은 압도적 1위이지만 불안한 점유율이다. 그나마 지금과 같은 안정적(?)인 경쟁 구도가 형성되어 있는건 모바일로 중심이 바뀌면서 가격 비교를 쉽게 하기도 어렵고 무엇보다 규제 탓(덕분)에 직접적인 가격 경쟁을 할 수 없게 된 탓이 크다.

그래서일까 최근 들어 다들 빅데이터에 주목하지만 사실 가장 큰 문제는 이미 국내 음악 소비자들의 음악 소비가 '빅'데이터와는 동떨어져있다는 점이다. TV 예능의 절반이 음악 예능인 나라지만 95% 이상 대중의 음악 소비는 항상 멜론 탑100 차트 안에 머문다. 그때문에 권력이 생기지만 그건 결국 해당 서비스들에게도 족쇄가 된다. 지금 국내 음악 사이트들에게 필요한 건 빅데이터 활용이 아니라 빅데이터를 만들 수 있는 서비스이다. 국내 음악 사이트들의 기술력이 크게 뒤지지 않는다는 걸 안다. 관건은 데이터를 활용하는 기술력 이전의 문제다. 그건 길게는 음악 소비자의 이용 행태를 바꾸는 지난한 과정이다.

앞선 스포티파이의 예와는 달리 장르 음악의 소비가 멸종되다시피한 나라에서 그 시작은 큐레이션 서비스가 되지 않을까 생각한다. 물론 현재도 소위 '비 올때 듣는 음악' 같은 큐레이션 리스트들이 존재하지만 그저 관리 안 되는 페이지에 머무는 게 현실이다. 흔히 '이럴 때 이런 음악' 같은 소프트한 접근이 이용자에게 쉽게 다가갈 것처럼 생각되지만 착각이다. 무엇보다 이런 형태는 쉽게 휘발되며 구조화가 불가능하다. 큐레이션 미디어를 스낵(snack, 가볍고 일회성인)화한 컨텐츠로 오해하는데 꼭 그렇지는 않다. 소비자들은 가치에 의해서 움직이고 반응한다. 큐레이션은 검색으로도 해소 되지 않는 정보 과잉의 시대에 대응하는 소비자의 선택인 셈이다.

무엇보다 음악 서비스에서 큐레이션은 스낵화 되지 않는다. 장르라는 기준이 있고 그 콘텐츠를 바로 경험해서 판단할 수 있기 때문이다. 뜬구름 같은 이야기일 것 같아 이해를 돕기 위해 당장 적어보는 큐레이션 리스트들만 해도 수십 가지가 떠오른다. 죽기 전에 꼭 들어야 할 기타 연주곡 베스트 50, 90년대 One Hit Wonder (국내/국외), 죽기 전에 꼭 들어야 할 2000년대 아이돌 팝 명곡 베스트 50, 아이유 hidden song 10, 주다스 프리스트 vs 아이언 메이든, 올타임 euro dance 넘버 100(국내/국외), 비틀즈 remake best 50... 스포티파이에서 분류한 서브 장르가 1378개 였으니 장르를 넘나드는 이런 큐레이션 리스트는 끝없이 가능하다. 여기에 긴 텍스트는 필요없다. 주제가 가벼워도 좋다. 탑100 차트 밖에 있는 음악이면 무어든 좋다. 어쨌든 차트 밖에 있는 새로운 음악을 큐레이션해 끊임없이 리스트로 제공할 것, 전문가를 통해서 신뢰를 더할 것, 숨기지 말고 서비스 앞 단에 뺄 것, 리스트들을 철저하게 구조화할 것, 가중치든 무엇이든 데이터에 잘 반영할 것. 그리고, 무엇보다 꾸준히 계속할 것...

큐레이션이 정답이라는 이야기는 아니다. 큐레이션은 정답도 목표도 아니다. 과정이다. 다른 과정을 밟아도 된다. 그 과정을 통해 만들어지는 건 취향이자 그걸 담고있는 데이터다. 취향은 경험(학습)을 통해 발견된다. 특히 음악처럼 커버리지가 넓은 카테고리에서는 절대적이다. 이건 얼터너티브 서비스가 되라는 이야기도 인디 음악을 배려하라는 말도 아니다. 온라인 음악 서비스의 핵심 경쟁력에 대한 이야기이자 음악의 본질을 말하는 것이다. 장르는 대중 음악의 역사이자 현재이며 미래다.

어차피 들을 수 있는 음원은 같다. 독점이나 음질로 경쟁력이 생기기 힘들다는 건 타이달(Tidal)의 사례에서도 확인할 수 있다. 결국 같은 음원이지만 이곳에서 듣는 건 다르다 라는 느낌을 주는게 먼저 중요하다. 그리고 그것이 실제 다르게 되도록 하는 작업을 함께 병행할 것. 이상적인 결론이지만 이런 과정을 거치면서 이용자는 해당 음악 사이트에 자신만의 리스트를 만들게 되지 않을까. 그래야 충성도가 생기고, 그게 경쟁력이다. 실제 국내 음원 사이트들은 여러 명이 한 아이디로 쉐어해서 사용하는 비율이 작지 않을 것이다. 사실 충분히 그럴만하다. 헌데 이렇게 자신만의 리스트를 만들게 되면 자연스럽게 그 비율은 줄어들게 될 것이고 매출 증대로 이어질 것이다. 이미 포화상태인 국내 음원 사이트들의 시장 상황에서 이만한 매출 증대 요인도 없지 않은가. 그리고 무엇보다 지금처럼 그저 많은 데이터가 아닌 의미 있는 '빅'데이터가 존재하게 되면 많은 게 더 가능해질 것이다.

discover weekly - spotify

만오천장이 넘는 음반을 갖고 있는 음반 애호가이지만 이제 음악이 소유가 아닌 접속의 시대로 바뀌었다는 걸 인정한다(물론 난 여전히 소유도 하고 접속도 할 것이다). 하지만 단순히 바뀌었다는 걸 넘어서는 새로운 가치가 필요하다면 끊임없이 새롭게 만들어지고 이미 쌓여있는 음악의 보고들을 담는 키워드는 결국 '추천'이 될 것이다. 과거 FM 라디오의 역할을 지금은 스포티파이의 'Discover Weekly'가 예전과는 비교할 수 없을 정도로 효과적으로 해내고 있는 것 처럼 국내 음악 사이트들의 기획자가 황인용, 전영혁, 배철수가 해오던 역할을 할 수 있다고 생각한다. 음악을 많이 알고 직접 추천하라는 뜻이 아니라 그게 가능한 구조를 설계하고 지속적으로 운영하는 것이 결국 그 역할과 다르지 않다는 뜻이다. 기술의 발전이 문화에 기여한다는 건 이런 걸 의미한다고 생각한다.

* 우연한 기회에 두 곳의 국내 온라인 음악 서비스 담당자들과 이야기를 나누게 되었고 그 이야기를 정리해 본 글 입니다. 자연스럽게 관계자들에게나 읽혀질 어려운(?) 글이 되었네요. 그래도 온라인 음악 서비스에 관심이 있는 분이라면 충분히 공감하실 수 있는 내용이라고 생각합니다.

* 지난 달에 올린 '서점의 미래로 불리는 하코다테 츠타야에 다녀오다'에 이어 정확히 한 달 만에 올리는 글 입니다. 앞으로도 한 달에 글 하나는 올려볼까 합니다. 구독, 공유 모두 환영합니다.

keyword

작가의 이전글서점의 미래로 불리는 하코다테 츠타야에 다녀오다.랜선 라이브 시대, 연결되는 것과 지켜야할 것작가의 다음글