음악, 데이터의 옷을 입다

메타데이터, 딜리버리, 그리고 임베딩

by 클래식타임


지난 글에서는 넷플릭스 시리즈 '플레이리스트'를 통해, 스포티파이라는 혁신이 어떻게 음악 산업의 판도를 바꾸었는지 살펴보았습니다.


그 거대한 변화의 중심에는 눈에 보이지 않는 데이터의 흐름과 질서가 자리 잡고 있었는데요.


오늘은 그 질서를 만드는 핵심 요소인 '메타데이터', '딜리버리', 그리고 '임베딩'에 대해 더 깊이 이야기해보고자 합니다.





1. 메타데이터: 품질이 모든 것을 결정한다


음악 서비스의 가장 근본적인 자산은 단연 '메타데이터(Metadata)'입니다. 이는 곡명, 아티스트, 앨범 같은 기본 정보를 포함해, 작곡가, 작사가, 편곡자, 발매일, 장르 등 하나의 음악이 가진 모든 정체성 정보를 의미합니다.


주목할 점은, 이 메타데이터의 '품질'이 서비스 경험 전체를 좌우한다는 것입니다.

사용자가 특정 곡을 검색하고, 플레이리스트를 만들며, 새로운 음악을 추천받는 모든 과정은 이 데이터를 기반으로 이뤄집니다. 데이터가 정확하지 않거나 누락되면, 좋은 곡은 사용자에게 발견될 기회조차 잃게 됩니다.


또한, 메타데이터는 아티스트와 권리자에게 수익을 정산하는 투명성의 근거가 됩니다.

결국 잘 관리된 메타데이터는 사용자에게는 '발견의 즐거움'을, 창작자에게는 '정당한 보상'을 보장하는 서비스의 가장 중요한 약속인 셈인 것이죠.





2. 딜리버리: 글로벌 데이터의 흐름과 표준


전 세계의 음반사와 유통사로부터 매일 수만 곡의 음원이 스트리밍 플랫폼으로 들어옵니다.

이 음원과 메타데이터가 국제 표준에 따라 정해진 시스템을 통해 전달되는 과정'딜리버리(Delivery)'라고 합니다.


여기서 중요한 현실적 과제는 '표준화'입니다. 글로벌 플랫폼과 국내 플랫폼이 따르는 세부 기준, 각 유통사가 데이터를 관리하는 방식이 미세하게 다르기 때문에, 같은 앨범이라도 서비스마다 크레딧 정보가 다르게 표시되는 경우가 발생합니다.



실제로 동일한 앨범의 크레딧 정보가 멜론, 스포티파이, 유튜브 뮤직, 바이브 뮤직에서 어떻게 다르게 보이는지 비교해보면 이 차이를 명확히 알 수 있습니다.


각 음악 스트리밍 서비스 플랫폼 별 크레딧 정보 표기 방식 차이 (멜론 / 유튜브 뮤직 / 스포티파이 / 바이브 뮤직)


따라서 딜리버리 과정에서는, 각기 다른 방식으로 들어오는 데이터를 서비스의 기준에 맞게 정제하고 검수하는 품질 관리(QC) 역할이 필수적일 것입니다.






3. 임베딩 : 데이터에 '의미'를 부여하는 기술


데이터를 잘 받고 깨끗하게 정리했다면, 이제 컴퓨터가 그 '의미'를 이해하게 만들어야 합니다.

컴퓨터는 '태연(TAEYEON)'과 '백현(BAEKHYUN)'의 음악이 유사한 계열이라는 것을 어떻게 알 수 있을까요?


이때 사용되는 핵심 기술이 '임베딩(Embedding)'입니다.


카카오팀에서 사용하는 6가지 음원 벡터 (출처 : https://brunch.co.kr/@kakao-it/282)


임베딩은 '가수명: 태연', '장르: 발라드', '#감성'과 같은 텍스트 정보를, 컴퓨터가 의미 관계를 파악할 수 있는 숫자 좌표(벡터)로 변환하는 과정입니다.

이 변환을 거치면, 비슷한 속성을 가진 음악들은 벡터 공간상에서 서로 가까운 거리에 위치하게 되는 것인데요.




한 논문에서는 [가수명, 장르, 태그리스트] 등을 조합해 '노래 문장(Song Sentence)'을 만들고, 이 문장을 통째로 벡터로 변환하는 방식을 사용했습니다.


이는 AI가 단순히 텍스트 일치 여부를 넘어, 노래가 가진 복합적인 맥락과 분위기를 이해하게 만드는 과정이며, AI 기반의 정교한 음악 추천은 바로 이 임베딩 기술로부터 시작된다고 볼 수 있습니다.



출처 : 「음원 메타데이터 임베딩을 활용한 사용자 플레이리스트 기반 음악 추천 」논문







마치며: 보이지 않는 심장을 뛰게 하는 일



하나의 음악이 사용자에게 닿기까지, 그 이면에는 데이터를 정의하고(메타데이터), 유통하며(딜리버리), 의미를 부여하는(임베딩) 복잡하고 정교한 과정이 있었습니다.

이러한 기술들이 음악을 이해하고 연결하는 방식의 무한한 가능성을 보여주는 것은 분명합니다.


결국 기술사용자와 좋은 음악을 더 가깝게 연결하기 위해 존재하며, 그 가능성을 탐구하는 것은 언제나 흥미로운 일인데요.


더불어, 좋은 음악을 사용자에게 가장 좋은 방식으로 전달하고 싶다는 마음은, 이 보이지 않는 데이터의 흐름이해하고 정성껏 다루는 데서 시작되는 것 같습니다.






음악 전공의 길에서 콘텐츠와 미디어, IT를 결합하여
음악으로 세상을 이롭게 만들 미래를 그리고 있습니다.







참고 문헌 및 자료


[논문]

남경민 외 4인, 「음원 메타데이터 임베딩을 활용한 사용자 플레이리스트 기반 음악 추천」, 정보처리학회 논문지 Vol.13, No.8, 2024.


[기사 및 참고 링크]

가우디오랩(Gaudiolab), 「AI가 나를 위한 BGM을 찾아주는 기술, Music Replacement」, 가우디오랩 기술 블로그, 2024.05.21.


김혜선, 「플레이리스트 데이터, 어떻게 분석해야 할까?」, Brunch, 2020.12.03.

Market Eyes, 「[Kakao Arena] 플레이리스트 추천시스템 경진대회 돌아보기」, Tistory, 2020.08.06.

kciter, 「Shazam은 어떻게 음악을 인식할까?」, kciter.so, 2017.03.12.




작가의 이전글넷플릭스 '플레이리스트': 음악, 산업, 그리고 데이터