brunch

매거진 Tech Ethics

You can make anything
by writing

C.S.Lewis

끊임없는 즐거움…카카오엔터테인먼트의 AI 추천 기술

<<Tech Ethics 6호>>

카카오엔터테인먼트는 IT 기술과 플랫폼을 기반으로 웹툰, 웹소설, 드라마, 영화, 음악 등 다양한 콘텐츠를 기획, 제작, 유통하는 종합엔터테인먼트 기업입니다. 카카오엔터테인먼트는 콘텐츠 조달, 2차 가공, 소비 등이  가능한 독자적인 IP(Intellectual Property) 공급 체계를 바탕으로 국내 이용자들에게 좋은 콘텐츠를 제공할 뿐만 아니라 글로벌 이용자들에게 K 콘텐츠를 알리는 역할도 하고 있습니다.


   그림1.카카오엔터테인먼트 플랫폼에서 사랑 받은 대표 콘텐츠. 카카오페이지(좌), 카카오웹툰(우)


특히 최근에는 AI 기술이 다양한 서비스에 빠르게 적용되고 있습니다. 카카오엔터테인먼트는 이에 발맞추어 이용자들이 읽고 싶은 웹툰, 웹소설, 듣고 싶은 음악을 더 편하고 쉽게 찾을 수 있는 AI 기술을 개발했습니다. ⟪Tech Ethics 6호⟫에서는 카카오엔터테인먼트 이용자들의 취향을 세밀하게 반영하기 위해 탄생한 카카오엔터테인먼트만의 AI 기술들을 소개합니다.


끊임없는 진화를 목표로 탄생한 헬릭스(Helix)


헬릭스(Helix)는 원래 ’나선’을 뜻합니다. 카카오엔터테인먼트는 여기에 “인간의 경험을 학습하고, 이를 향상시키며, 확장해 나가겠다” (‘Humanity Experience Learning Improvement eXpansion’)는 의미를 더해 23년 9월 정식 서비스를 시작했습니다.

 

헬릭스는 이용자들이 콘텐츠를 가장 필요로 하는 시간에, 가장 흥미롭게 느낄 콘텐츠를 전달하는 것을  핵심 목표로 삼았습니다. 1만여개 오리지널 IP를 보유한 카카오엔터테인먼트는 국내 최대 웹툰, 웹소설 플랫폼인 카카오페이지를 통해 넓은 스펙트럼의 작품들을 선보이고 있으며, 콘텐츠 누적 규모도 나날이 커지고 있습니다. 이 다채로운 작품들 사이에서 이용자 스스로 작품을 탐색하는 과정은 의미 있지만, 한편으로 키워드 검색과 작품 선택에 많은 시간과 노력을 필요로 합니다. 


고도화된 AI 기술로 필요한 콘텐츠를 추천하는 헬릭스 푸시(Helix Push)


그렇다면 헬릭스는 어떻게 개별 이용자에게 1)언제 2)어떤 콘텐츠를 추천할지를 결정할까요. 그 해답은 정교한 AI 추천 모델 설계에 있습니다. 이용자가 로그인 후 플랫폼을 방문하고 콘텐츠를 구매하면 AI가 자체적으로 개별 이용자의 방문, 열람, 구매 데이터를 학습하고, 이를 바탕으로 이용자가 가장 선호할 것으로 여겨지는 작품과 시간대를 결정합니다. 헬릭스는 이 결과를 바탕으로 이용자에게 해당 작품과 혜택을 포함한 푸시를 보냅니다.


                                                      그림 2. 헬릭스 서비스 컨셉


헬릭스 서비스는 아래의 과정을 반복하며 최적화합니다.


                                                      그림 3. 헬릭스 서비스 최적화 과정


이용자에게 작품을 추천하는 도구와 방식은 다양할 수 있으며 그 중 개별 이용자를 대상으로 맞춤형 푸시 메시지로 작품을 추천하는 헬릭스 서비스를 ‘헬릭스 푸시(Helix Push)’라고 부릅니다.

 

헬릭스 푸시의 1단계인 Customer & Content 분석에는 아래 4개 모델이 주로 사용됩니다.

 

1) 생애주기 예측 모델(Lifetime model)  

생애주기 예측 모델은 이용자의 서비스 이용 패턴을  분석해 서비스 이탈 가능성을 예측합니다. 

이를 위해 이용자의 작품 열람 패턴을 기반으로 상태를 '활성', '비활성', 그리고 ‘이탈'로 정의하고, 일별 상태 또는 상태 변화를 예측합니다. 

 

각 상태의 의미는 다음과 같습니다:                    

'활성' : 하루 동안 적어도 하나의 작품을 열람하는 상태

'비활성' : 일시적으로 하루 이상 작품을 열람하지 않는 상태 

'이탈' : 더 이상 서비스를 이용하지 않는 상태


생애주기 예측 모델은 단순히 서비스 이탈 가능성을 예측하는것뿐만 아니라 이용자의 작품 열람 패턴을 통해 특정 작품에 대한 흥미가 저하되어 더 이상 이용하지 않을 가능성 또는 계속해서 해당 작품을 읽을 가능성을 예측합니다. 이를 통해 개별 작품에 대한 개별 이용자의 반응을 예측하고, 작품 추천 및 관리를 개선하여 이용자 만족도를 높이기 위한 개별화된 서비스를 제공합니다.

 

2) 이용량 및 이용시간 예측 모델(Usage Time model) 

푸시 메시지를 통한 작품 추천에서 중요한 역할을 하는 요소 중 하나는 이용자의 정확한 서비스 이용 시간입니다. 헬릭스는 이를 위해 확률적 예측 모델을 활용합니다.

 

예를 들어, 한 이용자는 아침에 웹툰을 많이 읽고, 다른 이용자는 밤 늦게 많이 읽는 경향이 있을 수 있습니다. 이 때, 개별 이용자의 행동 패턴을 확률적으로 예측하고, 최적의 서비스 이용 가능 시간을 결정합니다. 

 

AI 모델이 한 이용자가 주로 아침 8시에 웹툰을 읽는 경향이 있다고 예측하면, 해당 시간대에 푸시 메시지를 보내어 작품을 추천합니다. 이를 통해 이용자는 푸시 메시지에 대한 집중도가 높아지고 푸시 메시지를 통한 효율적인 작품 추천이 가능해집니다. 반면, 어떤 이용자가 보통 오후 3시 이전에 웹툰을 읽는데, 그날 오후 3시까지 아무런 활동이 없다면 모델은 이 이용자를 "비활성" 상태로 간주하고 해당 이용자에게 푸시 메시지를 보내어 서비스를 상기시킬 수 있습니다.

 

이러한 확률적 예측 모델은 이용자에게 가장 적절한 추천 시간대를 파악해 푸시 메시지를 전송함으로써  만족도를 높이고 추천 효율을 높일 수 있습니다.

 

3) 작품 선호도 모델 (Preference model) 

작품 추천은 이용자의 만족도 향상과 서비스를  계속 이용하는데 가장 핵심적인 역할을 합니다. 자신의 관심과 취향에 맞는 작품이 추천되면 서비스를 지속적으로 사용하게 되고 나아가 플랫폼에 대한 신뢰도 자연스럽게 상승하기 때문입니다.

 

헬릭스는 이용자가 즐겨 읽은 장르, 소재에 대한 선호도와 다른 이용자들과의 유사성을 기반으로 선호도를 정밀하게 측정합니다.                    

장르/소재/배경 선호도 : 이용자가 선호하는 작품의 장르와 소재, 배경 요소를 평가하고 결정합니다. 작품의 장르적 특성을 계층적으로 세분화하여 구분하고, 이를 토대로 이용자의 선호 장르를 정확하게 평가합니다. 소재 및 배경과 같은 콘텐츠 내용을 구성하는 세부 요소를 특정하기 위해 콘텐츠의 텍스트와 이미지 분석을 통해 주요 소재 및 시대적/공간적 배경과 콘텐츠 토픽을 분류하고 이용자의 선호도를 평가합니다.


협업 필터링 : 이용자들의 선호도와 작품 평가를 분석하여 비슷한 취향을 가진 다른 이용자들과의 유사성을 찾습니다. 이를 통해 한 이용자가 선호하는 작품을 다른 이용자들과 공유하고, 그들이 좋아할 만한 작품을 추천할 수 있습니다.



4) 이용자 작품 열람 성향 분류 모델 (User Clustering model) 

이용자의 작품 열람 이력을 통해 정확한 취향을 이해하려면 다양한 요소들이 고려되어야 합니다.

예를 들어, 이용자가 작품 A와 B를 열람하고 있는 상황을 가정해 보겠습니다.

 

* A: 총 50회의 열람 중 5회 유료 열람 

* B: 총 15회의 열람 중 12회 유료 열람 

 

단순한 열람 횟수 데이터만으로 이용자가 두 작품 중 어떤 작품을 더 선호하는지 판단하기는 어렵습니다.

 

작품의 연재 시기, 연재 회차 수, 이용자가 처음 열람을 시작했던 시기, 회차별 유/무료 열람 여부 등 여러 변수에 영향을 받아 다양한 작품 열람 패턴을 보일 수 있기 때문에 이러한 복잡성을 극복/해소하기 위해 이용자를 비슷한 열람 패턴을 가진 그룹으로 분류하고 이 그룹의 작품 취향을 반영하는 방식을 함께 사용합니다.

 

예를 들어 작품을 열람하기 시작한 날로부터 7일 동안의 열람 패턴을 기반으로 동일 작품에서 비슷한 열람 패턴을 보이는 이용자들을 그룹화하고, 그렇게 분류된 이용자들이 공통적으로 많이 열람하는 작품을 추천하게 됩니다. 

 

이처럼 다양한 모델과 접근을 통해 이용자 취향을 보다 더 정확하게 파악할 수 있고 헬릭스 푸시는 이 결과를 바탕으로 최적화된 콘텐츠를 '언제?' / '누구에게?' / '어떤 작품을?' 추천할지를 결정합니다.

                                                          그림4. 카카오페이지에서 제공되는 헬릭스 푸시 서비스 예시


이용자 편의를 넘어 창작자의 'IP 큐레이터' 역할까지


헬릭스 푸시가 이용자에게만 편리함을 제공하는 것은 아닙니다. 작품 순위와 조회 수 등 일반적인 콘텐츠 추천 방식에서 한 단계 나아가 이용자 취향을 반영한 콘텐츠를 소개하는 헬릭스 푸시는 크리에이터의 숨겨진 보석 같은 콘텐츠들을 다양하게 소개하는 'IP 큐레이터'의 역할도 하고 있습니다. 이용자에게 제공되는 맞춤형 콘텐츠 추천은 크리에이터들의 열정 어린 소중한 작품들이 기존의 추천 시스템 포함 여부와 관계없이 더 많은 독자와 만날 수 있는 새로운 기회를 창출하고 있습니다.

 

헬릭스 푸시는 앞으로도 이용자와 창작자에게 더욱 확장된 가치와 의미를 전달하기 위한 다양한 서비스를 선보일 계획입니다. 또한 카카오페이지를 시작으로 국내 카카오웹툰뿐만 아니라 글로벌 플랫폼에도 순차 도입될 예정입니다. 


고민 없이 취향에 맞는 음악 무한 재생 ‘믹스업(MIX UP)'


이용자에게 최적화된 콘텐츠를 추천하는 고민은 웹툰, 웹소설에 그치지 않고 국내 대표 뮤직 플랫폼인 멜론으로도 이어졌습니다. 멜론 서비스 이용자들은 주로 본인들의 ‘플레이리스트'를 관리하면서 음악을 감상하며 서비스를 이용해 왔습니다.

 

카카오엔터테인먼트는 고도화된  AI 기술로 이용자들에게 어떻게 하면 더 큰 효용을 제공할지 꾸준히 고민했고, 기존의 멜론 서비스의 재생 방식은 그대로 유지하며, 서비스 이용자가 더 다양한 음악을 탐색하고, 비슷한 무드의 음악을 끊김 없이 들을 수 있는 ‘믹스업(MIX UP)' 서비스를 23년 9월 출시했습니다.


                                               그림5. 멜론이 도입한 믹스업 서비스 이용자 화면


믹스업은 다양한 추천 기준을 통해 추천곡을 만들기 때문에 곡을 기반으로 이어지는 유사곡 믹스업 뿐만 아니라  아티스트 믹스업, DJ플레이리스트 믹스업, 장르 믹스업처럼 다채로운 컨셉으로 구성된 믹스업을 즐길 수 있습니다. 이러한 믹스업은 어떻게 제공될까요? 

 

믹스업의 핵심 키워드, ‘Mood’

                                                       그림 6. 믹스업 AI 모델 컨셉


가장 먼저, 이용자의 최근 재생 이력을 믹스업 AI 모델에 입력값으로 넣어주고 최근 재생이력과 중복되지 않는 추천 리스트를 생성합니다. 

두 번째로 이용자가 AI 추천 리스트 재생 여부를 결정하면 최근 재생 이력이 업데이트됩니다. 

마지막으로 업데이트된 새로운 최근 재생 이력이 다시 믹스업 AI 모델의 입력 값으로 들어가고 AI 추천 리스트가 업데이트됩니다. 

 

이 과정이 반복적으로 수행되며 이용자는 자신의 취향을 반영하고, 끊이지 않는 음악 추천을 받을 수 있습니다.

 

그렇다면 이 과정에서 이용자의 만족도를 높이고, 한 세션 안에서 최대한 많은 곡들을 재생하기 위해서 믹스업 AI 모델은 어떤 특성을 가져야 할까요? 

 

예를 들어, 이용자가 헤비메탈 음악을 듣기 위해 멜론의 헤비메탈 DJ플레이리스트를 재생 중이라면, 다음 곡으로 어떤 곡들을 추천해주어야 이용자가 음악 재생을 이어갈 수 있을까요? 다양한 의견이 있겠지만, 아마도 기존에 듣고 있던 헤비메탈 장르의 비슷한 곡을 추천해주는 것이 음악 감상을 이어갈 가능성이 가장 높을 것으로 생각해 볼 수 있습니다.

 

여기서 믹스업 AI 모델의 핵심 키워드가 되는 “비슷하다, 유사하다”의 개념이 등장하게 됩니다. 카카오엔터테인먼트에서는 바로 이 “비슷하다”의 개념에서 착안하여 비슷한 무드(분위기)의 음악을 추천하는 것을 믹스업 AI 모델의 가장 중요한 목표로 설정하고 믹스업 AI 모델 개발을 진행했습니다.


다양한 컨셉의 무드를 반영한 믹스업 AI 모델


그렇다면 여기서 말하는 비슷한 무드는 어떻게 정의될 수 있을까요? 가장 쉽게 생각해 볼 수 있는 것은 장르, 아티스트와 같은 음악에 대한 ‘메타정보’를 무드라고 생각할 수 있습니다. 또, 음원정보, 가사정보 등 곡의 ‘콘텐츠’를 비슷한 무드로 볼 수 있으며, 멜론의 방대한 이용자 청취 로그에서 여러 이용자가 곡 A와 B를 같이 재생했다면 A와 B를 비슷한 무드를 가진다고 할 수 있습니다(co-occurrence). 마지막으로 멜론의 DJ들이 직접 유사한 곡을 선정하여 만드는 DJ플레이리스트 안에 함께 포함된 음악들도 비슷한 무드를 공유한다고 이야기할 수 있습니다.

 

카카오엔터테인먼트에서는 이렇게 다양한 컨셉의 무드를 반영하기 위해, 여러 컨셉의 AI 모델을 각각 학습하고 이를 조합하는 방식으로 믹스업 AI 모델을 개발했습니다. 아래 그림은 믹스업 AI 모델의 학습(train)과 추론(inference)방식을 도식화한 내용입니다.


                                                     그림 7. 믹스업 AI 모델의 구성요소


먼저 다양한 컨셉의 무드를 반영하기 위해 각 컨셉에 맞는 데이터(메타정보, 콘텐츠, 재생 이력, DJ플레이리스트)를 활용해서 AI 모델들을 학습합니다. 이렇게 학습된 재료 모델을 조합(ensemble)하여 하나의 믹스업 AI 모델을 만듭니다. 이때, 어떤 모델에 더 가중치를 부여하느냐에 따라 결과가 달라지고, 이 각각의 조합이 믹스업 AI 모델의 최종 후보군이 됩니다. 이 중 한 가지의 모델을 선택하기 위해서는 재료 모델 학습에 사용되지 않는 새로운 데이터로 각 후보들의 성능을 비교하는 방식(offline test)과 이용자에게 다양한 후보들을 제공하고 가장 반응이 좋은 후보를 선택하는 방식(online test)을 사용할 수 있습니다. 카카오엔터테인먼트에서는 이용자에게 최적의 추천을 제공하기 위해 offline test와 online test를 모두 사용해 결정된 믹스업 AI 모델을 최종 모델로 선정하여 사용하고 있습니다.


이용자의 선택에 따라 변하는 추천 컨셉


다양한 컨셉의 무드가 반영된 멜론 믹스업 AI 모델은 이용자의 재생과 추천, 그리고 재추천이 반복될수록 이용자가 원하는 무드에 맞는 추천을 지속적으로 제공해줍니다. 믹스업을 시작하기 위해 이용자는 시드(seed)가 되는 음악을 선택하여 재생합니다. 이용자가 음악1을 재생하는 상황을 예를 들어 설명해 보겠습니다. 이용자가 음악1을 듣는 ‘겨울 플레이리스트’에 들어갈 만한 곡을 듣고 싶어서”라고 가정할 수 있습니다.  

아래 그림은 다양한 컨셉의 모델이 합쳐진 하나의 믹스업 AI 모델이 이용자에게 음악을 추천해주는 과정을 설명하고 있습니다.


                                    그림8. 다양한 무드가 반영된 믹스업 AI 모델 예시


마찬가지로 믹스업을 시작하기 위해 이용자는 시드(seed)가 되는 음악을 선택하여 재생합니다. 시드 음악이 선택되면 믹스업 AI 모델은 다양한 컨셉의 무드가 섞여 있는 추천리스트를 제공합니다. 시드로 선택된 음악의 다양한 특성에 따라 1) 발라드, 2) 잔잔한, 3) 이별과 관련된 가사, 4) ‘겨울’ 관련 DJ플레이리스트에 포함된 여러가지 무드의 음악이 추천됩니다. 

 

 이 추천을 받은 이용자가 첫 번째 음악 재생을 완료한 뒤 겨울 관련 DJ플레이리스트에 포함된 네 번째 추천 음악을 선택하여 다시 재생한다면 두 번째 추천리스트는 다른 컨셉보다는 겨울 관련 DJ플레이리스트에 포함되었던 음악 위주로 구성이 되고, 그 이후의 이용자 반응에 따라 또다시 비슷한 무드의 음악 추천을 이어나가게 됩니다. 물론, 이용자가 한 가지 무드를 정하지 않고 여러 컨셉의 무드를 계속해서 탐색한다면 추천리스트의 무드 역시 계속 변하게 됩니다.

                                                   그림 9. 이용자의 선택에 따라 변하는 추천 컨셉


이렇게 이용자의 취향을 분석해서 끊김없이 비슷한 무드를 추천하고, 기존 플레이리스트는 유지하면서 본인 취향의 새로운 음악을 시도하고 즐기며 풍부한 음악 경험을 가질 수 있다는 것이 믹스업의 가장 큰 장점입니다.  


기술의 투명성을 위한 다양한 노력…툴팁 공개, 멜론차트 자문위원회


카카오엔터테인먼트는 다양한 콘텐츠를 어떠한 방식과 접근법으로 이용자에게 전달하는 게 좋을지 항상 고민합니다. 그 고민의 결과물이 헬릭스 푸시와 믹스업이고 다른 AI 기술 역시 이용자 취향에 맞는 작품 추천과 랭킹 등의 순위 선정에 적용되고 있습니다.

 

하지만, 복잡한 기술이라도 이용자를 포함한 사회에 투명하게 공개하는 것은 디지털기업의 사회적 책임입니다. 카카오엔터테인먼트는 추천 알고리즘 등 이용자에게 영향을 끼치는 기술을 알기 쉽게 설명하기 위한 ‘툴팁'을 각 서비스에 배치했습니다. 

 

또한 지난 2021년 출범한 멜론차트 자문회의를 통해 멜론차트 정책 수립에 이용자와 외부의 의견을 반영하고자 노력해 왔습니다. 회의 결과는 공식 홈페이지에 보고서로 작성하여 공개하고 있습니다. 23년 10월 1일부터는 자문회의 등 내외부의 의견을 반영하여 무음 재생의 차트 집계를 제외하기도 했습니다.

 

카카오엔터테인먼트는 플랫폼에서 이용자가 끊김없이 만족할 만한 콘텐츠를  즐기는 순간을 지속하기 위한 노력을 멈추지 않을 것입니다. 카카오엔터테인먼트 기술을 책임지고  있는 김기범 최고기술책임자(CTO)의 말로 글을 마무리합니다.

 

“카카오엔터테인먼트는 창작자의 창작물이 더 많은 이용자들의 선택을 효과적으로 받을 수 있는 기술 개발을 지속적으로 해나갈 것입니다. 또한 플랫폼뿐만 아니라 창작자들의 생태계 역시 발전할 수 있도록 기술 윤리적인 측면의 고민도 끊임없이 이어가며 이를 서비스에 반영하겠습니다.“


#AI#맞춤추천#믹스업#카카오엔터테인먼트#헬릭스푸시

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari