brunch

You can make anything
by writing

C.S.Lewis

by 주간문작가 Jul 25. 2021

[디즈니+] 3. 재미있는 추천 이야기

나보다 나를 더 잘 아는 OTT 서비스



 


OTT 기술에서 빼놓을 수 없는 "추천 시스템"


  OTT는 온라인 서비스인 만큼, 기술의 발전과 그 궤도를 같이 한다. 극장에서만 상영되던 영화를 주말 아침 소파에 누워서 스마트폰으로 볼 수 있게 된 것은 데이터 전송 속도가 그만큼 빨라졌기 때문에 가능하게 된 것이다. 또한 TV가 아니라 다양한 미디어 기기들에서 콘텐츠를 소비하는 것이 가능하게 되었기 때문이다. 그만큼, OTT 서비스는 영상 스트리밍 기술이나 앱의 사용성, 클라우드 서비스, 데이터 전송 속도 등 다양한 차원에서의 기술 발전을 필요로 한다.


OTT 서비스 (출처 : https://www.hibox.tv/blog/transition-technologies-for-ott.shtml)


 그렇다면 그중에서도 '핵심적'이라고 할 수 있는 기술에는 어떠한 것들이 있을까? 물론 다양한 기기에서 스트리밍이 되어야 하고, 끊기지 않는 고화질로 영상이 재생되어야 하는 것도 매우 중요한 요소이다. 다만, 사용자들이 계속해서 이 OTT 서비스를 사용하도록 하는 힘 뒤에는 개개인의 취향을 정조준하는 OTT들의 치밀함이 있기 때문이 아닐까 싶다.


 넷플릭스를 비롯한 OTT 서비스들의 대부분은 '구독료'가 그들 매출의 핵심이다. 그만큼 소비자 한 명, 한 명을 잃지 않기 위해 노력하며, 소비자들이 콘텐츠를 고르는데 시간이나 노력을 들이지 않도록 하는 것은 필수적이다. 시시각각 소비자들의 취향을 파고들어 가장 적합한 콘텐츠를 제공해줄 수 있는 OTT 플랫폼이 성공하는 시대인 것이다.


 넷플릭스 자체 평가에 의하면, 사용자가 시청하는 콘텐츠의 75%는 모두 추천 콘텐츠였다고 한다. 넷플릭스는 추천 시스템을 통한 개인 맞춤화를 가장 잘하는 대표적인 OTT 플랫폼이다. 따라서 먼저, OTT 시장을 추천 기술로 지배하고 있는 넷플릭스를 먼저 살펴보고자 한다. 그들은 어떻게 그들의 추천 시스템을 활용하고 있는지에 대해서 먼저 살펴보고, 디즈니는 어떠한 기술과 전략을 펼치고 있는지 알아보자.

 



드라마의 성공을 정확히 예측하는 넷플릭스(Netflix)


 어떤 일을 시작하기 전에 그 일이 성공할 수 있다는 확신이 있다면 어떨까. 특히나 그 일이 나만 잘하면 되는 것이 아니라 나의 노력이 담긴 작품을 사람들이 좋아해 주어야 하는 것이라면? 이것은 나뿐만 아니라 다른 사람들의 취향과 기호까지 모두 꿰뚫어 보는 마법 같은 일이 일어나야만 하는 게 아닐까 싶었다. 그 일이 이미 넷플릭스에서 일어나고 있는 일이라는 것을 알기 전까지는.


 바로 미국 정치 스릴러 <하우스 오브 카드> 이야기이다. 넷플릭스는 이 이야기와 콘텐츠가 성공할 수밖에 없다는 것을 그들이 가진 취향 분석 시스템과 기술을 통해서 알고 있었다. 고객들의 취향을 분석한 후, 인기 있던 원작, BBC 드라마 <하우스 오브 카드>를 리메이크하기로 결정하였다. 그리고 이 영국 원작의 드라마를 시청했던 시청자들 대부분이 데이비드 핀처 감독의 케빈 스페이시 주연 영화를 보았다는 점을 고려해 감독과 주연 배우는 각각 데이비드 핀처와 케빈 스페이시로 선정하였다.


넷플릭스 드라마 "House of Cards"  자료 출처 : netflix.com

 

 결국 이 드라마는 성공이 예측되어 있었고, 그것을 실행에 옮기자 역시나 이 드라마는 넷플릭스의 성장에 엄청난 이바지를 하게 된다. 이 작품 덕분에 넷플릭스의 2013년 순이익은 37억 5000만 달러(약 3조 8175억 원)에 달했다. 결국, 차곡차곡 쌓이고 있었던 고객 데이터와 넷플릭스가 갈고닦은 추천 시스템은 그들에게 더욱 정확히 소비자들의 취향을 파고들 수 있는 콘텐츠를 만들게 하였던 것이다.




내용 기반 필터링, 협업 필터링, 그리고 모델 기반 협업 필터링


 넷플릭스는 어떤 추천 시스템을 사용하고 있는 것일까? 아니, 만약 추천 시스템을 사용하지 않게 되면 어떻게 되는 것일까? 한국 넷플릭스에 존재하는 콘텐츠의 개수는 2020년 10월 기준으로 했을 때 약 4,300개라고 한다. 그렇게 많은 수의 콘텐츠들을 가나다순으로 나열할 수도, 인기 있는 콘텐츠만을 보여줄 수도 없는 것이다. 따라서 그들은 어떻게 하면 한 명 한 명에게 맞는 콘텐츠들을 선정할 수 있을까를 치열하게 고민하고, 개인의 취향에 맞게끔 콘텐츠들을 '필터링'하는 방식을 발전시켜 온 것이다.  


 그렇다면 먼저, 간략하게 추천(필터링) 시스템에 대해서 알아보자.

(1) 내용 기반 필터링 (Content-based Filtering)

(2) 협업 필터링 (Collaborative Filtering)

(3) 모델 기반 협업 필터링 (Model-based Collaborative Filtering)





(1) 내용 기반 필터링 (Content-based Filtering)

 '내용 기반 필터링'은 콘텐츠 자체의 특성을 분석하고 이를 기반으로 추천을 진행하는 필터링 방식을 의미한다. 한 사용자가 로맨틱 코미디 장르의 영화 <노팅힐>을 처음부터 끝까지 시청한 뒤 좋은 평가를 남겼다면, 이 사람이 로맨틱 코미디를 좋아한다고 판단하여 유사한 장르의 영화 <어바웃타임>을 추천해주는 것이다. 이 필터링 방식은 다른 사용자의 데이터를 필요로 하지 않는다는 장점이 있는 방식이다. 하지만 선호하는 특성을 가진 항목만을 계속해서 반복 추천할 여지가 있다는 점에서 단점을 지니고 있기도 하다.



(2) 협업 필터링 (Collaborative Filtering)


 '협업 필터링'은 마치 '집단 지성'처럼 사용자 간의 특징을 통해 추천을 하는 시스템을 일컫는다. 즉, 사용자 A가 <해리포터> 시리즈, <찰리와 초콜릿공장>, <토이스토리> 시리즈를 선호한 상황에서 사용자 B가 <해리포터> 시리즈와 <찰리와 초콜릿공장>을 선호했다면, 두 사용자 사이에 유사성이 있다고 판단하여 사용자 B에게 <토이스토리> 시리즈를 추천해주는 시스템인 것이다. 이 필터링 방식은 항목의 내용에 대해서 상세하게 파악해야 할 필요가 없다는 장점을 가진다. 반면, 소수의 인기 있는 콘텐츠가 중복되어 추천되면서 소수의 콘텐츠에만 관심이 쏠리게 된다는 단점도 존재한다.



(3) 모델 기반 협업 필터링 (Model-based Collaborative Filtering)

 '협업 필터링(Collaborative Filtering)'의 종류는 크게 Memory-based와 Model-based로 나누어진다고 한다. 먼저, '메모리 기반 협업 필터링(Memory-based CF(Collaborative Filtering))'은 전통적인 방법으로 이미 있는 데이터(메모리)를 바탕으로 필터링을 하는 것을 의미한다. 반면, '모델 기반 협업 필터링(Model-based CF(Collaborative Filtering))'은 기계 학습을 이용하여 사용자와 아이템의 숨겨진 특성 값들을 분석하는 방법이라고 볼 수 있다.


 '모델 기반 협업 필터링(Model-based Collaborative Filtering)'에 대해서 조금 더 자세히 알아보자. 이 방식은 기존 항목 간의 유사성을 단순하게 비교하는 것이 아니라, 자료 안에 내재화된 패턴을 이용하는 방법이라고 할 수 있다. 이를 위한 첫 번째 방법은 바로 관련되는 자료의 크기를 동적으로 변화시키는 방법이다. 가령, <슬기로운 의사생활 2>를 추천하기 위해서는 <슬기로운 의사생활 1>을 좋아했는지가 매우 중요한 요소가 되지만, <주토피아>라는 영화를 추천하기 위해서는 많은 수의 유사한 영화를 고려해야 하는 것처럼 말이다.



 이렇게 추천을 위한 자료의 크기를 변화시키는 방법도 있지만 현재는 잠재(latent) 모델을 기반으로 두고 있는 알고리즘이 가장 주목을 받고 있다고 한다. 이는 특정 항목을 사용자가 좋아하는 이유를 알고리즘적으로 알아내는 방법이라고 할 수 있다. 가령, 어느 사용자가 <태양의 후예>라는 드라마를 좋아하는 경우, 이 정보를 바로 사용하는 것이 아니라 다른 정보들을 활용하여 선호하는 이유를 유추해 내는 것이다. 따라서 위의 첫 번째 그림은 사용자의 선호 정보를 바로 활용하는 형태라면, 그 아래 그림은 사용자가 왜 그렇게 선호하는지를 추론하여 잠재 노드(latent node) 통해 추천의 정확도를 높이는 형태이다.


 즉, 사용자 A가 <태양의 후예>와 <성균관 스캔들>을 좋아하는 이유는 사용자 A가 '송중기'라는 배우를 좋아하기 때문이고, 사용자 B가 <태양의 후예>와 <그 겨울, 바람이 분다>를 좋아하는 이유는 사용자 B가 '송혜교'라는 배우를 좋아하기 때문이다. 이렇게 각 사용자가 특정 항목을 좋아하는 이유를 잠재 노드의 추정을 통해 발전시키게 되면 더욱더 정확한 추천이 가능해질 수밖에 없다.


 이를 위해서는 당연하게도 각 사용자와 작품에 대해서 더 세분화된 분류가 진행될 수밖에 없을 것이다. 사용자가 로맨스 콘텐츠를 선호하는 것처럼 보이더라도, 순수한 첫사랑과 관련된 로맨스 콘텐츠는 좋아하는 반면, 자극적인 불륜의 로맨스 콘텐츠는 선호하지 않을 수도 있기 때문이다. 이처럼 '모델 기반 협업 필터링'을 통해 사용자와 항목의 특성들은 더 세분화되며, 이를 바탕으로 더욱 정밀하고 정확한 추천이 진행된다.




이 썸네일(thumbnail)을 보면 클릭 안 할 수 없을걸?

"추천에 추천을 더하다"


 그런데 넷플릭스는 추천할 콘텐츠를 정확한 데이터를 통해 선정하는 데에서 그치지 않는다. 넷플릭스는 사용자에게 특화된 썸네일(thumbnail) 이미지를 보여줌으로써 사용자들의 시청을 한번 더 유도한다. 위에서 언급한 필터링 시스템을 활용해 넷플릭스는 철저하게 당신이 어떤 감독과 배우를 좋아하는지, 어떤 장르를 좋아하는지를 꿰고 있다. 그리고 매 순간 달라지는 추천의 정밀도에 더해 썸네일 이미지도 매번 달라지게 만들어 놓은 것이다.

 

 예를 들어, 동일한 영화 '굿윌헌팅(Good Will Hunting)'을 각각의 사용자에게 추천해주려고 하는 상황이라고 가정해보자. 하나의 영화이지만 그 영화의 썸네일 이미지로 선택될 수 있는 이미지 컷은 무궁무진할 것이다. 따라서 넷플릭스는 코미디를 좋아하는 사람에게는 코미디언 로빈 윌리엄즈(Robin Williams)의 썸네일을 보여주고, 로맨스를 좋아하는 사람에게는 로맨틱한 장면의 썸네일을 보여준다. 이를 통해 사용자에게 '추천에 추천을 더한' 썸네일을 제시하여 시선을 끌어당기고, 그들의 취향에 적합한 콘텐츠를 클릭하도록 유도한다.


사용자에 따라 다르게 표현되는 넷플릭스의 썸네일 이미지 (출처 : https://motiiyz.tistory.com/114)




그렇다면 Disney+(디즈니 플러스)의 기술은?


 넷플릭스가 이처럼 철저한 데이터의 강자라고 불리는 반면, 디즈니는 콘텐츠의 강자로 불린다. 당연히 넷플릭스보다 시장 진출이 늦은 디즈니의 입장에서는 그만큼의 사용자 데이터와 노하우가 부족할 수밖에 없을 것이다. 이 때문에, 디즈니 플러스의 구독료가 넷플릭스 구독료의 절반 정도로 책정된 이유가 디즈니가 초기 사용자들을 적극 유입함으로써 다양한 데이터를 확보하기 위함이라고 보는 평가도 많다.


디즈니 플러스(Disney+) 출처 : disney.com


 물론 OTT 플랫폼을 이용해서도 다양한 데이터를 차곡차곡 쌓아가고 있겠지만, 디즈니는 디즈니 리서치(Disney Research)에서 인공지능 기술을 다양한 방면에서 연구하고 발전시키고 있다. 가령, 디즈니가 2017년 발표한 추천 관련 기술 중 하나인 프베스(FVAEs, Factorized Variational AutoEncoders)는 관람객들의 표정을 실시간으로 분석하여 영화 평점을 매기는 인공지능이다.


FVAEs (출처 : Disney Research)


 FVAEs의 가장 큰 장점 중 하나는 '미묘한' 관객의 즉각적인 반응과 감정적 상태를 읽어낼  있다는 것이다. 즉, 자신도 모르게 느꼈던 세밀한 감정 변화를 인공지능이 읽고 그 영화에 대한 평점까지 정확하게 유추해 낸다는 것이다. 이렇게 사람의 얼굴과 표정을 읽어내야 하는 부분은 당연히 'OTT 서비스'가 아닌 영화, 연극, 뮤지컬, 테마파크 공연 등의 오프라인 형태에서 시작되었고, 이러한 환경에서 더욱 그 효과를 발휘할 것이다.


 다만, 디즈니 리서치를 비롯하여 디즈니 자체적으로 다양한 인공지능 기술을 연구하고 있는 것이 사실이고, 어떻게 하면 미묘한 감정 변화까지 캐치할 수 있을까를 끊임없이 고민하는 디즈니이기에 OTT 서비스에 있어서도 더욱더 적확한 추천 시스템을 만들어 내기 위해 노력하지 않을까라는 기대를 해보았다. 전통적인 콘텐츠 강자인 디즈니는 그들이 넷플릭스에 비해 데이터 측면에서는 부족하다는 것을 알고 꾸준한 연구와 실험을 계속해 나갈 것이다.


 그리고 이러한 데이터와 추천 시스템에 대한 고민은 비단 디즈니나 넷플릭스만의 고민은 아닐 것이다. 국내/외 다양한 OTT 서비스들 역시 구독료가 그들 매출의 핵심이라는 기본적인 구조는 모두 동일하기 때문에 개개인별로 맞춤화된 서비스를 안정적으로 구축하기 위해서 지금 이 순간도 노력하고 있을 것이기 때문이다. 다양한 플랫폼들이 어떻게 콘텐츠를 추천의 정확도를 높여 나갈지가 궁금하다. 그리고 그 속에서 디즈니 플러스는 한국 시장을 비롯해 전 세계에서 어떻게 추천 시스템을 더욱 고도화할지 기대가 된다.




[참고]

콘텐츠 추천 알고리즘의 진화, 서봉원(서울대학교 융합과학기술대학원 교수)

정보통신산업진흥원 디지털 콘텐츠 Weekly Report (2018년 1월 2주)

https://motiiyz.tistory.com/114

https://studiour.tistory.com/entry/%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5-%EA%B8%B0%EC%88%A0%EA%B3%BC-%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%9D%98-%EA%B4%80%EA%B3%84-%EB%B6%84%EC%84%9D

https://neilpatel.com/blog/how-netflix-uses-analytics/

http://www.astronomer.rocks/news/articleView.html?idxno=86454

https://bangseogs.tistory.com/98


        

매거진의 이전글 [디즈니+] 2. 디즈니의 요정 가루
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari