brunch

You can make anything
by writing

C.S.Lewis

by Mobiinside May 26. 2023

베일에 싸인 유튜브 알고리즘의 모든 것






� 이 글, 이런 분이라면 꼭 읽어 보세요.


1. 베일에 싸인 유튜브 알고리즘이 궁금한 분

2. 유튜브 알고리즘의 변천사가 궁금한 분

3. 알고리즘의 선택, 어떤 원리로 받는지 궁금한 분








알 수 없는 유튜브 알고리즘? No!





유튜브에서 종종 볼 수 있는 ‘알 수 없는 유튜브 알고리즘 밈’





‘알 수 없는 유튜브 알고리즘이 나를 이곳으로 이끌었다.’ 라는 밈을 아시나요? 유튜브를 보다가 알고리즘 덕에 내 취향인 영상이나 유튜버를 만난 경험이 모두 있으실 텐데요. 내가 좋아할 법한 영상들만 추천해 주기에 눈을 떼지 못하고 계속 유튜브를 이용하게 되죠.


실제로 유튜브 알고리즘은 유튜브에서 가장 중요한 역할을 맡고 있다고 해도 과언이 아닙니다. 유튜브 CPO(Cheif Product Officer) 닐 모한스가 2019년 한 인터뷰에서 추천 알고리즘 덕분에 유튜브 이용 시청 시간의 70%가 발생한다고 언급했을 정도이니 말이죠. 이렇다 보니 유튜브의 알고리즘의 원리를 궁금해하는 사람들도 많습니다.




알고리즘의 선택을 받은 것으로 유명한 브레이브걸스 롤린 무대 영상과 다나카





특히 콘텐츠 제작자에게 알고리즘의 축복은 꿈만 같은 일이죠. 모든 콘텐츠 제작자라면 21년 브레이브 걸스의 롤린 열풍, 22년 나몰라 패밀리 핫쇼의 다나카 열풍처럼 알고리즘을 타고 내가 만든 콘텐츠가 널리 퍼지길 바랄 거예요.


그렇다면 유튜브 알고리즘에는 어떤 비밀이 숨겨져 있을까요? 오늘 이 글에서 모두 알려드릴 테니, 끝까지 집중해 주세요 � 아 참, 저희 블링에서는 <알고신 추천 영상> 기능을 통해 유튜브 알고리즘을 탄 영상을 모아 볼 수 있으니, 알고리즘의 선택을 받을 콘텐츠가 궁금하다면 대한민국 대표 유튜버 검색 엔진 블링이자 유튜브 미디어 블링을 방문해 주세요 �








유튜브 알고리즘의 존재 이유



우선 유튜브 알고리즘의 비밀을 파헤치기 전에, 유튜브 알고리즘의 존재 목적부터 살펴보죠. 유튜브는 영상 시청 플랫폼이고 광고주의 광고를 최대한 많은 사람들에게 노출시키기 원해요. 유튜브라는 플랫폼에 계속 머무르며 광고를 시청시켜야 하기 때문에 사용자가 유튜브에 체류할 수 있는 장치가 필요하죠.


그래서 존재하는 것이 바로 유튜브 알고리즘입니다. 사용자가 계속해서 유튜브의 콘텐츠를 시청할 수 있도록, 사용자의 취향을 저격하거나 호기심을 느낄 수 있는 영상을 추천해 한 영상이 끝난 뒤에도 체류하며 영상을 보도록 유도하죠. 즉 사용자의 특성에 맞춰 좋아할 법한 매력적인 콘텐츠를 선별하는 것이 바로 유튜브 알고리즘의 근본적인 존재 이유예요.



1. 조회수 중심의 유튜브 알고리즘


: 사람들이 많이 보는 콘텐츠를 추천하면 되지 않을까?


이를 달성하기 위해 2010년대 초반 유튜브는 조회수가 중심의 알고리즘을 운영했어요. 사람들이 많이 보는 콘텐츠에는 이유가 있다는 논리였죠. 인기가 많은 콘텐츠를 추천한다는 명목으로 조회수가 높은 콘텐츠를 추천 콘텐츠로 제안했어요.





스팸 먹방 중 낚시성 썸네일을 사용했던 유튜버 밴쯔




하지만 단순히 조회수만으로 추천 영상을 선별하다 보니 낚시성 콘텐츠가 많아졌어요. 자극적인 제목과 썸네일로 클릭을 유도하는 콘텐츠가 많았죠. 클릭만을 유도하는 것이 급선무였기에 막상 콘텐츠를 시청하면 내가 원했던 내용과 달랐고 가짜뉴스성 정보가 많아졌어요. 외국에서도 Clickbait(클릭을 유도하는 미끼)라는 말이 있을 정도로 조회수 중심의 알고리즘 때문에 피해 보는 사용자가 속출했죠.




2. ‘추천’ 유튜브 알고리즘 시대의 시작


: 이용자의 만족도를 높이기 위한 유튜브 알고리즘의 등장



이런 문제를 해결하기 위해 유튜브는 추천 알고리즘을 고도화하기 시작했어요. 물론 이순간에도 알고리즘은 수정되고 있기에 유튜브 직원이 아니고서는 정확한 추천 알고리즘을 알 수 없지만, 구글이 논문으로 발표한 추천 영상 목록 제작 알고리즘과 추천 영상 선별 알고리즘을 살펴보면 일반적인 유튜브 알고리즘의 원리를 알 수 있죠. 크게 협업 필터링과 콘텐츠 기반 필터링으로 나눠져 있는데요.




1) 협업 필터링(Collaborative Filtering)





협업 필터링 예시





가장 먼저 협업 필터링이에요. 사용자로부터 얻은 선호 정보에 따라 관심사를 예측하는 방법인데요. 협업 필터링은 사용자 기반 추천과 아이템 기반 추천으로 나눌 수 있어요. 이중에서도 특히 사용자 기반 추천은 취향이 비슷한 사용자를 그룹으로 묶어 영상을 추천해 주는 것을 의미하는데요.    

                

예를 들어 볼게요. A와 B는 모두 해외축구 관련 영상들을 빼놓지 않고 봤다면 알고리즘은 둘을 유사한 사용자로 인식해요. 그럼 사용자 A가 손흥민 득점 영상을 봤을 때 그와 유사한 성향을 가진 B도 이 영상을 좋아할 것이라 생각하고 추천하는 거죠.




2) 콘텐츠 기반 필터링(Content-Based Filtering)





콘텐츠 기반 필터링 예시





다만, 협업 필터링 시스템에는 한계가 있어요. 바로 신규 가입자와 같이 콘텐츠를 시청한 이력이 없는 사용자를 위한 추천이 어렵다는 것인데요. 이런 한계를 극복하기 위한 것이 바로 콘텐츠 기반 필터링이에요.


콘텐츠 기반 필터링에서는 사용자가 시청한 콘텐츠와 유사한 특성을 가진 콘텐츠를 추천해 줘요. 콘텐츠 자체를 분석하는 건데요. 이번에는 사용자 A가 계속 보는 영상을 분석해 보니 모두 뉴진스의 Hype Boy 뮤비 영상이었다고 가정해 볼게요. 그럼 알고리즘은 이 사용자가 좋아하는 콘텐츠는 뉴진스의 영상이거나 Hype Boy라는 영상이라는 특징을 도출할 수 있죠.


그럼 이 사용자에게는 앞으로 뉴진스의 콘텐츠가 나올 때마다 추천을 해줄 수도 있고, Hype Boy의 라이브 영상이 나올 때마다 추천을 해줄 수도 있는 거예요. 협업 필터링 시스템에서는 어려웠던 신규 사용자를 위한 콘텐츠 추천이 영상 내용 자체를 분석하는 콘텐츠 기반 필터링에서는 가능하죠. 물론 콘텐츠의 특성에 집중하다 보니 정작 사용자의 취향을 파악해 아예 새로운 영상을 추천하는 것에는 한계가 있지만요.



3) 하이브리드 추천 시스템(Hybrid Recommendation System)





협업 필터링/콘텐츠 기반 필터링 장단점과 하이브리드 추천 시스템





두 추천 알고리즘은 서로의 장단점이 분명해요. 그래서 유튜브에서는 이런 장단점을 보완한 하이브리드 추천 시스템이 활용되고 있어요. 협업 콘텐츠가 가진 한계점인 신규 가입자에게는 콘텐츠 기반 필터링 기술을 통해 비슷한 특성의 콘텐츠를 추천하고, 추천한 콘텐츠를 사용자가 시청하면서 데이터가 충분히 쌓인 뒤에는 협업 필터링을 통해 추천의 정확도를 높이며 점점 더 사용자의 취향에 맞는 콘텐츠를 제공하는 식이죠.




+α) 머신러닝 추천 시스템(Machine Learning Recommendation System)



협업 필터링 시스템, 콘텐츠 기반 필터링 시스템, 하이브리드 추천 시스템과 별개로 활용되는 알고리즘이 있으니 바로 머신러닝 추천 시스템이에요. 2016년부터 도입된 머신러닝 추천 시스템에서는 사용자에게 후보 영상을 먼저 제안하고, 사용자가 어떻게 반응하는지를 학습하며 점점 더 정교한 추천 결과를 만들죠.


머신러닝 추천 시스템 역시 두 가지로 나눌 수 있는데요. 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)이에요. 어려운 말처럼 보이지만 결정적인 차이는 정답을 먼저 주는지, 안 주는지의 여부예요.





머신러닝 추천 시스템의 지도학습/비지도 학습




먼저 지도 학습에서는 정답을 알려준 상태에서 학습해요. 예를 들어 코끼리와 앵무새를 모르는 알고리즘에게 어떤 사진이 코끼리인지, 어떤 사진이 앵무새인지 정답을 알려주면서 학습을 시키는 거죠. 반면 비지도 학습에서는 정답을 알려주지 않고 학습을 시작하게 해요. 지도 학습처럼 어떤 사진이 코끼리인지 앵무새인지 알려주지 않더라도 코끼리는 코가 길다는 것, 앵무새는 날개가 달려있다는 것과 같은 공통 특성을 통해 비슷한 사진을 분류하죠


이 두 방법을 활용해 머신러닝에서는 사용자의 시청 시간이나 조회 수, 혹은 좋아요나 댓글과 같은 데이터를 학습하면서 예측 알고리즘을 다듬어요. 우리의 활동 데이터에 대한 수많은 학습 덕분에 우리가 좋아할 법한 콘텐츠를 제안할 수 있는 거죠.








“유튜브 추천 알고리즘의 존재 이유에 집중하기”





2010년대 이후 유튜브 알고리즘 변천사





지금 이 순간에도 유튜브의 알고리즘은 계속 발전하고 있어요. 유튜브의 경쟁자인 넷플릭스, 틱톡 역시 사용자를 자사 플랫폼에 더욱 오래 체류시키고 싶어 하기 때문이죠. 그렇기에 제가 오늘 말씀드린 유튜브 추천 알고리즘도 언젠가 변할 수 있어요.


그래서 현재의 알고리즘만을 노리고 콘텐츠를 제작하는 것보다는 유튜브 추천 알고리즘의 존재 이유의 본질에 집중해서 그 본질을 꿰뚫 수 있는 콘텐츠를 제작하는 것이 중요해요. 알고리즘을 노린 낚시성 콘텐츠가 더 이상 통하지 않는 것처럼 말이죠. 결국 유튜브는 지속적으로 사용자가 유튜브에서 시청하는 콘텐츠에 만족하고, 또 유튜브가 추천하는 콘텐츠를 신뢰하고 클릭하길 바라며 추천 알고리즘을 다듬고 있어요.


그렇기에 자신의 채널 구독자가 좋아할 법한 고퀄리티의 콘텐츠를 만드는 것에 집중해야겠죠. 지금껏 올린 영상 중 가장 반응이 좋았던 콘텐츠를 보면서 앞으로의 콘텐츠에선 어떤 점을 더 보완할지 고민하며 매력적인 콘텐츠를 제공하기 위해 노력하는 것 역시 중요할 거예요.





블링(vling), 알고신 영상 검색 기능





이제 막 콘텐츠를 올리기 시작했다면, 다른 채널의 제작자가 올린 영상 중 유튜브 사용자들에게 인기를 얻고 있는 콘텐츠를 참고하는 것도 좋아요. 알고리즘의 선택을 받는 콘텐츠를 만들기 위해서는 이미 알고리즘을 탔던 콘텐츠를 벤치마킹하는 것도 좋은 방법이죠.


유튜브 관련 대표 검색 엔진에서도 ‘알고신 영상 검색’이라는 기능을 통해 알고리즘의 선택을 받은 영상들을 모아 볼 수 있는데요. 인기 영상들은 어떤 제목과 썸네일을 활용해서 클릭을 이끌어냈는지부터 어떤 콘텐츠 플롯과 소재를 활용해 시청을 지속시키고 계속해서 추천 영상에 뜨게 되었는지를 참고할 수 있어요.








오늘은 유튜브 알고리즘의 비밀과 그동안의 변천사를 살펴보았는데요. 우리가 보는 영상들이 어떤 원리를 통해 추천되는지 궁금했던 많은 분들에게 이 콘텐츠가 도움이 되었길 바랍니다. 한편으로는 알고리즘의 변천사를 알았으니 알고리즘을 잘 탈 수 있는 콘텐츠의 비결이 궁금하실 텐데요. 다음 콘텐츠에서는 내가 만든 영상을 알고리즘의 선택을 받게 하기 위해 해야 할 것들을 투 두 리스트(To-do list)로 정리해서 다뤄보도록 하겠습니다 �




해당 글은 블링(vling)과 모비인사이드의 파트너쉽으로 제공되는 기사입니다.   




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari