왜 나는 이 영상을 보게 되었을까?
하루에도 수억 개의 영상이 올라오는 유튜브. 그런데 우리는 매번 딱 내 취향에 맞는 영상이 추천되는 걸 경험합니다. 마치 내 친구가 내 마음을 미리 읽고 영상을 골라주는 것처럼요.
하지만 사실 그 뒤에는 거대한 추천 알고리즘이 있습니다. 오늘은 이 알고리즘이 어떤 원리로 작동하는지, 생활 속 비유와 함께 풀어보겠습니다. 출발~~
유튜브 알고리즘은 항상 두 가지 질문에 답하려 합니다.
- “이 사람에게 관련성 높은 영상은 무엇일까?”
- “이 영상을 틀었을 때 끝까지 만족하고 볼까?”
예를 들어, 내가 ‘고양이 영상’을 자주 본다면 고양이 관련 추천이 늘어납니다. 그런데 단순히 ‘고양이’라는 주제뿐 아니라, 내가 특히 길게 본 “고양이 밈” 같은 세부 패턴을 잡아서 비슷한 영상을 올려주죠.
유튜브 알고리즘은 크게 보면 두 단계로 작동합니다.
1)후보군 생성 (Candidate Generation)
- 수억 개의 영상 중에서 대략 수천 개를 1차 필터링
- 여기서 쓰였던 방식이 Collaborative Filtering(CF, 협업 필터링), 즉 “나와 비슷한 취향을 가진 사람들이 본 영상”을 참고하는 방식입니다.
→ 지금은 단순 CF 대신 딥러닝 기반 Embedding 모델 기반으로 후보군을 생성합니다.
2)랭킹 모델 (Ranking)
- 후보군을 점수화해서 상위 몇 십 개를 뽑아 정렬
- 이 단계에서 DNN, Gradient Boosted Decision Trees(GBDT), Transformer 기반 모델 같은 고도화된 모델을 이용해 “클릭할 확률, 시청 지속 시간, 만족도” 등을 고려해 최적의 순서를 매깁니다.
결국 유튜브의 추천 시스템 복잡한 모델들로 구성된 복합 엔진이라고 볼 수 있죠.
결국 유튜브 알고리즘은 단순히 '많이 본 영상 → 또 추천' 수준에서 머무는 게 아니라, '당신이 지금 당장 보고 싶어 할 만한 영상'을 빠르게 찾아내고, 그걸 끝까지 즐길 수 있을지까지 계산하는 정교한 시스템이에요.
즉, 방대한 영상 바다 속에서 먼저 가능성 있는 후보를 좁히고, 그중에서도 당신에게 가장 잘 맞는 순서를 정하는 게 핵심이죠.
다음 글에서는 '데이터를 멀리 본사 서버까지 보내지 않고, 집 앞 편의점처럼 가까운 곳에서 바로 처리하는 기술', 엣지 컴퓨팅에 대해 알아볼게요!
읽어주셔서 감사합니다.