넷플릭스의 완벽한 추천은 무한 수동 작업에서 나온다
넷플릭스를 볼 때마다 입금 알림이 뜨면 얼마나 좋을까요?
N잡러의 시대, 많은 이들이 부업을 찾고 있습니다. 집에서 넷플릭스를 보며 돈을 버는 부업이 있다면 누구든 하고 싶지 않을까요? 쉽고, 재미있고, 돈도 버는 일석삼조의 효과를 누릴 수 있으니까요.
거짓말 같지만 2018년까지 돈을 받고 넷플릭스를 보는 사람들이 있었습니다.
물론 보기만 한 것은 아닙니다. 콘텐츠의 메타 데이터를 "태깅(tagging)"하는 일을 했습니다. 메타 데이터란 콘텐츠의 제목과 출연진 같은 기본 정보부터 "로맨스", "성장 드라마"와 같은 콘텐츠의 특성까지 포함합니다. 콘텐츠를 시청하고 관련된 메타 데이터를 만드는 일을 "태깅"으로 일컫습니다. 사람들이 수동으로 "태깅"한 메타 데이터는 넷플릭스의 추천과 검색에 활용됩니다.
하지만 태깅이 즐겁기만 한 일은 아닙니다. 태거(tagger)들의 실제 인터뷰를 기반으로 태깅 업무의 실체를 알아봤습니다.
"우리는 사서와 같은 일을 합니다. 콘텐츠를 정확하게 분류해야 하니까요. 태거는 콘텐츠에 대한 심도 있는 이해가 필요합니다. 예를 들어, 초능력 분야의 콘텐츠도 하나가 아니에요. 좀비, 마녀, 용, 식인종, 미친 과학자, 변종, 악마에 대한 콘텐츠까지도 존재한다니까요."
태깅 팀은 30명으로 구성되어있습니다. 30인의 태거들은 넷플릭스의 영화와 드라마를 시청하고 제작연도, 언어, 감독, 출연진, 비속어와 성관계 씬의 빈도까지 수동으로 입력합니다.
태거들의 가장 중요한 업무는 콘텐츠의 영혼이라고 할 수 있는 "주관적인 태그"를 만드는 것입니다. "주관적인 태그"는 영상 인식 AI는 할 수 없는, 인간만 만들 수 있는 태그입니다. 예를 들어, AI는 영화가 해피 엔딩으로 끝났는지, 주인공의 성격이 비도덕적인지까지 알 수 없습니다.
이탈리아 영화 박사 과정을 졸업한 세리벨리 씨는 페이스북으로 넷플릭스의 태거 채용 공고를 발견했습니다. 원래 하던 촬영 일을 하면서 재택으로 태거로 활동했습니다. 업무 시간은 정해져 있지 않고 마감 기한만 맞추면 되니 부업으로 하기 딱이었습니다. 세리벨리 씨는 포르투갈어의 브라질 콘텐츠부터 스페인어로 된 아르헨티나, 칠레, 멕시코 콘텐츠까지도 태깅했습니다.
엔터테인먼트 산업에 밝고, TV 프로그램과 영화를 카테고리 별로 분류할 수 있어야 합니다.
콘텐츠의 복잡 미묘한 뉘앙스를 구체적으로 분류하고 묘사해야 합니다.
넷플릭스를 일주일에 20시간 이상 시청해야 합니다.
영화, TV 산업에 종사했거나 전공자를 우대합니다.
영어 외 제2 외국어 능숙하게 사용해야 합니다.
작업할 콘텐츠를 스스로 정할 수 없습니다. 시청자로는 절대 보지 않을 콘텐츠까지 몇십 시간 시청하고 분석하는 것은 고역입니다. 범죄 드라마를 싫어하는 사람도 60시간 동안 멕시코 암살자에 관한 드라마를 시청해야 합니다.
화면을 너무 오래 보고 있으면 몸이 힘듭니다. 눈도 아프고요. 특히, "다음회차 바로보기" 버튼을 추가하는 기계적인 업무를 할 때 힘이 듭니다.
그리고 태깅은 대충 할 수 없습니다. 한 번은 콘텐츠에 욕설이 나온다는 것을 태그하지 않았다가 경고를 받은 적이 있습니다. 넷플릭스는 태깅의 질을 지속적으로 평가합니다.
현재 넷플릭스의 태거는 사무실에서 일하는 30명으로 구성된 것으로 보입니다. 이들 30인은 36페이지나 되는 태깅 정책 자료를 교육받고, 콘텐츠를 시청한 후 자료에 맞게 태깅을 합니다. 태거가 만들어낸 메타 태그는 몇 개나 되는지 알아볼까요?
태그는 1,000개 이상, 태그를 조합하여 만든 마이크로 장르는 7만 6,987개입니다.
예를 들어, 위 그림에서 "평론가 호평! 서스펜스, 미국, TV 드라마"는 마이크로 장르입니다. 이 마이크로 장르는 "평론가 호평", "서스펜스", "미국", "TV 드라마"라는 네 가지 태그로 구성됐습니다. 그리고 위 그림에서 "브레이킹 배드", "워킹 데드"가 추천될 수 있었던 것은 이들 콘텐츠에 해당 태그가 달려있기 때문입니다.
위 그림은 태거들의 인터뷰를 기반으로 만든 "기묘한 이야기"의 태깅 사례입니다. 콘텐츠의 장르와 톤에서부터 인물의 성격과 도덕 수준까지도 태깅합니다.
하지만 실제 태그가 세분화된 수준은 상상 이상입니다. 넷플릭스는 몇 가지 태그는 5점 척도로 평가하게 합니다. 예를 들어, 콘텐츠가 로맨스인지에 대한 여부뿐만 아니라 콘텐츠가 로맨틱한 정도를 1~5점 척도로 매깁니다.
넷플릭스의 메타 태그 체계를 더 자세하게 설명하기 위해, 넷플릭스의 태그 유형을 10개 카테고리로 분류한 사례를 소개합니다.
"The Atlantic"의 기자 ALEXIS C. MADRIGAL는 넷플릭스의 마이크로 장르를 모두 크롤링했습니다. 넷플릭스의 마이크로 장르 문법과 구성 요소를 분석한 후, 10개의 카테고리와 242개의 태그가 있는 것으로 파악했습니다. ('14년 기준)
<카테고리(태그)>
1. 지역(미국, 유럽...)
2. 형용사(잔인한, 감성적인...)
3. 장르(공상과학, 로맨스...)
4. 설명(실화 기반, 책 기반...)
5. 지역 (유럽 배경, 아시아 배경...)
6. 시대 (1980년대, 1970년대...)
7. 콘텐츠 주제 (고양이, 결혼, 커플...)
8. 시청자 나이대 (키즈, 8~10세, 10~12세...)
9. 기타 (강한 여성 주연, 로맨스광들을 위해...)
10. 주연 (~가 출연하는, ~가 만든...)
더 자세한 태그 리스트가 궁금하다면: https://docs.google.com/spreadsheets/d/1m9AX-m_t3KFRVteH-DlIyPD2xMJcVJREfb6IBFsru1s/edit#gid=0
현재는 1,000개 이상의 태그가 존재해, '14년도 대비 약 5배 이상의 태그가 만들어진 것으로 보입니다. 우리나라 사용자에게 추천되는 마이크로 장르의 다양성이 떨어지지만, (태그 유형의 개수가 적을 것입니다) 해외에는 아래와 같은 특이한 마이크로 장르도 추천된다고 합니다.
<특이한 마이크로 장르 예시>
"느낌이 좋은 말하는 동물 애니메이션"
"뇌와 관련된 해외 공포 영화"
"일본 스포츠 영화"
"로맨틱한 중국 범죄 영화"
"윌리엄 하트넬이 나오는 시간 여행 영화"
"어둡고 서스펜스가 넘치는 갱스터 드라마"
넷플릭스는 사용자의 시청 이력과 콘텐츠의 마이크로 장르를 조합해 취향 그룹을 만듭니다. 2019년 기준으로 2,000개 이상의 취향 그룹이 있습니다. 모든 사용자를 2,000개의 취향 그룹 별로 분류하고, 그들의 취향에 맞는 콘텐츠를 추천합니다.
넷플릭스 태거들이 해야 하는 일을 정리해볼까요?
36페이지의 태깅 정책 자료 숙지하기
도입부 건너뛰기, 다음회차 바로보기 지점 지정
적어도 242개의 메타 태깅
주요 인물의 성별, 나이, 직업, 성격 태깅
"주관적인 태그" 만들기 (주인공의 성격부터 해피 엔딩인지 여부까지)
요약하자면, 태깅은 매우 노동 집약적인 업무이므로 결코 즐겁지만은 않을 것입니다.
넷플릭스는 무한 수동 작업으로 기술 경쟁력을 이뤄냈습니다. 수동 작업이 추천의 핵심이라니 아이러니합니다. 물론 알고리즘도 중요하지만, 넷플릭스의 추천 기술이 차별화될 수 있던 것은 세세한 태그 덕분입니다.
넷플릭스의 태깅은 누구나 생각은 하지만 엄두를 못 내는 작업입니다. 남들은 돈과 시간이 아까워 태깅을 자동화할 방법을 연구하는 동안 (혹은 엄두도 못 낼 동안) 인적 자본과 수동 작업에 어마어마한 돈을 투자한 무모함이 돋보입니다. 자본과 실행력의 승리라고 해두겠습니다.
<같이 읽으면 좋은 글>
출처:
https://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/
https://www.tomsguide.com/features/netflix-tagger
https://www.fastcompany.com/40547557/how-i-got-my-dream-job-of-getting-paid-to-watch-netflix
넷플릭스 인사이트 - 넷플릭스는 어떻게 파괴적 혁신의 상징이 되었나?, (이호수, 2020)