장르라는 정형화된 카테고리 외에 영화 등 콘텐츠를 어떻게 분류할 것인가?
Content-cased filtering 방법으로 사용자들에게 최적의 영화를 추천해주는 Netflix.
콘텐츠의 Feature를 중심으로 한 약 76,000개의 micro tag 들..(장르, 지역과 같은 객관적 영화 정보들은 기본, gory와 violent를 구별하는 섬세한 형용사적 영화의 표현들, 등장인물의 도덕적 성향과 같은 정말 자잘한 영화의 특성들.)
넷플릭스의 성공비결은 기가 막힌 알고리즘 그 자체보다는 노가다성 방대한 데이터가 아닐런지?
관련글 http://miriamposner.com/dh101f14/?p=605
# 넷플릭스 "Alpha House" VS 아마존 "House of Cards"
- 데이터에 대한 관점의 차이
드라마 제작에 있어서 두 회사가 데이터를 접근 하는 관점의 차이
넷플릭스와 아마존은 분석 단계에서는 모두 동일하게 데이터에 의존했다.
그러나 아마존이 기획 및 종합 단계에 있어서도 데이터에 의존 했다면
넷플릭스는 최종 기획단계에서는 데이터 기반의 판단이 아닌 전문적 판단의 관점을 선택했다.
(우리가 넷플릭스를 데이터 과학의 승리라고 알고 있는것과는 조금 다르게 말이다.)
Sebastian Wernicke가 말하길 문제 해결을 위한 절차는 taking apart 하는 것과 putting back together againg하는 과정으로 구성되어 있는데 데이터나 데이터 분석은 전자에는 매우 효과적이지만 후자에는 그렇지 못하다는 것이다.
후자에 매우 탁월한 것은 데이터가 아닌 'brain', 즉 전문성('brain of an expert')이라는 것.
넷플릭스는 데이터와 전문성을 매우 적절하게 잘 활용했다.
수용자를 분석하기 위한 방법으로는 데이터를 사용했지만 그것을 하우스 오브 카드라는 드라마로 재구성하는 과정에서는 무조건적으로 데이터에 의존하기보다는 때로는 전문가의 직감을 따랐다.
아래는 관련 내용을 설명한 Sebastian Wernicke의 TED 영상