brunch

You can make anything
by writing

C.S.Lewis

by Yuri Feb 11. 2022

별점 평가 시스템 VS 엄지척 평가 시스템

넷플릭스와 왓챠의 평가 시스템 비교

나는 영화를 보기 전에 왓챠피디아에서 영화의 예상 평점을 별점으로 확인해본 후 시청을 결정하며, 예상 평점을 신뢰한다. 하지만 콘텐츠 관련 글로벌 IT기업들은 별점 시스템을 버리고 있고, 대세는 '좋아요/싫어요'다. 유튜브는 2009년에 별점에서 엄지척으로 바꾸었고, 넷플릭스는 2017년에 바꾸었다.


콘텐츠 서비스들이 평점 시스템을 도입하는 근본적인 이유는 맞춤형 콘텐츠 추천을 통해 사용자들의 이탈을 방지하고 서비스 체류 시간 늘리고자 하는 것이다. 사용자 입장에서도 자신에게 맞는 콘텐츠를 제대로 추천해주면 브라우징 하는 시간을 단축시킬 수 있다. 평가 시스템은 보다 정확하게 사용자의 선호도를 분석해야 목적 달성이 가능해진다.




별점을 버리는 이유


많은 콘텐츠 서비스 플랫폼들이 별점 시스템을 버리는 정확한 데이터 수집이 어렵기 때문인데 그 이유는 아래와 같다.


1) 별점 시스템은 각 별점이 의미하는 바가 명확하지 않다.

좋아요/싫어요는 사용자가 콘텐츠를 마음에 들어 했는지, 아니었는지만 표시하면 되기 때문에 별점보다 척도가 명확하다. 넷플릭스가 별점을 버린 이유를 들 때 가장 자주 언급되는 예시는 한 사용자가 다큐멘터리는 대부분 5점을 주고, 코미디는 3점을 주고 있었지만, 정작 시청은 코미디를 더 많이 하는 것을 발견했다는 것이다.

실제로 왓챠피디아를 사용하면서 한 영화의 평점이 내가 예상한 것보다 너무 낮아서 댓글을 살펴보니 영화의 주연배우가 SNS에서 남성 우월적인 발언을 비추어 마음에 안 든다는 이유로 별점 테러를 당한 것이었다. 이처럼 별점은 매기는 기준이 개인마다 상이하기 때문에 콘텐츠 추천에 있어서 더 까다로워지는 부분이 있다.


2) 별점이 붙었을 때, 인지 편향으로 인해 데이터에 거품이 낀다.

넷플릭스의 경우 대중의 평점을 보여주지 않고, 유튜브는 작년부터 영상과 댓글의 '싫어요' 수를 숨기고 있다. 따라서 인지 편향의 문제는 별점만의 문제보다는 정보 노출의 문제가 크게 맞물려 있다. 다만, 좋아요/싫어요는 표현부터가 선호도에 따른 데이터로 보이는 반면, 별점은 점수화되어 있기 때문에 좀 더 객관화된 데이터처럼 보이는 측면이 있다. 이에 따라 타인이 매긴 점수에 영향을 더 많이 받는 것 같았다. 나 역시도 전체 평점에는 전혀 영향을 받지 않지만, 처음에 4점을 줬다가 유명한 평론가의 리뷰와 별점을 보고 3.5점으로 낮춘 경험이 있다.




넷플릭스의 좋아요/싫어요의 한계는?

   

1) "일치율"의 의미가 불명확하다.

넷플릭스는 콘텐츠를 보여줄 때 "N% 일치"라는 문구를 사용하고, 왓챠는 예상 별점과 평균 별점을 분리해서 표시한다. 개인적으로는 왓챠는 내가 평가를 할 때부터 별점 기반으로 했기 때문에 예상 평점이 4.3점이라고 하면 내가 어느 정도로 좋아할지 예측이 가능하다. 그에 반해 넷플릭스의 경우, 나는 영화를 퍼센티지로 평가한 적이 없기 때문에 60% 일치가 좋은 건지 나쁜 건지 알 수가 없다.

왓챠피디아에서는 더 나아가 "내가 좋아할 이유"라는 섹션이 있어서, 예상 평점이 높은 이유에 대해 유추할 수 있다. 나와 취향이 비슷한 친구가 높은 평점을 줘서, 내가 좋아한 어느 영화와 비슷해서, 내가 좋아하는 어떤 태그와 연관되어 있어서 추천되었는지 비교적 상세하게 나온다.

단적으로 말하자면 넷플릭스는 사용자 모르게 시스템이 알아서 해주는 부분이 많고, 왓챠는 내 활동이 어떻게 추천에 반영되었는지를 좀 더 친절하게 설명해준다. 추천된 이유가 궁금한 사용자에게는 넷플릭스가 주는 "N% 일치"라는 정보는 매우 부족하게 느껴진다.


2) 좋아요/싫어요 외의 선택지가 없어서 평가 참여율이 낮아질 수 있다.

넷플릭스 말로는 별점에서 좋아요/싫어요로 바꾸고 나서 사용자의 평가 참여율이 200% 올라갔다고 한다. 이 숫자를 보았을 때, 동양권 사용자들 데이터를 따로 빼놓고 봤을 때에도 200% 상승했는지 궁금해졌다. 동양권 사용자는 평점을 줄 때 서양권에 비해 극단적인 평가를 피한다는 연구들이 많이 나와있다. 나 역시 넷플릭스에서 좋아요/싫어요 평가를 할 때 확실하게 너무 좋거나 싫었던 영화 빼고는 평가를 안 했었고, 최근에는 영화 평가를 아예 안 하고 있다.



넷플릭스의 문제를 해결할 수 있는 방법은 뭘까?


1) 별점을 되살리고 각 별점마다 코멘트를 단다.

한 UX 디자이너가 알려준 "불편함"이라는 서비스에서 사용하는 방법인데, 각 평점에 설명을 달아 별점의 의미를 보다 명확하게 하는 방법이다. 이 방법을 사용하면 각 별점의 점수가 의미하는 바도 전체적으로 명확하게 맞출 수 있으면서 다양한 영화의 평가 방식도 보장해준다.


"불편함" 서비스의 별점 평가 시스템


2) 추천된 이유를 조금만 더 친절하게 설명해줘서 신뢰를 쌓아 시청을 유도한다.

넷플릭스의 퍼센트는 4가지 데이터를 토대로 매겨진다고 한다(넷플릭스 헬프센터): 사용자가 좋아하는 TV 프로그램 및 영화 장르, 사용자가 이전에 평가한 콘텐츠, 사용자의 시청 기록, 사용자와 취향이 비슷한 넷플릭스 회원의 평가. 모두 다 보여주는 것은 어려울 수 있지만 첫번째와 두번째까지는 왓챠처럼 보여줄 수 있을 것 같다. "사용자가 좋아하는 범죄물 장르입니다", "사용자가 좋아한 영화 'OOO'와 비슷합니다." 처럼 말이다.




각 나라의 문화 차이에 따른 UX에 관심이 많은 편인데, 이 별점 시스템 역시도 문화적인 차이가 적용되었을 수 있을 것 같다. 미국이 개인정보 수집에 대한 민감도가 우리나라보다 높기 때문에 회사에서 얼마나 많은 데이터를 갖고 있는지 드러내는 것이 조심스러웠을 수 있다. 또한 넷플릭스와 왓챠는 시작부터 다른 서비스(DVD 구독 서비스와 영화 평가 플랫폼) 때문에 추구하는 방향성이 다른 부분도 있다. 이러한 부분은 다음에 또 기회가 되면 정리해보려고 한다.


동양권과 서양권의 평점 차이 연구 출처: https://measuringu.com/scales-cultural-effects/

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari