배달앱 리뷰 변별력 문제로 살펴보는 기획과 정책의 차이
배달의민족이나 쿠팡이츠, 요기요와 같은 배달앱을 사용해본 적이 있는가?
물론 대부분의 독자들이 사용해본 경험이 있을 것이고 꽤 자주 사용해보았을 것이다.
그렇다면 한 가지 질문을 더 해보겠다.
이러한 배달앱들에 달린 리뷰를 얼마나 신뢰하는가?
아래 스크린샷은 배달의민족에서 '족발'을 검색했을 때 나타나는 매장들의 정보이다. 여기서 각 매장들의 리뷰 점수를 자세히 보자.
이 리뷰들을 보았을 때 어떠한 느낌이 드는가? 이 리뷰들의 변별력이 충분하다고 생각되는가?
대부분 그렇지 않다고 생각할 것이다. 배달앱들의 리뷰는 대부분 5점 체계로 관리되는데, 배민이고 쿠팡이츠고 (정말 관리가 안되는 일부 매장을 제외하면) 매장들은 대부분 거의 5점에 가까운 점수로 관리되고 있는 모습을 볼 수 잇다.
평균 별점이 3.2점인 매장과 4.8점인 매장이 있을 때 4.8점인 매장이 훨씬 더 맛있다고 직관적으로 인식될 것이다. 그러나 4.9점인 매장과 5.0점인 매장이 있을 때, 사용자 입장에서 둘 중 어느 매장이 더 맛있다고 판단할 수 있을 것인가?
즉 이런 배달앱들의 리뷰는 이미 변별력을 잃어버린지 오래라 볼 수 있다. 이러한 상황 속에서 고객들은 리뷰 점수는 '기본으로 깔고', 리뷰 숫자가 얼마나 많은지나 할인을 얼마나 많이 해주는지 등 다른 방법을 통해 매장을 선택한다. 즉 리뷰 점수는 본연의 기능을 하지 못하고 있다는 것이다.
앞서 말했듯 배달앱은 변별력이 거의 없이 대부분의 상당수의 매장이 5점에 가까운 문제를 가지고 있다. 흥미롭게도 이 문제가 거의 없으며 되려 이를 핵심 사용자 가치로 제공하하 있는 플랫폼이 있다. 바로 일본의 '타베로그'이다.
'타베로그(食べログ)'는 일본의 식당 리뷰 사이트이다. 사용자들은 타베로그를 통해 매장을 검색하고, 이용자들은 매장에 대한 리뷰를 남긴다. 다른 사용자들은 매장의 리뷰를 보면서 이 매장이 맛집인지 그저 그런 식당인지를 확인한다. 한국으로 치면 예전의 망고플레이트 정도가 비슷한 포지션의 사이트이겠다.
타베로그는 배달앱들과 동일하게 5점 만점의 별점 리뷰 시스템을 가지고 있다. 그러나 타베로그의 핵심 장점은 리뷰의 변별력이 매우 높다는 것이다.
타베로그의 공식 소개에 따르면 등록 매장의 별점별 분포는 다음과 같다고 한다.
3.5 미만: 전체의 97%
3.5-4.0: 전체의 3%
4.0 이상: 전체의 0.05%
3.5점 이상의 매장이 전체의 3%에 불과한 것을 보면 알 수 있듯, 매장 리뷰 별점의 변별력이 매우 높은 편이다. 심지어 3.5점 이상 매장은 웨이팅이나 예약 없이 워크인이 힘들다고 하며, 주요 맛집 정보지보다 훨씬 신뢰도가 높다고 평가받는다.
타베로그는 이와 같이 리뷰 변별력을 높이기 위해 여러 가지 기능을 가지고 있다. 대표적으로 유저가 남긴 별점을 단순히 평균내어 보여주는 것이 아니라 자체적인 산출식을 가지고 평가하고 있다. 또한 모든 유저의 별점을 동일하게 취급하지 않고, 직접 먹어보고 후기를 많이 남긴 유저들의 별점에 더 높은 가중치를 주기도 한다. 또한 도쿄와 같이 대도시에 있어 후기가 많이 쌓일 수밖에 없는 매장과 그렇지 않은 매장의 가중치도 다르게 주기도 한다고 한다.
이와 같이 타베로그는 리뷰 별점의 높은 신뢰도를 바탕으로 일본인들에게 많은 사랑을 받고 있으며, 일본인들의 국민 서비스로 활약하고 있다.
다시 한국의 배달앱 시장으로 돌아와보자.
사실 이러한 배달앱들의 리뷰 변별력 저하 문제는 어제오늘의 문제가 아니다. 배달앱들이 시장에 나타나기 시작한 초창기부터 이는 사용자 입장에서 고질적인 문제였다.
당신은 서비스 기획자, 혹은 PM/PO이다. 그렇다면 이 리뷰 변별력 문제에 대해서 어떻게 접근하겠는가?
1분 정도만 시간을 내어 잠깐 생각해보자.
리뷰 변별력 문제를 어떻게 개선할 수 있을까? 다양한 아이디어가 나올 수 있다.
타베로그처럼 리뷰의 산출식을 바꾼다.
단순히 리뷰 이벤트를 받기 위한 리뷰의 점수는 집계에서 제외한다
10자 미만으로 작성된 리뷰의 점수는 집계에서 제외한다
의미 없이 5점만 계속 남기는 사용자들의 리뷰의 점수는 집계에서 제외한다
다소 극단적이지만, 5점 리뷰를 남길 수 있는 횟수를 제한한다
개인적으로 모두 나쁘지 않은 아이디어라 생각하고, 배달앱 담당자라면 한 번쯤 매우 흥미롭게 검토해보았을 내용이었을 것이라 생각한다.
이 아이디어들은 모두 '리뷰 변별력을 개선하기 위해 어떻게 해야 하는가?'라는 질문에 대한 답변이다. 그리고 아마 많은 독자들이 비슷한 아이디어를 생각하지 않았을까 생각한다.
그러나 잠시 생각해보자.
우리가 풀어야 하는 문제가 '리뷰 변별력을 개선'해야 하는 것이 맞는가?
혼란스러울 수 있다.
배달앱 리뷰가 변별력이 없다는 것의 공감대는 이미 충분할 것이다. 그리고 사용자 입장에서 고통스러운 정도까지는 아니겠지만, 리뷰의 변별력이 높아지는 것은 충분히 좋고 임팩트 있는 변화일 것이다.
그럼에도 리뷰 변별력 개선 문제가 우리가 풀어야 하는 문제가 아니라면 무엇이란 말인가?
질문에 대해 답을 하기 전에, 배민이나 쿠팡이츠같은 배달앱의 입장으로 감정을 이입해보자.
배달앱은 대표적인 멀티사이드 마켓(양면시장, multisided market)이다. 배달앱 입장에서 고객은 주문을 통해 음식을 배달받는 최종 사용자(end user) 뿐 아니라, 배달 매장을 운영하는 사장님 역시 고객이다. 즉, 배달앱은 주문자 고객과 매장 고객을 동시에 가지는 멀티사이드 마켓이다.
즉 이 시장의 고객은 다음 2종류이다.
주문자 고객: 배달 주문을 시키는 일반 유저들
매장 고객: 배달 주문을 받는 매장 사장들
때문에 배달앱의 운영자라면 주문자 고객과 매장 고객의 니즈를 동시에 만족시켜야 하고, 양쪽의 니즈가 충돌할 경우 어느 한쪽의 니즈에 더 우선순위를 둘 수밖에 없다.
리뷰 변별력 문제는 양쪽의 니즈가 충돌하는 대표 케이스다.
예컨대 위에서 나온 아이디어를 통해 리뷰 변별력을 높여야 한다고 생각해보자. 프로젝트의 목표는 현재 평균이 약 4.8점 정도로 분포된 매장 리뷰 평균을 4.0점 정도로 낮추고 편차도 크게 만드는 것이다.
주문자 고객 입장에서는 환영할 만한 목표다. 맛없고 비싸기만 한 매장과, 맛있거나 가성비가 좋은 매장을 훨씬 더 직관적으로 구분할 수 있을 것이다. 프로젝트에 성공할 경우 주문자 고객 입장에서는 매우 큰 변화일 것이고, 배달앱에 대한 신뢰도가 크게 상승할 수 있는 좋은 기회일 것이다.
그러나 매장 고객 입장에서는 어떠한가? 내 매장의 리뷰 별점이 떨어지는 것을 반기는 사장은 아무도 없을 것이다. 낮은 리뷰를 받게 될 때 배달 주문은 큰 폭으로 감소하므로, 아예 리뷰를 후하게 관리해주는 다른 배달앱으로 이탈해버릴 수도 있다. 주문자 고객이 낮은 리뷰를 주었을 때 고객센터에 강성VOC들이 인입되어 운영 비용 역시 큰 폭으로 증가할 수도 있다. 또한 주문이 별점이 높은 특정 매장으로만 몰려 배달 지연이 많아지거나, 신규로 입점하는 매장에 분배되어야 할 배달 주문이 부족해질 수도 있다.
배달앱 관계자들의 여러 증언과, 현재의 운영 상황들을 볼 때 배달앱들은 주문자 고객 입장에서의 리뷰 변별력보다는 매장 고객들의 신규 입점 및 리텐션에 더 높은 우선순위를 두고 있는 것으로 강하게 추정된다. 좀 더 노골적으로 말하자면, 주문자 고객 입장에서의 리뷰 변별력 문제를 알고는 있으나 의도적으로 이를 개선하고 있지 않고 있다고 볼 수 있을 것이다.
다시 정리해보자.
배달앱 입장에서 매장 리뷰의 변별력이 없다는 것은 이미 익히 알려진 문제일 것이다. 그들이 이 문제를 알면서도 적극적인 개선을 하지 않고 있는 이유는, 매장 고객들을 입점시키고 유지시키는 것의 우선순위가 더 높다고 판단하고 있기 때문이다. 바꾸어 말하면 별점 리뷰가 매장 사장님들에게 냉혹한 방향으로 변별력이 생기게 되는 것은, 배달앱 입장에서 여러모로 원치 않는 결과로 이어질 가능성이 높을 것이다.
훌륭한 기획자나 PM/PO라면 이러한 케이스에 대해 더 본질적으로 접근할 수 있어야 한다. 이들이 던지는 질문은 '어떻게 하면 리뷰 변별력을 높일 수 있을까?'가 아니다.
이 케이스에서 던져야 할 진짜 질문은 '우리는 매장 고객들의 비즈니스 지표 하락을 감수하고, 주문자 고객의 리뷰 변별력을 높여야 하는가?'일 것이다. 즉 진짜 문제는 리뷰 변별력을 어떻게 높이는지 방법을 찾는 것 따위가 아니라, 매장 고객의 니즈(높은 별점 유지)와 주문자 고객의 니즈(리뷰 변별력 확보) 중 어느 것을 더 우선순위에 둘지를 결정하는 것이다.
즉 진짜 문제는 주문자 고객의 ㅅㅏ용
결론이 여기까지 도달했다면, 리뷰 변별력을 어떻게 확보할지는 매장 고객의 니즈와 주문자 고객의 니즈 중 어느 쪽을 더 우선순위에 둘지를 결정한 다음에서야 해결 가능한 문제라는 점을 쉽게 확인할 수 있다.
물론 매장 고객의 니즈에 더 높은 우선순위를 둔다고 해서, 주문자 고객의 니즈를 완전히 버려두어야 한다는 것은 아니다. 배달앱 케이스로 돌아가, 완전한 리뷰 변별력을 확보할 수는 없더라도 '낮은 별점만 보기' 등과 같은 기능을 통해 주문자 고객들의 최소한의 니즈를 충족시키려는 노력은 계속되어야 한다.
배달앱들이 리뷰 변별력 문제를 해결하고자 했다면 시간과 비용은 들지언정 해결 가능한 문제였을 것이다. 타베로그 케이스를 레퍼런스 삼아도 되고, 다른 해결책을 강구했을 수도 있다.
그럼에에 불구하고 리뷰 변별력 문제를 타베로그는 풀었고 배달앱은 안한 이유는, 그저 배달앱이 그렇게 하지 않기로 결정했기 때문이었을 것이다.
이 내용을 이해하는 것은 중요하다.
많은 서비스 기획자나 PM/PO들이 이와 같은 케이스를 단순히 특정 서비스의 기능을 개선하는 문제로 단순히 치환하고는 한다. 그러나 이는 기획의 문제가 아니다. 되려 정책의 문제다.
정책(policy)을 엄밀히 정의하기는 어렵지만, 대략 회사나 제품이 추구하고자 하는 방향을 의미한다.
배달앱은 다소 간의 리뷰 변별력 문제는 있겠으나, 매장 고객들의 입점 및 유지를 우선한다는 정책을 가지고 있는 것으로 보인다. 반면 타베로그는 리뷰 변별력을 통해, 신뢰할 수 있는 맛집 정보 플랫폼을 제공하고자 하는 정책을 가지고 있을 것이다.
이와 같이 두 케이스는 리뷰 변별력에 대해 상반된 정책을 가지고 있다. 때문에 타베로그는 리뷰 변별력을 높이기 위해 다양한 기획을 이어나갈 수 있을 것이고, 배달앱들은 리뷰 변별력 문제의 해결에 다소 소극적일 수밖에 없을 것이다.
즉, 기능 기획은 정책의 하위 속성에 가깝다. 때문에 만약 당신의 배달앱의 서비스 기획자나 PM/PO로서, 매장 리뷰 변별력 문제를 접한다면 이것이 회사나 제품의 정책에 얼라인(align)되어 있는지를 반드시 확인해야 한다.
예컨대 주문자 고객의 일부 불편함을 감수하고서라도 매장 고객을 위해 리뷰 변별력을 의도적으로 없애는 것이 회사의 정책인데, 리뷰 변별력을 획기적으로 높이는 기능 아이디어를 기획해간다면 좋지 못한 평가를 받을 것이 분명하다.
기능 기획의 의사결정은 비교적 작은 범위에서 일어난다.
제품에 존재하거나, 잠재적인 사용자들을 대상으로 가치를 어떻게 하면 제공할 수 있을지를 고민한다. 모두 그런 것은 아니지만 서비스 기획자나 PM/PO들은 그 간의 모인 정보를 바탕으로 의사결정을 비교적 쉽게 내릴 수 있다.(물론 비교적 쉽다는 것이다)
예컨대 결제 전환율을 올리기 위해 유저의 결제 정보를 미리 저장해둔다든지, 배달앱에서 다양한 매장 추천 로직을 테스트하는 것 등이다.
반면 정책을 변경하거나, 신규 정책을 수립하는 것은 의사결정의 범위가 크다.
정책을 변경/수립한다는 것은 넓은 범위의 유저들에게 영향을 주거나, 비즈니스에 중대한 영향을 가져올 가능성이 높다. 때문에 이는 제품팀이 자체적으로 결정할 수 없으며, 마케팅/영업/재무/법무 등 여러 부서와의 심도 있는 논의를 통한 결정이 필요하다.
정책 변경/수립의 예시는 다음과 같다.
쿠팡이 로켓배송을 통해 무료배송/반품과 새벽배송을 하기로 한 것
네이버페이가 네이버플러스를 통해 높은 적립률을 제공하기로 한 것
토스가 건당 500원 하던 송금 수수료를 무제한 무료로 변경한 것
토스뱅크가 각종 우대율 정책 없이, 무조건 연2% 이자를 매일 주기로 결정한 것
배달의민족이 food(음식) 배달을 넘어 커머스 배달까지 추가하기로 결정한 것
쿠팡의 로켓배송이 간편한 것은 서비스 기획자가 기획을 잘 했기 때문이 아니다. 오히려 회사가 '막대한 손실을 감수하고서라도 무료배송/반품과 새벽배송을 하기로 정책을 결정'했기 때문에 가능했던 것이다. 그에 따른 로켓배송의 다양한 기능 기획들은 무료배송/반품과 새벽배송이라는 핵심 정책 위에서 구현되었다.
마찬가지로 토스뱅크의 매일 이자받기 기능이 그토록 간편하고 편리한 UX를 제공할 수 있었던 것은 천재적인 UX 디자이너가 있었기 때문이 아니다. '아무 조건 없이 2% 이자를 매일 주자'라는 정책이 있었기 때문에 가능했을 것이다.(물론 그 과정에서 PO, Designer의 역할도 매우 컸을 것이다)
바꿔 말하면 아무리 천재적인 제품 메이커들이 있다 하더라도 회사가 무료배송/반품에 들어가는 단기적 재무적 손실을 용납할 수 없었다거나, 회원 수 증가를 위해 통장 가입시 우대이율을 미끼로 마케팅 수신 동의를 강요해야 하는 정책을 부수지 못한다면 그러한 혁신적인 사례들을 절대 만들어질 수 없었을 것이다.
서비스 기획자나 PM/PO는 커리어 초반에는 작은 규모의 제품들을 운영하거나 개발하면서, 제품을 개선하거나 기능을 기획하는 역할을 주로 맡는다. 그러다 보니 특정 문제를 해결하고자 할 때 자연스럽게 '어떻게 기능을 기획/개발해야 할까?'라는 질문부터 하게 되는 경향이 있다.
그러나 회사나 제품에 '진짜 임팩트'를 가져오기 위해서는 정책의 변경이나 수립이 필요하다. 일부 실험적인 기능을 기획하고 배포하는 것을 통해 파격을 가져올 수는 있겠으나, 대부분의 기능 기획은 이미 구성된 환경 내에서의 지엽적인 개선을 넘어서기는 힘들다.
당연한 얘기지만 정책을 변경/수립하는 것의 난이도는 단일의 제품 혹은 기능을 기획하는 것에 비해 훨씬 높다. 쿠팡이 로켓배송을 출시하기 위해서, 토스가 송금을 무료로 제공하기 위해서는 엄청난 분석과 모델링이 필요했을 것이며, 왜 그것을 해야 하는지 내부 관계자들과 투자자들을 설득해야 했을 것이다.
서비스 기획자나 PM/PO가 주니어에서 시니어로 넘어가는 것은 단순히 연차를 쌓아나가는 것만으로 이루어지지는 않는다. 이들이 '찐 시니어'로 진화하기 위해서는 단일의 기능/제품을 기획하고 개발하는 것을 넘어, 회사와 고객에게 big impact를 가져다줄 수 있는 핵심 정책을 수립하거나 변경할 수 있어야 한다.