brunch

You can make anything
by writing

C.S.Lewis

by 재주아빠 Dec 26. 2018

진짜 기여자는 누구인가?

기여 모델(attribution model)을 커머스 서비스에 적용해보기



2002년 월드컵 4강 진출의 공로자들

 

많은 사람들이 2002년 월드컵의 열기와 감동을 기억한다. 우리나라는 32개 참가국 중 특출 난 스타플레이어 없이 강력한 압박과 치밀한 조직력으로 준결승까지 진출하여 전 세계에 놀라움을 안겨주었다. 많은 전문가들은 놀라운 성과의 원인에 대해 다양한 해석과 보도를 쏟아냈다. 다들 히딩크 감독의 리더십과 전략을 1순위로 꼽았고, 주장 홍명보의 역할, 중요한 순간에 결과물을 만들어낸 안정환, 역대 월드컵 최장 출전시간을 기록하며 안정적인 수비를 보여준 송종국 등 여러 핵심 선수들이 기사에 오르내렸다. 23명의 월드컵 멤버들은 그 성과를 인정받아 병역을 면제받았고, 모든 선수와 코칭스태프에게 큰 상금도 주어졌다.

 

2002년 월드컵 독일과의 4강전 선발멤버

다시 2002년으로 돌아가, 히딩크 감독과 코칭스태프를 제외한 23명의 선수들 중 누가 가장 큰 공헌을 했다고 평가할 수 있을까? 아무래도 축구는 득점을 해야만 승점을 얻고 승리할 수 있으니, 스코어러가 가장 공로가 있다고 말할 수 있을까? 만약 득점만을 기준으로 공로를 따진다 하더라도 다음과 같은 질문을 제기할 수 있다.

 

 • 득점을 올린 선수에게 모든 공로를 돌릴 것인가?

 • 득점자와 어시스트를 기록한 선수에게 일정 비율을 나누어서 상금을 줄 것인가?

 • 득점에 이르기까지 마지막 10번의 패스를 주고받은 모든 선수들에게 상금을 나누어줄 것인가?

 • 10번의 패스를 나눈 선수들에게는 균등하게 나누어야 하는가? 무엇을 기준으로 차등 분배할 것인가?


2010년 유로대회 결승전 결승골 득점 과정. 누가 가장 많은 기여를 했을지 따져보자 (출처: 뉴욕타임스)


커머스 서비스에도 이와 유사한 이슈가 존재한다. 축구 경기보다 훨씬 복잡한 오픈마켓 쇼핑 경로 중, 어느 경로가 고객을 구매완료까지 이끄는가? 고객 경험을 개선하기 위해 어느 경로를 핵심 공로자로 간주하여 자원과 역량을 집중할 것인가?

 


커머스 상품을 탐색하는 900가지 쇼핑 경로


오픈마켓에서 상품을 조회할 수 구매할 수 있는 경로는 총 몇 가지일까? 로그 데이터는 서비스에 접속하는 모든 고객의 동선을 낱낱이 추적하고 있는데, 이에 따르면 고객들은 약 900가지 경로를 통해 오픈마켓에 등록된 상품을 조회할 수 있다. 여기에는 홈 화면의 베스트상품, 포털사이트 가격비교, 배너광고, 추천상품영역 등이 포함된다. 어느 경로에 통해 고객들이 쇼핑하는지 간단히 확인해보았다. 가장 많은 경우 검색결과의 일반상품을 클릭하여 구매를 하고, 네이버모바일 가격비교를 통해 상당히 많은 거래가 이루어졌다. 검색결과의 광고상품을 클릭하여 구매하는 경우는 세 번째 많은 쇼핑 동선으로 확인되었다.


그러나 상품을 접할 수 있는 경로가 900가지라는 것이 쇼핑 동선의 수와 일치하는 것은 아니다. 다수의 고객들은 검색, 가격비교, 최근 본 상품 등 여러 경로를 통해 관심상품을 수 차례 재확인하며 구매하기 때문이다. 우리 고객들의 구매패턴 중 40%는 2개 이상의 서로 다른 경로를 통해 동일한 상품을 조회하며, 2번 이상 재조회하는 패턴만 집계한다면 그 비율이 57%에 이른다.



경로에 대한 가치평가: 기여 모델(attribution model)


커머스 서비스에서 2가지 이상의 경로를 통해 상품을 들여다보고 최종적으로 구매한 경우, 어느 경로가 고객이 상품을 구매하는 데 결정적인 역할을 하였을까? 이 질문은 디지털 광고 분야에서 가장 활발하게 논의되는 주제로, 기여모델(attribution model)이라 불린다. 수많은 기업이 대규모 예산을 검색광고, 동영상, 소셜, 가격비교, 디스플레이 등에 쏟아붓고 있는데, 결국 어느 마케팅 채널에 어느 만큼의 비용을 투입할지 고민하는 것으로 귀결된다. 가장 적은 비용을 사용하고도 더 많은 고객을 끌어들이고 더 높은 매출을 달성할 수 있는 최적의 조합을 찾는 것이다.


일반적으로 규칙 기반(rule-based) 기여 모델이 잘 알려져 있다. 그중 Last-click 모델은 전 세계의 40%가량 기업이 채택하고 있는 대표적인 방법론으로, 상품을 접하게 된 여러 마케팅 채널 중 마지막 채널에 100% 기여도를 배분하는 모델이다. 이외에도 First-click, position-based 등 다양한 기여모델이 활용되고 있으나, 여전히 마케팅 비용을 집행하는 많은 의사결정자들은 어느 기여모델을 통해 채널을 평가하고, 그에 따라 마케팅 채널의 우선순위를 어디에 두어야 할지 확신을 갖지 못하고 있다.


광고집행담당자들은 1)마케팅 우선순위 선정, 2)마케팅채널별 기여도 측정 방법에 어려움을 겪고 있다. 출처: E-consultancy & Google Analytics



데이터 기반(data-driven) 기여모델 작동원리


이에 대해 수년 전 데이터과학자들은 다른 분야에서 널리 알려진 방법론을 응용하여 데이터에 기반한 해결책을 찾았다. 경제학에서 다루는 협조적 게임이론에 기반한 샤플리 값(Shapley value)과, 러시아 수학자 안드레이 마르코프가 고안한 마르코프 체인(Markov Chain)이 문제를 풀어나가는 실마리가 되었다.


샤플리 값은 공동의 성과물에 대해 각 참여자에게 기여도를 분배하는 방법론이다. 여러 마케팅 채널이 팀을 이루어 구매전환이라는 공동의 성과를 달성한 것으로 보고, 총 구매전환 수를 각 마케팅 채널의 기여 정도에 따라 분배하는 모델이다. 각 마케팅 채널이 구매전환 과정에 참여한 경우와 참여하지 않은 경우를 비교하여 기여 정도를 측정한다. 구글에서 제공하는 데이터 기반 기여모델의 기초이론으로 채택된 방법론이기도 하다.

Shapley Value를 간단히 설명할 수 있는 표


마르코프 체인은 특정 상태(state)에서 다른 상태로 전이하는 확률(transition probability)을 다루는 수학 이론이다. 이를 디지털광고에 접목하게 되면, 특정 상품에 대해 관심을 보인 시점으로부터 여러 마케팅 채널을 거쳐 구매전환에 이르기까지 모든 과정을 어떤 ‘상태’로 간주하여 각 마케팅 채널이 구매전환까지 연결하는 영향력을 측정할 수 있다. 이 방법론 역시 다수의 논문에서 심도 있게 다루고 있으며, 실제 디지털마케팅 산업 현장에서 비용 최적화에 적극 활용되고 있다.

Markov Chain에 기반한 attribution model을 설명하는 다이어그램



커머스 구매전환 기여자 찾기: 거래기여모델


거래기여모델이란 광고 분야에 활용하고 있는 기여모델을 커머스 쇼핑경로 평가에 적용한 것을 말한다. 기여모델을 응용한 거래기여모델은 특정 상품의 상품상세화면으로 직접 연결하는 900개 경로를 ‘경유지’로 정의하고, 그 특정 상품에 대해 구매 또는 이탈하는 시점으로부터 24시간 내에 거쳐온 '경유지’의 순차적인 목록을 ‘구매 여정’으로 간주한다.


데이터 기반 기여모델을 여러 각도에서 검토하여 최종적으로 마르코프 체인에 기반한 알고리즘을 적용하였다. 기여도를 도출하는 과정은 다음과 같다.

1. 어떤 임의의 경유지가 작동을 멈추고 모든 구매여정이 이탈하도록 조작한다. 예를 들어, 메인홈의 ‘베스트 상품’영역을 클릭하는 모든 고객이 쇼핑을 멈추고 앱을 닫는다고 가정하는 것이다.

2. 이런 방식의 조작이 구매전환율에 얼마나 영향을 미치는지 측정한다. 만약 특정 경유지가 중요한 거점이라면 구매전환율이 심각하게 떨어질 것이고, 그 반대의 경우라면 구매전환율에 별다른 타격이 없을 것이다.

3. 900개 모든 경유지에 대해 이 과정을 반복하여 각각의 기여도를 산정한다.

 

구매전환 기여도만으로 경유지의 가치를 쉽사리 단정할 수는 없다. 판매되는 상품마다 거래액이 다르고 순이익도 다르기 때문이다. 알고리즘에 따라 도출된 기여도를 거래액, 순이익에 곱하여 각 경유지의 금액 측면에서의 비중을 분석하여 거래기여모델에 포함시켰다.


그리고 고객의 유형에 따라 경유지의 가치는 어떻게 차이를 보이는지 분석하였다. LTV(Lifetime Value)와 기대수명에 따라 전체 구매여정을 12가지 그룹으로 나누었는데, 서비스의 장기적인 성과를 고려하여 선택한 프레임이다. LTV는 고객이 서비스에 머무르면서 일생동안 얼마만큼의 이익 또는 손실을 가져다줄 것인지 추정하는 개념이며, 기대수명은 고객이 얼마나 오랜 기간 동안 우리 서비스와 관계를 유지할 것인지를 예측하는 것을 뜻한다.

 


거래기여모델 분석결과


커머스 서비스에서 가장 높은 기여를 하는 경유지는 무엇일까? 서비스를 전체적으로 조망하기 위해 900개 경유지를 페이지 또는 그 이상의 단위로 묶어 기여도를 집계해보았다. ‘검색’은 커머스 전체 구매전환 중 가장 높은 기여를 하는 것으로 확인되었다. ‘검색’ 중 ‘일반상품’은 다른 광고상품영역을 제치고 더 높은 기여도를 차지하고 있다. ‘일반상품’이 검색결과 리스팅의 하단에 위치하고 있음에도 불구하고 기여도가 더 높다는 사실은 주목할 만하다. 서비스 외부에서 커머스 상품으로 직접 이어주는 채널들은 그 다음으로 높은 기여를 하고 있었고, 이 중 대부분은 ‘가격비교’가 담당하고 있다. 홈 화면에 배치된 17개 탭의 기여도 역시 적지 않으나, 이 중 ‘홈’탭과 ‘베스트상품’탭이 거의 대부분을 점유하고 있는 점은 아쉬운 대목이다.


거래액과 순이익 관점에서 다시 살펴보았다. 커머스의 거래액을 견인하는 가장 큰 경유지는 ‘가격비교’인 것으로 나타난다. ‘가격비교’의 거래액 기여도는 단순 구매전환 기여도에 비해 높고, 검색 전체의 거래액 기여도를 크게 앞선다. 하지만 순이익을 가져다주는 것은 '검색’이다. ‘가격비교’에 비해 고객획득비용이 절감되기 때문이다. ‘메인’은 구매전환 기여도에 비해 거래액과 순이익 기여도는 낮은 것으로 보이며, '셀러공간’은 순이익에 기여하며 강소(强小) 경유지로서 역할하고 있음을 알 수 있다.


거래액 기여도와 순이익 기여도가 격차를 보이는 이유는 고객 유형에 따라 쇼핑동선이 다르게 형성되기 때문이다. LTV와 기대수명이 모두 높은 충성고객들은 내부 검색서비스를 충실하게 이용하고 외부 가격비교 사이트를 경유하는 비율은 매우 낮다. 반면 LTV 최하등급(장기적으로 손실을 가져다줄 것으로 예상되는 고객)이면서 기대수명이 긴 고객들의 구매전환에는 ‘홈’을 적극 활용하고 있는데, 일시적으로 저렴한 가격에 등장하는 상품들을 구매하기 위해 지속적으로 방문하는 고객일 가능성이 높다.



거래기여모델의 향후 전망


커머스 거래기여모델을 시도한 이유는 복잡한 오픈마켓 쇼핑동선의 가치를 하나의 지표로 요약하여 서비스 구조를 진단하고 고객 경험을 개선하기 위함이다. 그런 의미에서 각 서비스 요소들의 중요도를 데이터에 기반하여 하나의 숫자로 도출한 이번 분석은, 우선순위를 설정하고 서비스를 개선하는 출발점이 될 수 있다.


반대로, 데이터 기반 기여모델을 통해 얻은 분석 결과는 보는 관점에 따라 특별하지 않을 수 있다. 앞서 커머스 고객들이 서비스 내부검색과 외부검색(가격비교) 두 개의 큰 동선을 통해 쇼핑하고 있다는 점을 확인했다. 이는 이미 십 수년 전 구글이 인터넷 유저들의 검색경험을 크게 진전시킨 결과의 연장선으로도 볼 수 있다. 오픈마켓 뿐 만 아니라 대부분의 웹서비스에서 검색은 절대적인 위상을 차지한다. 마케팅 채널 중에서도 검색엔진광고가 가격도 비싸고 효과도 좋다. 이와 대조적으로 거래기여모델에서도 카테고리 탐색은 기여도가 높지 않았다. 디렉토리 방식으로 사이트검색을 제공하던 옛날 옛적의 야후가 떠오르는 대목이다.

 

하지만 특별하지 않아 보이는 분석 결과를 적극적으로 해석하여 앞으로 더 나은 검색 경험을 제공하기 위해 할 수 있는 일은 없을까? 검색결과에 노출하는 광고상품이 구체적으로 어느 만큼의 구매영향도가 가진다는 점을 확인했지만, 이 숫자만으로 서비스 품질을 개선하기는 쉽지 않다. 좀 더 들어가서, 어떤 검색어가 구매에 어느 만큼의 영향을 미치는지 정량적으로 알 수 있다면, 검색어를 입력하는 고객과 광고영역을 구매하는 셀러 양자에게 높은 서비스 만족도를 제공할 수 있을 것이다. 이는 거래기여모델이 발전할 수 있는 방향 중 하나이다.


덧붙여, 서비스 내외부 경유지들의 기여도에 대해 지속적으로 추적하는 것은 반드시 필요하다. 위에서 소개된 각 경유지의 기여도는 5일 동안의 로그 데이터를 대상으로 살펴본 것으로 특정 시점의 단층 촬영에 불과하다. 고객의 유형에 따라 기여도가 편차를 보이는 것과 마찬가지로, 측정하는 시기에 따라 얼마든지 변화할 수 있다.


(사보에 투고한 내용 중 서비스 이름과 일부 민감한 숫자를 제외하고 작성하였습니다)


매거진의 이전글 좀 더 나은 데이터시각화
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari