brunch

You can make anything
by writing

C.S.Lewis

by Jayden Feb 16. 2021

알고리즘 기반 어트리뷰션 모델

알고리즘 기반 어트리뷰션 모델


마르코프 모델은 시간에 따른 상태의 변화를 나타내는 마르코프 연쇄(markov chain)를 기반으로 각 마케팅 채널에 대한 기여도를 계산하는 방식으로 2014년 Eva Anderl 등에 의해 고안(주3)되었다. 이는 과거와 현재 상태가 주어졌을 때 미래 상태에 대한 조건부 확률 분포가 과거 상태와 독립적으로 현재 상태에 의해서만 결정된다는 가정에 기반한다. 마르코프 모델 방식을 보다 쉽게 이해하기 위해 어떠한 마케팅 목표를 달성하기 위해 페이스북, 카카오, 네이버 채널을 운영하였다고 가정해보자. 고객들이 개별 채널들을 복합적으로 경험하고 최종 마케팅 목표 전환에 성공한 것을 확률로 계산하면 마르코프 그래프로 다음과 같이 표현할 수 있다.


그림 2. 마르코프 그래프 예시


카카오의 기여도는 3개의 채널의 확률론적 상호 작용을 통해 이루어진 마르코프 그래프에서 카카오가 전환에 아무것도 기여하지 못하게 제거된 상황을 가정하여 계산하게 된다. 만약 기존 상태에서의 전체 전환율이 20%였는데, 카카오로 상태가 이동된 경우 무조건 100% 전환에 실패한다고 할 때, 전체 전환율을 얼마로 줄어들게 혹은 늘어나게 될까? 만약 전환율이 20%에서 15%로 줄어들게 계산된다면 카카오의 기여 효과는 70%라고 판단할 수 있다. 이를 제거 효과(Removal Effect)라고 부른다.


생존 분석 모델은 2014년 IEEE International Conference on Data Mining 에서 공개된 Ya Zhang 등에 의해 제안된 방식(주4)으로 어떠한 현상이 발생하기까지에 걸리는 시간에 대해 분석하는 생존 분석의 방법론을 마케팅 활동에 대한 특정 전환이 발생하는 데 까지 걸리는 시간을 분석을 하는 것으로 대입하여 문제를 풀어 나간다. 이 방식은 조건부 확률 방식을 적용한 마르코프 모델과 마찬가지로 확률적으로 고객에게 특정 채널 접촉이 이루어졌을 때, 전환까지 그 효과가 유지되어 영향을 미치는 지에 대한 확률 모형을 계산하게 된다.


마지막으로 게임 이론 모델(주5)은 가장 최근에 주목받고 있는 방식으로, 내가 멀티 채널에 대한 마케팅 성과 분석을 진행할 때 실제로 주로 적용하는 방식이기도 하다. 게임 이론이(game theory)란 상호 의존적인 의사 결정에 관한 이론으로 개인 또는 기업이 어떠한 행위를 했을 때, 그 결과가 게임에서와 같이 자신 뿐만 아니라 다른 참가자의 행동에 의해서도 결정되는 상황에서 자신의 최대 이익에 부합하는 행동을 추구한다는 수학적 이론이다.


따라서 게임 이론은 참가자들이 상호 작용하면서 변화해가는 상황을 이해하는 데 도움을 주고, 그 상호작용이 어떻게 전개될 것인지, 매 순간 어떻게 행동하는 것이 더 이득이 되는지를 수학적으로 분석해 준다. 게임 이론 모델은 샤플리 값(Shapley Value)라고 하는 협조적 게임 이론 개념에 기반을 둔 알고리즘을 기반으로 마케팅 어트리뷰션 문제를 해결한다.


샤플리 값이란 노벨 경제상 수상자 Lloyd S. Shapley가 개발한 것(주6)으로 팀의 성과를 팀 구성원 간에 공정하게 배분하는 접근 방법이다. 개별 마케팅 접촉 채널/활동들은 고객을 상품 구매 전환이라는 목표를 달성하기 위해 모인 팀원들이라고 보고, 특정 팀원(마케팅 채널)이 팀에 포함되었을 때와 팀에 포함되지 않았을 때 팀의 성과를 비교, 분석하여 해당 팀원(마케팅 채널)이 성과에 얼마나 기여를 하는 지를 파악하는 방식이다. 이는 구글에서 제공하는 웹 로그 데이터 분석 도구인 구글애널리틱스에서 데이터 기반 기여 모델이라는 명칭으로 어트리뷰션을 제공할 때, 적용된 방법론이기도 하다. 샤플리 값 계산을 직관적으로 이해하기 위해 어떠한 목표를 달성하기 위해 마르코프 모델 예시 와 마찬가지로 페이스북 광고, 카카오 광고, 네이버 광고 3개의 마케팅 채널이 운영되고 가정해보자. 샤플리 밸류를 활용한 방식은 고객 접촉의 발생 순서를 고려하지 않고, 각 채널의 포함여부에 따른 영향도에 집중하기 때문에 이 3가지 마케팅 채널로 발생될 수 있는 고객 여정은 다음의 표에서와 같이 총 7가지이다.  


표 1. 샤플리 값 계산 예시


페이스북과 카카오 채널을 경험한 후 전환된 케이스를 보면, 총 30의 전환이 발생한 것을 볼 수 있다. 페이스북만으로 전환된 결과가 10이기 때문에서 페이스북과 카카오 채널을 경험한 케이스에 대해 카카오가 페이스북과 함께 고객에게 노출됨으로써 이 경우 카카오의 기여도는 20이라고 인정할 수 있다. 페이스북만으로는 10의 성과밖에 내지 못했을 것이기 때문이다. 같은 방식으로 페이스북의 기여도를 계산하면 30 (페이스북, 카카오) - 12 (카카오) = 8 (페이스북의 기여도) 이 나옴을 확인할 수 있다. 각 마케팅 여정 케이스별로 개별 채널별 기여도를 계산하고 이에 대한 최종 샤플리 값는 참여자 인원수에 따라 얼마나 기여했는지에 대한 평균값을 통해 산출할 수 있다. 페이스북 단일 케이스에 대해서는 10의 기여를 했고, 페이스북이 다른 1개 채널과 함께 상호작용이 일어났을 경우에는 (18+17)/2 = 17.5 만큼의 기여를, 페이스북이 다른 2개 채널과 함께 상호작용이 일어났을 경우에는 16 만큼의 기여를 했기 때문에 이 값의 평균을 구하면 (10+17.5+16)/3 = 14.5 가 나온다. 해당 예시에서 같은 방식으로 카카오, 네이버의 샤플리 밸류를 구해 비교해보면, 우리는 카카오가 가장 높은 전환 기여를 한 것을 확인할 수 있고, 이러한 결과에 따라 카카오 채널에 대한 마케팅 집행을 좀 더 높이는 의사결정을 진행할 수도 있을 것이다.


이렇듯 다양한 연구와 시도를 통해 마케터는 보다 정확한 고객 여정과 각 여정의 기여도를 파악할 수 있고, 이를 바탕으로 마케팅 여정을 최적화하는 작업을 보다 효과적이고 효율적으로 진행할 수 있게 된다. 




주3) Mapping the Customer Journey: A Graph-Based Framework for Online Attribution Modeling (출처: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2343077 )

주4) Multi-touch Attribution in Online Advertising with Survival Theory (출처: https://ieeexplore.ieee.org/document/7023386 )

주5) Attribution models and the Cooperative Game Theory (출처: https://econpapers.repec.org/paper/urvwpaper/2072_2f290758.htm )

주6) Notes on the n-Person Game -- II: The Value of an n-Person Game (출처: https://www.rand.org/content/dam/rand/pubs/research_memoranda/2008/RM670.pdf )


제이든입니다.

고객관계관리(CRM) 관련 업무를 해오고 있습니다. 현재는 카카오뱅크에서 데이터 분석을 기반으로 고객의 경험을 효과적으로 증대시키는 방법을 찾기 위해 고민하고 있습니다.

라이킷, 댓글, 공유하기 그리고 구독하기는 제가 이런 저런 글을 쓰는 데 큰 동기 부여가 됩니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari