과학자와 마케터 모두를 위한 Tech Talk
모든 산업에서 고객의 생애가치주기, 즉 LTV (Life Time Value)를 계산하는 것은 매우 중요하다. LTV란 해당 비즈니스에서 고객 한명의 평생 가치를 환산한 수치로서, 고객 한명을 확보하기 위해 얼마의 예산까지 쓸 수 있는 지를 판단할 때 유용하게 활용된다. 보통 한번의 제품 판매 수익보다 큰 비용을 마케팅 비용으로 쓰는 것이 손해라고 볼 수도 있지만, 해당 비용으로 확보한 신규 고객이 평생 재구매 등을 통해 만들어갈 가치를 정확히 환산할 수 있다면, 한번의 제품 판매 수익보다 훨씬 큰 비용이더라도 기꺼이 첫구매자를 확보하기 위해 투자할 만한 비용으로 해석될 수 있다. 반대로 고객 한명을 확보하고 관리하기 위해 필요한 비용이 LTV보다 크다면, 이는 곧 지속적인 적자의 증가를 의미하는 것이 된다.
보통 단순하게는 과거의 히스토리 데이터를 통계적으로 분석하여 계산한 평균적인 LTV를 그대로 사용하기도 한다. 비즈니스 변화가 크지 않다면, 과거의 평균 LTV가 미래의 평균 LTV와 크게 차이나지 않을 것이므로, 신규 고객 확보에 필요한 예산 규모를 책정할 때 유용하게 활용할 수 있다. 하지만, 이미 존재하는 고객들을 지속적으로 유지하기 위해 투자할 마케팅 비용을 책정하기 위해서는, 평생 LTV중에 이미 기여한 과거 가치를 제외한, 앞으로의 미래 가치를 기준으로 투자를 해야한다. 게다가 이러한 기존 고객의 미래 가치는 개인마다 모두 다르기 때문에, 과거의 평균적인 LTV가 아닌, 각각의 고객 별로 미래의 LTV를 예측해야 한다. 이와 같이 고객의 LTV중에 현재까지 이미 기여한 과거의 LTV를 Historical LTV, 그리고 앞으로 기여할 남은 LTV를 Predictive LTV라고 한다.
이러한 미래의 개별 LTV를 예측하는 방법에는 크게 확률통계적 방법과 딥러닝과 같은 AI 방법이 주로 사용된다. 보통 비즈니스의 특징과 사용할 수 있는 데이터 특성에 따라 AI 방법이 더 잘 동작하거나 혹은 확률통계적 방법이 더 잘 동작하기도 한다. 일반적으로 고객의 구매 패턴이 일정하고, 사용할 수 있는 데이터 종류가 단순하다면 확률통계적 방법이 더 적합할 가능성이 높다.
이커머스의 예를 들어보자. 이커머스에서 가장 기본적인 데이터 소스는 구매 데이터이다. 언제, 몇개의 제품을 얼마나 구매했는 지 과거 데이터를 분석하여 패턴을 만들고, 각 개인별 구매 데이터가 이러한 패턴 내에서 어떤 위치에 해당하는 지를 분석하여 미래의 LTV를 예측해볼 수 있다. 이와 같이 확률통계적 접근에서는, 전체 고객에 대한 과거 데이터를 기반으로 일종의 구매 패턴을 확률 함수로 학습한 후, 특정 고객의 과거 데이터를 비교해 앞으로 남은 미래의 기대 구매 횟수와 기대 구매 금액을 예측함으로써 미래의 LTV를 얘측할 수 있다. 대표적인 모델로, 기대 구매 횟수를 예측하는 BG/NBD (Beta-Geometric/Negative Binomial Distribution) 모델과, 기대 구매 금액을 예측하는 Gamma-Gamma 모델이 있다. 만일 미래의 기대 구매 횟수가 0에 가깝다면 이는 이탈을 의미하는 것이므로, 미래의 이탈 가능성도 해당 모델을 통해 예측 가능하다.
그런데 이와 같은 확률통계적 접근 방법은, 같은 유형의 이벤트가 반복적으로 발생하여 패턴으로 표현될 수 있을 때 잘 동작한다. 이커머스 중 반복구매가 잦은 생필품, 뷰티 등이 이러한 접근 방법을 활용하기에 적합하다. 만일 반복 구매의 개념이 없거나 매우 적은 산업군의 경우라면 어떻게 LTV를 산정할 수 있을까.
예를 들어 통신사를 예를 들어보자. 통신 요금이나 가정용 인터넷 가입 등은 한번 구독 약정을 하면 일정기간 반복적으로 재약정 혹은 재구독 이벤트가 빈번하게 발생하는 유형이 아니기 때문에, 앞서 소개한 모델을 사용하기에 적절하지 않다. 이러한 산업군의 경우, 이커머스의 구매에 해당하는 가입/약정 등의 이벤트 뿐 아니라, 가족 결합 등 고객 상황을 표현할 수 있는 여러 정보들과 함께, 콘텐츠 소비나 로밍과 같은 부가 서비스의 활용, 앱이나 홈페이지에서의 고객 활동 등 다양한 정보를 이용해 미래의 가치나 이탈 가능성을 예측해야 한다. 간단한 예로, 이러한 산업군에서 이탈을 감지하는 가장 대표적인 지표는 위약금 조회 페이지를 방문했는 지 여부일 것이다. 이러한 산업군의 경우에는 다양한 속성의 데이터를 수치화하여 딥러닝과 같은 AI모델을 통해 학습 시킨 후 미래의 이탈이나 가치를 예측하는 것이 더 일반적이다. 보통, 데이터 속성들의 수 (데이터 과학에서 이를 차원 (Dimension)이라고 한다)가 매우 다양하고 많을 때, 확률통계적 접근보다는 머신리넝, AI 모델을 활용하게 된다. 통신사 뿐 아니라, 은행, 보험과 같은 금융, 구독 서비스 등 반복 구매의 개념이 없는 산업 대부분이 AI 모델을 사용해 고객의 미래 가치를 예측하고 있다.