구글 LightweightMMM , 메타 로빈 장점과 한계 그리고 보완책
최근 마케팅에서 "마케팅믹스 모델(MMM)"이란 단어가 많이 보여 호기심이 생겼다. 실제로 어떻게 분석을 한다는 건 지, 진짜 효과적인 건 지 등등. 이런 나의 호기심을 충족시키고자 이 글을 쓰게 되었다.
[글 구성]
-마케팅믹스 모델링이란?
-메타와 구글 마케팅믹스 모델링, 뭐가 다른가?
-메타 마케팅믹스 모델링 "Robyn" 활용하여 분석해 보기(데이터 전처리에서 결과 분석까지)
-보완책 SHAP VALUE
"마케팅믹스 모델링(MMM)"이 뭔가요?
마케팅믹스 모델링은 변수 간 상관관계를 파악하여 앞으로를 예측해 주는 분석방법이다. 쉽게 예를 들면 매체별 데이터(노출, 클릭, CTR, ROAS, 지출비용 등)와 그 외 데이터(시즌 이슈 데이터, 프로모션 비용 데이터 등)를 넣으면 각 상관관계 확인과 함께 각 매체별 영향도를 판단할 수 있다. 이를 참고하여 각 매체에 예산 배분을 하는 것이다.
마케팅믹스 모델링은 "머신러닝 기반+시계열+회귀 분석"의 통계적 분석 방법인데 쉽게 말해 기계가 과거 특정 기간 데이터들의 패턴 분석을 통해 앞으로를 예측하는 것이다.
※회귀 분석/시계열 분석 관련 자세한 내용은 >이곳<
사실 마케팅믹스 모델링은 1960년대부터 존재했던 모델이다. 쿠키 기반 유저 행동데이터에 대한 정확한 측정이 가능해짐에 따라 마케팅에서 쓰이지 않게 되었을 뿐이다. 다만 최근에 마케팅믹스 모델링이 다시 부상하게 된 것은 2019년 마케팅에 들이닥친 "개인정보보호법" 때문이다. 이는 쿠키 이용 불가, 애플의 ATT 정책(앱이 사용자의 IDFA(광고주 식별자)로 사용자/기기를 트래킹 하려면 팝업창을 통해 사용자 동의를 받아야 하는 정책)으로 이어졌고 유저 행동데이터는 물론 각 매체별 광고 기여도 확인도 어려워졌다. 매체별 효율적인 예산 배분을 위해 필수인 광고 기여도 확인이 어려워지자 그 대안으로 마케팅믹스 모델링이 급부상하게 된 것이다.
구글과 메타 마케팅믹스 모델링, 뭐가 다른가
마케팅믹스 모델링은 대표적으로 메타의 Robyn, 구글의 LightweightMMM이 있다. 두 마케팅믹스 모델링을 잘 비교한 글이 있어 참고하여 일단 표로 정리했는데... 데이터 사이언티스트정도 가 돼야 이해할 수 있을 듯하다.
※구글/메타 비교에 대한 자세한 내용은 >이곳<
※메타 패키지에 대한 자세한 내용은 >이곳<
[구글vs메타 마케팅믹스 모델링 비교]
자, 이제 마케터의 관점에서 설명해 보겠다.
구글과 메타 모두 위에서 설명했듯 "머신러닝 기반+시계열+회귀 분석"인 통계적 분석 방법을 제공한다. 단! 제공하는 패키지 내용이 다를 뿐이다. 쉽게 말해서 회귀 분석할 수 있는 모델링이 여러 가지인데 기존에 있던 모델링 or 자체 구축한 모델링을 각자 방식으로 조합을 한 것이다. "나는 A+C+D 조합으로 패키지를 만들었어, 나는 A+D+F 조합으로 패키지를 만들었어"와 같다.
메타 마케팅믹스 모델링(이하 MMM)은 "전문성"을 구글 MMM은 "확장성"을 중요하게 고려한 것으로 보인다.
메타 MMM은 (현재는 파이썬까지 지원하지만) 처음에 R 기반 언어로 시작했다. R은 분석가들이 통계 분석용으로 쓰는 언어다. 통계분석에 좀 더 진심인 느낌이랄까..? 메타 MMM 패키지는 복잡한 데이터에서도 정확도를 높이도록 구성되어 있다.(A가 제대로 수행되지 않을 때 A'가, 비즈니스 오류 발생 시 B가 대응하도록 설계되어 있다.) 그래서 메타 MMM은 구글 MMM대비 계산 속도가 느린 편이라고 한다. 다만 분석 과정 중 수동으로 조정 가능한 옵션이 있다는 건 이런 상황들을 커버할 수 있는 숙련된 데이터 사이언티스트가 필요하다는 뜻이기도 하다.
회사 내 데이터팀이 갖춰쳐있고 활용할 수 있는 데이터가 방대하다면 메타 MMM을 쓰는 것이 나을 듯하다. 그러나 만약 회사에서 MMM 사용하라는 지시가 떨어졌는데 데이터팀이 없어 담당할 사람도 없고 데이터 양도 방대하지 않은 편이라면 메타 MMM을 도입한 대행사의 도움을 받거나 솔루션 서비스(예: AB180 자체 구축한 MMM 솔루션)를 이용하는 게 낫다고 본다.
데이터로 직접 마케팅믹스 모델링을 짜보자
마케팅믹스 모델링에 대한 설명은 이 정도면 충분한 것 같고. 다시 말하자면 나는 이 마케팅믹스 모델링이 어떻게 생겨먹은 것인 지 궁금했다. 소문은 무성한데 실체가 없는 느낌이랄까. 아니 뭐 고도화된 방식이란 거 알겠는데 이게 마케터에게 얼마나 유용한 정보를 줄 것이냐도 궁금했다.
결론 먼저 말하자면 "아직 갈 길이 먼 것 같고 투입된 시간+인적 비용대비 얼마나 유의미한 정보를 얻을 수 있을지 의문이 든다."
지금부터 왜 이런 결론을 내렸는지 "마케터 관점"에서 이유를 설명하겠다.
일단!
실제로 내가 마케팅믹스 모델링을 활용해 분석을 하게 되었다 가정하겠다.
(메타 Github에서 제공하는 예시 데이터와 파이썬 코드를 참고하였습니다. >링크< )
[분석 내용]
1.목적: 매체별 효율적 예산 분배
2.솔루션: 메타 마케팅믹스 모델 "Robyn"
우선 분석을 위해 데이터 전처리를 진행할 것이다.
메타에서 예시로 제시한 로우데이터는 크게 2가지다.
1. 매체별 성과데이터
매체별 성과데이터는 위 형식을 맞춰야 한다.
매체에서 일별 데이터를 추출하면 보통 가로로 나오는데 그걸 저렇게 세로 형식(칼럼)으로 정리하는 작업이 필요하다. 메타_노출수, 메타_클릭수, 메타_지출비용 이렇게 각각 컬럼으로 지정해야 되는 것이다.
2. 계절/시즌 데이터
이건 시즌성을 반영하기 위한 데이터다.
베이지안 오픈소스 라이브러리인 "Prophet"을 활용하여 메타에서 제공하는 데이터다. 59개국의 휴일, 국가별 이벤트 데이터가 들어가 있다고 한다. (한국 데이터도 들어가 있을듯..) 만약 원하는 이벤트 데이터가 없다면 수동으로 넣으면 된다.
다만 회사에서 진행한 특별한 프로모션 기간이 있거나 특정 기간 돈을 썼다거나.. 이런 걸 반영하고자 한다면 위 데이터에는 "기간"을 넣을 수가 없어서 별도 데이터로 넣어야 할 것 같다.
**
이쯤 되니 그런 생각이 든다.
"경쟁사가 돈을 얼마나 쓰느냐도 영향을 미칠 텐데?"
위에 "매체별 성과데이터"라는 메타 예시 데이터에 경쟁사 데이터가 들어가 있긴 하다.(competitor_sales_data 항목) 그런데 현실에서 경쟁사 데이터를 저렇게 정확히 얻을 수 있을까....? 지인이 경쟁사에 근무하지 않는 이상... 다만 이런 경우가 있다.
에어브릿지, 브레이즈 서비스를 제공하는 AB180 또한 자사 마케팅믹스 모델링을 구축했는데 AB180에서 작성한 MMM 기사에서 아래와 같이 같은 업종 광고 전략 경험을 활용할 수 있다고 이야기한다.
그러나 AB180에서 제공하는 모델링이 메타/구글 대비 얼마나 고도화되어 있을지 알 수 없으며 AB180 MMM은 "패키지 형태"가 아닌 "솔루션 서비스"로 제공하기에 구글/메타와 같이 원하는 대로 커스터마이징 하는 건 어렵다.(내부 데이터팀이 따로 없다면 이용해 볼 만할 수도...)
[AB180 MMM 스튜디오 시뮬레이터 대시보드 이미지]
복잡한 과정은 제외하고
그래서 어떤 결과를 볼 수 있는지 넘어가겠다.
아래는 메타에서 예시로 제공한 결과 그래프들이다.
①첫 번째 줄 왼쪽 폭포형 그래프 - "각 채널별 수익 기여도"를 파악할 수 있다.(전체 매출의 ~% 비중)
②첫 번째 줄 오른쪽 그래프 - 시간 경과에 따라 수익을 예측함에 있어 실제값과 응답값의 차이를 비교한다. 모델링의 신뢰도를 파악할 수 있다.
③두 번째 줄 왼쪽 그래프 - 각 매체별 지출 비중, 성과 비중, ROI를 한 번에 볼 수 있다.
④두 번째 줄 오른쪽 그래프 - 각 매체별 결과데이터의 신뢰도를 판단한다. 1)네모상자가 "0"과 멀수록 신뢰도가 높다고 볼 수 있다. 2)네모를 가로지르는 수평선은 신뢰구간을 뜻한다. "0"을 지나지 않아야 유의미하다 볼 수 있으며 수평선 길이가 짧을수록 정밀하다는 의미이다. 3)네모상자가 클수록 표본이 큰 것이고 가중치가 부여된다.
⑤세 번째 줄 왼쪽 그래프 - 각 채널의 평균 하락율(%)을 나타낸다. 하락율(%)이 높을수록 광고 노출 후 성과가 나오는데 더 많은 시간이 걸린다는 것이다.(이 경우 광고비를 더 지출해도 성과 상승률은 더딘 "포화" 상태일 가능성이 높다.)
⑥세 번째 줄 오른쪽 그래프 - 열심히 구글링 해봤는데 자세히 나와있는 게 없었다ㅠ 다만 "carryover"가 시간이 지났을 때 효과를 의미하는 거라 추측해 보면 "carryover" 수치가 높으면 결과가 급격하게 바뀔 가능성이 높다고 판단할 수 있을 것 같다. 위 그래프를 보고 2가지 결과를 예상하면 1)광고가 지금은 최적의 상황이지만 '포화' 상태로 급변할 가능성이 높거나 2)변수 데이터가 이상해서 결과 데이터가 이상하게 나오거나 둘 중 하나일 것이다.
⑦네 번째 줄 왼쪽 그래프 - 각 매체의 광고 지출이 최적 인 지 포화 상태에 가까워지고 있는 지를 알 수 있다. 곡선이 완만해질수록 포화 상태에 이르렀다고 볼 수 있다.
⑧네 번째 줄 오른쪽 그래프 - "이상 여부"를 판단할 수 있다. 그래프가 선형과 비슷한 형태가 아닌 구부러진 곡선 형태가 나타난다면 "오차"가 발생된 것이다. (그래프가 완만하게 0에 가까울수록 좋다.) "코로나"같은 외부 이슈가 원인일 수 있고.. 통계 분석면에서 "변수 변환"을 해야 한다는데 어려우니 패스하겠다.
②, ④, ⑥, ⑧ 그래프는 데이터 사이언티스트에게 유의미한 그래프들이다.
나머지 그래프를 통해서는 2가지를 확인할 수 있다.
1)어떤 매체가 수익 기여도가 좋았는지, ROI가 좋았는지
2)각 매체가 광고 최적의 상태인 지, 포화 상태인 지
결국 MMM을 통해 얻은 이 2가지 내용으로 마케터는 매체별 예산 배분을 어떻게 할지 판단할 수 있는 것이다.
생각보다 얻을 수 있는 결과가 부실해 보이는 건 기분 탓일까..?
매체별 기여도 파악이 어려워짐에 따라 MMM이 하나의 대안이긴 하지만... 막상 이 데이터로 윗선을 보고하려니 '할 수 있을까?'란 걱정이 든다. 아니..'이게 먹힐까?'란 생각이 들었다는 게 맞을까.
매체별 수익 비중이나 ROI는 MMM이 아니고도 할 수 있다.(아니 이미 해오고 있다.) 그나마 광고가 포화 상태인 지를 확인하는 게 의미 있을 것 같은데.. 오랜 기간 광고에 돈을 많이 쓴 회사 대부분 "포화 상태"일 가능성이 높고 그걸 인지하고 있을 가능성도 매우 높다.
이 데이터로 예산 판단을 내렸을 때 얼마나 효과가 있을 지도 의문이다. 물론 참고용으로만 쓸 수도 있다. 근데 참고용으로 쓸 결과 데이터를 만드는데 드는 시간 비용과 인적 비용을 생각하면...그리 효율적이지 않아 보인다.
작년에 회귀분석을 활용해 이탈 예측 분석을 배웠다.보험사 데이터로 진행했는데 데이터 전처리부터 결과를 보기까지 꽤... 공수가 들었다. 보험사 데이터정도라면 이렇게까지 할만하다 싶었지만 패션커머스 쪽에 있던 나는 이탈예측보다 "RFM 분석"을 통한 이탈예측이 훨씬 빠르고 효율적이란 생각이 들었다.
무엇보다 꼭 MMM이어야 하나? 란 생각도 든다. 솔직히 MMM 아니더라도 일반 통계분석방법으로 더 다양한 분석을 할 수도 있다. 그중 하나인 "SHAP VALUE"를 예시로 글을 마무리하겠다.
보완책 "SHAP VALUE"
MMM 데이터와 함께 만약 이런 데이터가 추가된다면 어떨까?
-랜딩페이지 내 고객 행동데이터분석을 통해 구매 전환을 높일 수 있는 방안을 찾는다.
-특정 상품 리뷰의 워드클라우드 분석을 통해 나온 결과를 광고 소재에 접목하여 효율을 높인다.
등등...
사실 저 MMM 결과보다 이런 데이터들에 상사가 더 흥미를 가질 것 같다. 일단 하나의 예시를 들어보겠다.
(예시)
MMM을 통해 A,B 매체 광고 포화도가 높은 편임을 확인
▼
랜딩페이지 고객 행동데이터를 모두 트래킹(상품 클릭, 리뷰 보기, 상세페이지 보기 등)
▼
네이버 키워드 데이터로 "연관 키워드 분석"
▼
SHAP VALUE 분석을 통해 "구매고객의 행동 데이터 시각화 > 연관성 확인"
▼
결과 도출
예: 하이엔드 식탁 상품 단가가 높은 편이라 구매 전 리뷰 페이지를 오래 조회하는 편이며 "식탁 관련 키워드" 확인했을 때 "집", "분위기" 키워드가 함께 확인됨
▼
MMM 결과데이터+방안 함께 보고
-리뷰 중 집 분위기를 파악가능한 "식탁을 포함한 전체 집안 이미지"가 있는 리뷰 우선 배치하는 방안 함께 제시
-SHAP VALUE 데이터 참고하여 광고 방안 제시
결론은 “MMM 결과 데이터만으론 부족할 테니 랜딩페이지 내 고객 행동데이터를 트래킹 하여 빅데이터 분석으로 구매 고객의 행동을 분석(SHAP VALUE, 연관키워드 분석 등), 광고 효과를 높일 수 있는 방안을 함께 준비하자!”이다
위 예시는 최근 들은 데이터 마케팅 강의에서 든 사례들 중 하나이다.
여러 사례들이 있었는데 전화로 후원받는 TV광고에서 소재 <> 방송사 간 최적의 조합을 SHAP VALUE로 분석하여 최적화한 것도 있었고, 특정 상품의 리뷰 내용을 워드클라우드로 분석해서 연관 키워드를 도출, 광고 소재로 활용해 광고 효율을 높인 사례도 있었다. 이렇듯 통계 분석 외 다른 분석으로 MMM의 부실한 부분을 보완할 수 있다.
긴 글 읽어주셔서 감사합니다.
글에 대한 좋은 피드백은 언제나 환영입니다. :)