디지털 마케팅과 구글 애널리틱스
데이터 분석의 인과관계와 상관관계를 설명할 때 가장 많이 사용 되는 예시이다. 한 기업에서 아이스크림 판매를 위해 광고비를 증액하자 매출이 전년 대비 25% 상승했다고 하자. 이러한 결과를 광고로 인한 매출 증대로 보는 것이 맞을까?
그럴 수도, 아닐 수도 있다. 만약 올해 여름의 평년 기온이 전년 대비 2도 이상 상승하여 아이스크림 자체에 대한 수요가 많아졌다면 이는 광고의 효과로 보기 어려울 것이다. 아이스크림 매출이 오른 원인에는 광고비의 증대 외에도 영향을 미치는 다른 변수가 있을 수 있다. 변수를 고려하지 않고 단편적인 결과만을 바라보는 분석은 굉장히 위험한 결과를 가져온다.
마케팅 실무자 입장에서 분석이란 결국 내가 집행하고 실행한 것이 결과에 얼만큼 영향을 미쳤는지 확인하는 것이다. ‘새롭게 운영한 채널이 성과에 영향을 미쳤는가?’, ‘변경한 랜딩페이지는 전환율에 영향을 미쳤는가?’, ‘가입 프로세스를 줄였을 때 이탈률이 감소하는가?’ 처럼 말이다.
하지만 아이스크림과 날씨처럼 결과에 영향을 미치는 또 다른 요소가 완전히 배제된 것이 아니라면 우리는 항상 결과에 대해 의심해야 한다. 그리고 보다 명확한 분석을 통해 적절한 결론을 내리기 위해서 꼭 알아야 할 개념이 있다. 바로 상관관계와 인과관계에 대한 이해이다.
우선 상관관계는 한 요소의 변화에 따라 다른 요소도 변화하듯이, 두 요소가 서로 관련이 있다는 것이다. 반면 인과관계란 두 요소가 원인과 결과의 관계에 있다는 뜻이다. 언뜻 비슷해 보이는 개념이지만 이 둘에는 확실한 차이가 있다. 이 둘의 개념을 이해하기 위해 위의 아이스크림 예시처럼 설명하기 좋은 것을 찾기도 힘들 것 같다. 계속 아이스크릠 예시를 떠올려 보자.
광고비를 증액하자 매출이 올랐다는 것은 어떻게 바라봐야 할까? 날씨라는 변수가 있기 때문에 두 요소가 직접적으로 원인에 따른 결과라고 해석하기에는 무리가 있다. 하지만 두 요소의 변화가 동반상승한 점에서 관련성이 있다고 해석할 수 있다. 이럴 때 광고비와 매출 사이를 인과관계(원인과 결과)는 아니지만 상관관계(관련성)에 있다 라고 한다.
만약 인과관계를 무시하고 상관관계에 의존해 다시 광고비를 증대하는 결정을 내리게 된다면 막대한 예산을 허투루 쓰는 결과를 낳을 수 있다. 더불어 원인과 결과 사이에는 반대의 경우가 작용했을 수도 있다. 위의 예시라면 아이스크림 매출이 증가했기 때문에 광고비를 증대 했을 수도 있다. 이처럼 정확한 인과관계를 가려내기 위해서 우리는 다음과 같은 사고 습관이 필요하다.
결과는 온전히 원인에 의해 발생했는가?
결과에 영향을 미친 다른 요소는 없는가?
결과가 원인에 영향을 미치지는 않았는가?
다만 실무를 진행하는 과정에서 이러한 데이터 정합성 문제에 지나치게 빠지게 될 경우 정작 중요한 분석의 목적을 벗어날 우려도 있다. 우리는 이론적으로 완벽한 것을 추구하는 것이 아니라 빠른 실험을 통해 최선의 결과를 찾아내는 것이 목적이다. 그렇기 때문에 끊임없는 의심이 아닌, 합리적인 의심이 필요하다.