상관관계를 통한 탐색적 분석
앞서 살펴본 바와 같이 개념적인 상관관계분석과 회귀분석에 대해서는 간단하게 설명을 드렸습니다. 그렇다면 간단하게 어떤식으로 자료를 분석하는지에 대하여 이제부터는 설명을 드리도록 하겠습니다.
우선, 이런 쇼핑몰을 운영하시는 분을 기준으로 얻으실 수 있는 데이터들을 한번 나열해 보고 이런 데이터들의 상관관계를 생각해보도록 하겠습니다.
1. 트래픽 & 행동 지표
방문자 수 (Visitors)
페이지뷰 (Pageviews)
평균 세션 지속 시간 (Avg. Session Duration)
이탈률 (Bounce Rate)
상품 상세 페이지 클릭수 (Product Detail Views)
상관관계 예시 분석사례
페이지뷰 ↔ 구매 전환율(페이지뷰와 구매전환율의 움직임 관계 분석)
방문자수 ↔ 페이지뷰
2. 마케팅 캠페인 지표
광고 노출 수 (Impressions)
클릭수 (Clicks)
클릭률 (CTR)
광고 비용 (Ad Spend)
ROAS (Return on Ad Spend)
상관관계 예시 분석사례
클릭률 ↔ 구매 전환율(클릭률와 구매전환율의 움직임 관계 분석)
광고비 ↔ 매출
3. 매출 & 주문 지표
총 주문 건수 (Orders)
총 매출액 (Revenue)
평균 주문 금액 (AOV; Average Order Value)
상품별 판매량 (Units Sold per SKU)
상관관계 예시 분석사례
AOV ↔ 재구매율
상품 가격 ↔ 판매량
4. 고객 프로필 & 행동
신규 vs 재방문 고객 비율
고객 연령/성별/지역
장바구니 담기까지 소요 시간
이메일 오픈률/클릭률
상관관계 예시 분석사례
이메일 오픈률 ↔ 구매 전환율
고객 연령대 ↔ 구매 카테고리
5. 리뷰 & 만족도
평균 상품 평점 (Rating)
리뷰 수 (Review Count)
고객만족도 조사 점수 (CSAT)
상관관계 예시 분석사례
평점 ↔ 재구매율
리뷰 수 ↔ 신규 고객 전환율
6. 물류 & CS(고객 서비스)
배송 소요 일수
반품률 (Return Rate)
CS 문의 건수 & 처리 시간
상관관계 예시 분석사례
배송 소요 일수 ↔ 반품률
CS 처리시간 ↔ 고객 만족도 점수
서로 비교해 보고자 하는 변수는 다양하지만 그 분석 방법과 Data의 형태는 유사하므로 가장 기본적인 형태인 페이지뷰수와 구매전환율의 상관관계를 분석하는 Data를 만들어서 한번 엑셀에서 분석해 보도록 하겠습니다.
Data형태
이런 데이터가 있다고 가정할 때 구매전환율과 페이지 뷰수의 상관관계는 어떨까요?
이렇게 각 빈칸을 넣고(데이터가 행으로 넣어있어서 행을 선택), 첫째 열을 이름표로 사용하고 출력을 바로 아래 나올 수 있도록 선택하고 확인을 누르면 다음과 같이 결과 값이 나옵니다.
이 결과를 보면 페이지뷰수와 구매전환율 사이의 상관계수(correlation coefficient)가 -0.894로 나타나 있습니다. 이는 매우 강한 음의 상관관계를 나타냅니다. 즉 페이지뷰 수가 늘어날 수록 구매전환율은 줄어든다 라는 말이 됩니다.
이러한 결과를 보면 좀 이상하다 느끼실 수도 있는데, 페이지뷰수가 늘어남에 따라 매출이 늘어나는 것은 당연한데 구매전환율은 초기에는 페이지뷰수와 함께 늘어나다가 나중에는 페이지뷰수가 더 많이 늘어나게 되면 감소하는 경향을 보이는 대표적인 지표입니다(분석하는 분의 Insight가 필요한 경우입니다).
그러니 이런경우에는 단기간(프로모션 기간)에 유입과 구매전환의 경향분석을 하거나 하는 기간별로 구매전환율의 상관관계를 비교하는 것이 필요할 때도 있겠습니다.
기본적으로 엑셀에서는 연속형변수의 경우를 가정하여 Pearson 상관계수로 분석된 결과가 나옵니다. 순위형이나 비모수적 데이터에는 스피어만상관계수를 사용해야 하는데 엑셀에서는 제공하지 않습니다. 사실 실무에서는 대부분 연속형 데이터를 기준으로 분석하기 때문에 불편한점은 거의 없다고 하겠습니다.
다른 데이터를 한번 볼까요?
이 데이터는 매출과 광고비의 추이를 보여주는 이 데이터의 상관관계를 앞서 진행한 과정과 동일하게 분석하게 되면 다음과 같은 결과를 얻게 됩니다.
이 분석결과에 따른 광고비와 매출 간의 상관계수는 0.6339로 중간 이상의 양의 상관관계를 보여줍니다.즉, 광고비가 증가할수록 매출도 증가하는 경향이 있다는 것을 의미합니다.
다시말하면, 광고의 효과는 존재하지만 매출이 전부 광고에 의존해서 발생하고 있는 것은 아니라는 것을 의미합니다.
즉, 이럴경우 광고비와 매출의 관계를 통해 수익률(손익)이 어떤지를 살펴볼 필요가 있습니다. 단순한 상관계수는 두 변수의 방향성을 보여주고 그 변수간의 효율성을 의미하지는 않습니다.
즉, 무조건 광고비를 늘린다고 매출이 선형적으로 증가하지는 않을 수도 있다는 점을 의미합니다.
이러한 상관관계 분석에 있어서, 계절성에 따른 영향이 있으므로 동일기간을 중심으로 비교하여야 하며 인과관계를 의미하는 것은 아니므로 좀 더 추가실험을 통해 방향성과 함께 인과관계 분석을 추가할 필요가 있습니다.