엑셀로 간단하게 끝내는 '마이크로 전환' 상관관계 분석

by 글링크미디어

인트로 : 머신러닝에게 '잘못된 먹이'를 주지 않으려면

지난 글에서 머신러닝을 '비상하지만 경험 없는 신입 사원'에 비유했습니다. 이 신입 사원이 일을 잘하게 하려면 '제대로 된 먹이(데이터)'를 줘야 한다고도 말씀을 드렸죠. 그런데 마케터의 입장에서 도대체 어떤 데이터가 좋은 데이터인지 알 수 있을까요?

내가 머신러닝에게 주려고 하는 데이터가 좋은 데이터인지 알기 위해서는 내가 최종목표 전환과 마이크로 전환 데이터 간의 궁합을 확인해야 합니다. 오늘은 복잡한 툴 없이 오직 엑셀의 CORREL 함수 하나로 우리 브랜드의 최종목표와 궁합이 좋은 '효자 지표'를 찾는 법에 대해 이야기해 보겠습니다.


1. CORREL 함수란

CORREL은 Correlation(상관관계)의 약자입니다. 쉽게 말해 두 집단의 데이터가 '얼마나 비슷하게 움직이는가'를 수치로 보여주는 도구이죠. 예를 들어, 우리가 보유한 키와 몸무게 데이터를 기반으로 '둘 사이에 얼마나 밀접한 관련이 있는지' 알고 싶다고 가정해 봅시다. 이때 상관분석이라는 통계적 기법을 활용하면 그 관계의 정도를 명확히 수치화 할 수 있습니다. 아래 이미지는 임의의 키와 몸무게 데이터를 입력하고 CORREL 함수로 상관성을 도출한 결과입니다.

image.png <’키’와 ‘몸무게’ 예시 데이터와 CORREL 함수 결과값>

결과값으로 생소한 숫자가 하나 보일 텐데요. 이 숫자를 상관계수라고 합니다. CORREL 함수의 상관계수는 항상 -1과 1 사이의 숫자로 표현됩니다.


1에 가까울수록: 양의 상관 관계가 있음 (A가 늘어날 때 B도 늘어남)

0에 가까울수록: 상관성이 없음 (A와 B는 아무 상관없이 각자 움직임)

-1에 가까울수록: 음의 상관 관계가 있음 (A가 늘어나면 B는 줄어듦)


통상적으로 상관계수가 0.4~0.7이면 '상관이 있다', 0.7 이상이면 '상관성이 매우 높다'고 판단합니다. 위 이미지에서 도출된 0.81이라는 수치는 키와 몸무게 사이의 상관성이 매우 높다는 것을 명확히 보여줍니다.

이처럼 CORREL 함수는 마케터의 '직감'을 '확신'으로 바꿔주는 훌륭한 도구가 됩니다. "왠지 이게 중요할 것 같아"라는 막연한 추측 대신, "이 데이터는 매출과 상관성이 0.7이 넘으니 여기에 집중하자"라고 데이터 기반의 의사결정을 내릴 수 있게 됩니다.


2. CORREL 함수 사용방법

CORREL 함수는 사용 방법도 또한 매우 간단합니다. 예를 들어 ‘구매 건수’와 ‘장바구니 건수’ 사이의 상관관계를 분석하고자 할 때, 엑셀에서 다음과 같은 수식을 사용하면 됩니다.


‘=CORREL(장바구니 건수 데이터 범위, 구매 건수 데이터 범위)’


상관성을 확인하고 싶은 두 데이터 열을 쉼표(,)로 구분하여 입력하기만 하면 끝입니다. 이렇게 도출된 상과계수가 1에 가깝다면, 해당 데이터를 머신러닝에 학습시켰을 때 성과 개선 효과가 클 것이라 예상할 수 있습니다. 반대로 점수가 0에 가깝다면, 그 데이터는 머신러닝을 혼란에 빠뜨리는 ‘불량 식품'일 확률이 높다고 볼 수 있지요.


3. 한 걸음 더, 엑셀의 ‘상관 분석’ 기능 활용하기

단, CORREL 함수는 한 번에 두 개의 데이터 세트만 비교할 수 있다는 한계가 있습니다. 만약 효과적인 마이크로 전환을 찾기 위해 분석해야 할 지표가 100개라면, 이를 일일이 함수에 넣기에는 물리적으로 너무 많은 시간이 소요되겠죠.

이때 우리의 소중한 시간을 아껴주는 기능이 바로 ‘분석 도구 팩’입니다. 엑셀의 [옵션] - [추가 기능] 메뉴에서 이를 활성화하면, [데이터] 탭에서 [데이터 분석] 기능이 활성화되는 것을 확인할 수 있습니다.

image.png <엑셀에서 상관 분석 기능 활용 1>


[데이터 분석]을 클릭하면 엑셀 내에서 활용할 수 있는 다양한 통계 기능들이 보여집니다. 여기서 [상관 분석]을 선택하면 여러 개의 전환들 간 상관 계수를 한 번에 구할 수 있게 됩니다. 아래 이미지는 상관분석 선택 과정과 GA4 데모계정의 데이터를 활용해 데이터들 간의 상관계수를 도출한 결과 예시입니다.

image.png <엑셀에서 상관 분석 기능 활용 2>

이 분석 결과를 보면, ‘주요 이벤트 비율(전환율)’에 가장 높은 상관성이 있는 지표는 ‘참여율’임을 할 수 있습니다. 또한 '참여율'은 다시 '평균 참여 시간'과 매우 높은 상관성을 보입니다. 결국 전환율을 높이려면 유저의 ‘참여율’을 끌어올려야 하고, 그 핵심은 '참여 시간'에 있다는 결론에 도달합니다.

만약 이것이 실제 데이터라면, 마케터는 "전환율을 올리기 위해서는 유저들이 웹사이트에 최대한 오래 머물도록 해야 한다."라는 주장을 수치적 근거를 기반으로 당당히 제시할 수 있게 됩니다. 이처럼 엑셀의 'CORREL 함수’와 ‘상관분석’ 기능을 활용하면, 목표로 하는 전환을 효과적으로 성장시킬 수 있는 마이크로 전환이 무엇인지를 빠르고 객관적으로 파악할 수 있습니다.


마무리 : ‘감’을 ‘논리’로 바꾸는 마케터

머신러닝이 어떤 재료를 넣는지에 따라 맛이 결정되는 '요리'라면, CORREL 함수는 그 재료들이 서로 잘 어우러지는지 미리 맛을 보는 ‘기미상궁’과 같습니다. 수집된 수많은 지표 사이의 상관계수를 계산해 보는 시도는 단순히 숫자를 확인하는 것 그 이상입니다. 마케터의 막연한 '감'을 수치적 '논리'로 치환하는 과정으로 볼 수 있지요. 어떤 상황에서던 근거를 바탕으로 전략을 제안하는 연습을 한다면, 여러분과 함께 일하는 사람들은 여러분을 단순한 ‘광고 집행 담당자’가 아닌 '비즈니스를 함께 성장시키는 진정한 파트너'로서 신뢰하게 될 것입니다.


Article by 비키트

매거진의 이전글머신러닝에게 먹이를 주는 현명한 방법