1.3 군집분석을 이용한 세분화
소사업을 위한 데이터 분석 마케팅 기법
군집분석을 이용한 세분화 기법을 알아보겠습니다.(군집은 집단이나 그룹을 뜻합니다. 일관성을 위해 군집이란 단어만 쓰겠습니다.)
군집분석은 데이터에서 비슷한 것끼리 찾아 그룹으로 묶는 알고리즘입니다. 정교하게 말하면 데이터 포인트를 유사한 것끼리 같은 그룹으로 묶고, 그룹들 간에는 비 유사도가 높아지도록 만드는 과정입니다. 마케팅에서 데이터 포인트는 개별 소비자나 기존 고객을 의미합니다.
페르소나 만들기로 세분화할 때는 개인의 전문지식이 중요합니다. 반면 군집분석은 데이터를 수치화하여 수학적으로 거리가 가까운 것과 그렇지 않을 것들을 분류합니다.
군집분석 예제
누구나 구매 경험이 있는 식자재마트를 예로 들겠습니다. 식자재마트에서는 포인트 적립을 조건으로 고객들의 회원 가입을 유도하여 기본 데이터를 얻습니다. 데이터는 고객의 전화번호, 연령대, 성별, 가족 수, 자녀의 유무, 소득 수준을 포함합니다.(설문조사를 하면 소득은 민감한 정보로 생각해서 응답을 안 할 가능성이 높습니다.) 고객이 식자재마트에서 쇼핑을 할 때마다 <언제, 어떤 식자재를, 얼마나 많이 그리고 자주 사는지>의 데이터를 추가로 얻습니다.
뒤에서 식자재마트의 고객 데이터로 군집분석을 하겠습니다.
군집분석의 장점
판매자 입장에서 가장 관심 있는 데이터는 고객의 구매금액일 것입니다. 고객을 구매 금액이 큰 군집과 그렇지 않은 군집으로 구분할 수 있습니다. 구매금액이 많은 고객은 데이터를 보며 눈으로 보며 분류할 수 있습니다. 군집분석에 장점은 겉으로 보이는 것 이외의 통찰을 발견할 수 있는 것에 있습니다. 예컨대 고객의 자녀수와 많이 사는 제품에 관련이 있다면 군집분석이 발견할 수 있습니다. 군집분석 알고리즘은 모든 변수의 관계를 계산하기 때문에 새로운 군집을 발견하는데 유리합니다. 컴퓨터로 하기 때문에 즉각적이고 수시로 할 수 있는 것도 장점입니다.
적절한 군집 수를 찾아라
군집분석은 유사성을 보이는 적절한 군집 수를 찾아내는 것이 중요합니다. 너무 적은 군집 수는 일반화되어 고객을 이해할 수 없고, 너무 많은 군집 수는 유용하지 않습니다. 군집분석 알고리즘은 K-means, 계층적 군집분석, 밀도기반 군집분석이 있습니다. 어느 기법을 쓰던지 적절한 군집수에 최종적인 판단은 마케터가 하게됩니다.
군집분석은 결과를 실행할 수 있어야 한다
성공적인 세분화의 핵심은 실행 가능성입니다. 발견된 고객 군집은 공략하기 위한 효과적인 마케팅 프로그램을 개발할 수 있어야 합니다. 고객의 특성이 구별되는 10개의 군집을 발견하였더라도 여건상 군집에 맞는 프로그램을 따로 개발할 수 없다면 세분화의 의미가 없습니다. 10개의 군집에 모두 다른 마케팅 프로그램을 적용하면 비용이 그만큼 커집니다. 따라서 적절한 군집 수는 마케팅 프로그램을 개발하고 충분한 이익을 얻을 수 있는 정도라야 합니다.
군집분석은 컴퓨터로 빠르게 수행할 수 있고 사람이 발견할 수 있는것 너머의 통찰을 발견할 수 있습니다. 마케터는 적절한 군집의 수를 결정해야 하고 효과적인 군집분석은 실행가능성이 있어야 합니다.