brunch

아이템 추천을 위한 Association Rule

Association Rule로 크로스셀링 전략 강화하기

by 이건승
그림1.png

CRM 분석 실무에서 크로스셀링 확장을 위해 많이 활용되는 분석 방법인 Association Rule 대해 소개해보려고 합니다.


추천의 유형


001.png

먼저 설명에 앞서 추천의 유형에 대해 살펴보면 추천은 크게 세 가지 유형으로 구분할 수 있습니다.


1. 전문가 추천 방식

2. 인기 추천 방식

3. 개인화 추천 방식


첫 번째 유형은 전문가 추천 방식으로 전문가가 직접 아이템을 평가하여 추천하는 시스템을 의미합니다. 대표적으로 미술관 큐레이터나 전문가 선정 필수 아이템 목록 등이 여기에 해당합니다.


두 번째 유형은 인기 추천 방식으로 대중에게 인기가 있는 아이템이나 신규 아이템 등 특정 조건의 아이템을 추천하는 방식을 의미합니다. 대표적으로 인가 탑 텐이나 최근 업로드 영상, 유튜브 인급동과 같은 것이 이에 해당합니다.


마지막으로 개인화 추천 방식인데요. 개인화 추천은 각 개인의 특성, 선택한 아이템에 맞춰 추천하는 시스템으로 아마존, 넷플릭스 등의 개인화 추천이 이에 해당합니다.


1번과 2번은 전통적인 추천 유형이라 할 수 있고 현대의 대부분 기업에서는 개인화 추천 유형을 활용하고 있습니다.


그림3.png

이러한 개인화 추천을 위해 우리는 추천 시스템이라는 것을 구축하는데, 추천 시스템은 제품이나 콘텐츠 간 존재하는 연관관계를 수학적으로 도출하여 효과적으로 추천할 수 있는 모델을 말합니다. 이번 글에서 설명할 Association Rule도 이러한 추천 시스템 중 하나라고 할 수 있습니다.



연관 규칙 개념


그림4.png

연관 규칙 개념에 대해 간단한 예시로 설명할 수 있습니다. 연관 규칙 분석은 A라는 상품을 구매한 사람이 B라는 상품도 구매할 확률이 높다는 결과를 이끄는 모델로, 대표적으로 삼겹살과 양파를 함께 구매한 사람은 쌈장도 구매할 가능성이 높다는 결론을 도출하는 것이 이에 해당합니다.


002.png

연관 규칙의 대표 알고리즘은 크게 Apriori, FP-Growth, DHP 정도가 있는데, 이 중 Apriori 알고리즘이 가장 전통적이고 대표적인 연관 규칙 알고리즘입니다. 이 알고리즘은 아이템들의 조합에 대한 경우의 수를 최소화하여 처리 속도 효율을 높인 알고리즘입니다.



연관 규칙 분석의 핵심 지표


그림6.png

연관 규칙 분석 시 아래의 핵심 지표를 보게 되는데, 먼저 지지도(Support)는 전체 구매 횟수 중에서 해당 아이템 혹은 집합의 구매가 얼마나 발생했는지를 나타냅니다. 예를 들어 10건의 거래 중 X라는 아이템이 3건 포함되어 있다면 지지도는 0.3이 됩니다.


신뢰도(Confidence)는 아이템 X가 판매됐을 때 Y 아이템도 함께 포함되는 조건부 확률을 의미합니다. 아이템 X의 지지도가 0.3, X와 Y가 함께 팔리는 경우의 지지도가 0.2라면 신뢰도는 X가 팔릴 때 Y도 팔리는 비율을 나타내므로 0.2를 0.3으로 나눠준 0.67이 됩니다. 주의할 점은 신뢰도는 P(X→Y)와 P(Y→X)의 확률이 다를 수 있다는 것입니다. 예를 들어, 조건절의 지지도가 X는 0.3, Y는 0.6일 때, P(X→Y)의 신뢰도는 0.67, P(Y→X)의 신뢰도는 0.33이 됩니다.


003.png


향상도(Lift)는 아이템 X의 판매 중 아이템 Y가 포함된 비율이 전체 거래 중 아이템 Y가 판매된 비율보다 얼마나 증가했는지를 나타내는 지표입니다. 향상도는 아무 조건 없이 무작위로 아이템 Y가 팔리는 확률보다 X라는 조건절을 주었을 때 Y가 얼마나 더 잘 팔리는가를 수치화한 것입니다. 예를 들어, 아무 조건 없이 삼겹살이 팔리는 확률보다 쌈장이라는 조건이 주어졌을 때 삼겹살이 얼마나 더 잘 팔리는지를 향상도 값으로 나타낼 수 있습니다. 보통 이 수치가 1 이상인 경우 연관 판매 확률이 높다고 판단합니다.


그림8.png

참고로 향상도는 두 아이템 간의 연관성을 나타내는 지표이기 때문에 조건절과 결과절의 위치가 바뀌어도 값이 동일합니다. 이를 대칭적 척도라고 하는데, X→Y의 향상도와 Y→X의 향상도를 벤다이어그램 형태로 나타내면 이 두 값이 같다는 것을 직관적으로 이해할 수 있습니다.


004.png


앞서 설명한 것처럼 향상도 값이 1보다 크면 자연적으로 아이템이 구매되는 확률보다 연관 구매 확률이 높다는 것을 의미합니다. 만약 향상도 값이 1.11이라면 Y 아이템이 자연적으로 팔리는 확률보다 X를 구매할 때 Y도 함께 구매할 확률이 1.11배 높다고 해석할 수 있습니다.


이를 바탕으로 Association Rule을 이용한 추천 과정을 보면, 우선 지지도와 신뢰도의 최소 수준을 설정하여 특정 Cut-off 미만의 아이템 관계를 필터링합니다. 그리고 향상도를 기준으로 내림차순 정렬하여 상위에 있는 아이템 조합을 최종적으로 추천할 상품으로 선정합니다.



Association rule 이용한 아이템 추천 예시


005.png


실무에서는 특정 유저가 A라는 아이템에 선호를 보였을 때, 그 상품과 연관 구매 확률이 높은 아이템 조합을 해당 유저에게 추천함으로써 크로스셀링을 유도하기도 합니다.


SE-fa8a8661-4b35-4d34-9c83-acf9a120d6e3.png?type=w3840


image2.png


제가 있는 패션 커머스에서는 아이템뿐만 아니라 스토어(브랜드) 간 연관 구매 분석을 통해 다양한 마케팅, 영업 전략에 이를 참고하기도 하는데, 실제 연관 구매 확률이 높은 스토어는 상품의 스타일이 유사하거나 혹은 상호 보완적인 경우가 있습니다.



Association Rule은 크로스셀링 확장을 위한 강력한 도구로, 연관 관계 분석을 통해 구매 패턴을 파악하고 적합한 아이템을 추천할 수 있습니다. 이를 통해 개인화된 추천과 마케팅 전략을 강화하고, 실제 판매와 고객 만족도를 높이는 데 기여할 수 있습니다.


keyword