다이티 AI 딜리버리는 어떻게 상품추천 데이터를 추출할까?
"가정의 달 기념 어린이 선물 세트", "여사친을 위한 5만원 대 선물", "재구매 사이클에 따른 상품 추천" 등 이커머스 운영자라면 시즌, 타겟, 구매주기 등 다양한 요소에 맞춰 적합한 상품을 고객에게 추천하는 일을 꾸준히 진행하고 있을텐데요. 요즘의 이커머스는 이러한 상품추천을 넘어서 AI/머신러닝을 활용한 상품 추천을 활발히 사용중인 것 알고 계셨나요? 무신사나 마켓컬리 등 핫한 이커머스에 들어가보면 어떻게 요즘 유행하는 옷도 아니고 내가 알지도 않았던 음식인데 어떻게 내 눈과 입에 딱 맞는 상품을 추천하는 것이 놀랍지 않으신가요?
오늘 다이티는 AI 딜리버리가 AI/머신러닝 기반으로 개별 고객에게 딱 적합한 상품을 추천하는 기술 4가지 방식에 대해 쉽게 소개하고자 합니다. 다이티의 가장 쉬운 데이터 기술 소개를 함께 살펴보시죠.
친구A : "OO아, L가게 마라탕 꼭 먹어봐. 진짜 맛있어 땅콩 맛 1도 안나고 얼큰해서 완전 딱 내 취향 그 자체. 별점 5점 만점에 20점이야. 너 꼭 가;;"
친구B: "무슨 소리야? L가게 마라탕 진짜 오바야. 샴푸향 너무 나던데;; 그냥 엘라스틴이랑 라면스프 섞어 먹는 맛 나. 절대 절대 가지마"
친구 A와 B가 서로 상반된 소리를 합니다. 나는 여기서 어떤 선택을 해야 할까요? 친구 A의 말을 따라 L가게 마라탕을 찾아가보는 게 좋을까요? 아니면 친구 B의 말을 따라 L가게 마라탕은 가지 않는 게 좋을까요? 이 두 개의 말로만 판단하기는 어렵습니다. 하지만 철두철미한 MBTI 극 J 성향인 나는 친구들과의 입맛을 정리한 표가 있는데요. 이 표를 본다면 친구 A의 말을 따라야 할지, 친구 B의 말을 따라야 할 지 알 수 있습니다.
이 표를 본다면 친구 A와 B 중 더 내 입 맛과 가까운 사람은 친구 A이므로 "L가게 마라탕에 간다"가 현명한 선택인 것을 알 수 있습니다. 이러한 발상을 이커머스에 적용해보면 하나의 AI 기술이 되는데요. 일정 기간 동안의 반복 구매 빈도를 상품에 대한 선호도로 활용해서 나와 유사한 구매 패턴을 보인 고객이 많이 구매한 상품을 나에게 추천해주는 것입니다. 비슷한 구매 행태를 보이는 고객군을 잘 묶는다면 만족도 높은 상품을 꽤 정확하게 추천해줄 수 있습니다.
하지만 이러한 유저 기반 콜라보레이션 필터링을(User based Collaborative Filtering) 할 때 주의해야 할 점이 있습니다. 이는 실제 우리의 일상에서도 적용되는 예시인데요. 나와 입맛이 너무나 닮은 친구 A이지만 친구 A가 좋아하는 힙하고 스트릿한 패션은 나와 안맞을 수 있듯이 다양한 상품을 판매하는 종합 쇼핑몰에서는 이러한 유저 기반 콜라보레이션이 적합한 수단이 아닐 수 있어요. 물론, 이를 보정하기 위해 카테고리를 한정해서 해당 기술을 활용하거나 몇 가지 수치를 일부 보정해서 활용하는 방법도 있지만 본인의 쇼핑몰에 더 적합한 기술이 있다면 다른 기술을 활용하는 게 좋겠죠.
위와 유사한 접근 방법인데 X축과 Y축을 바꾸는 방법도 있습니다.
이렇게 유저가 아닌 음식을 기준으로 본다면 가게 별 선호도를 통해 어떤 음식을 사람들이 더 유사한 음식으로 느끼는 지 알 수 있죠. 여기서는 'H가게 돈까스와 K가게 제육볶음'이, 'E가게 떡볶이와 L가게 마라탕'이 유사한 음식으로 묶이는 것을 볼 수 있네요. 그렇다면, H가게 돈까스를 좋아한 친구 D는 K가게 제육볶음을 좋아할 확률이 크고 E가게 떡볶이를 좋아하지 않았으니 L가게 마라탕도 좋아하지 않을 것이라고 추측할 수 있겠죠?
접근 방식은 비슷하지만 유저가 아닌 상품으로 구분을 한다는 차이가 있고 이것을 상품 기반 콜라보레이션 필터링(Contents based Collaborative Filtering)이라고 합니다.
위에서 보여준 것처럼 고객의 반응을 기반으로 추천 상품을 구성하는 것이 아닌 상품 자체의 속성을 기준으로 비슷한 유형의 상품을 추천하는 방식도 있습니다. 이것을 콘텐츠 기반 추천(Contents Based Recommendation) 방식이라고 하는데요. 이렇게 속성을 기반으로 추천을 할 때는 고민할 게 많습니다. 어떤 속성을 기준으로 유사성을 가르느냐가 중요해요. 신발을 예로 든다면 "브랜드를 기준으로 유사성을 나눠야 할 지", "신발의 형태를 기준으로 유사성을 나눠야 할 지", "신발의 스타일을 기준으로 유사성을 나눠야 할 지", "가격대를 기준으로 유사성을 나눠야 할 지" 등과 같이 말이죠.
AI는 머신러닝을 통해 어떤 기준으로 유사성을 나누는 게 더 적합한 지에 대해 판가름을 할 수 있습니다. 하지만 현실에서는 머신러닝이 한계를 보이는 경우도 종종 있습니다. 때로는 직관이 필요한 경우도 많죠. 예를 들면 머신러닝은 과거 데이터를 분석해본 결과 신발의 형태를 기준으로 상품 추천을 하는 것이 적합하다고 제안했더라도 나이키의 경우 만약 '나이키' 브랜드에 진심인 고객이 많다면 아디다스 신발을 추천해주기보다는 나이키 양말이나 나이키 티셔츠를 추천해주는 것이 더 효과적이겠죠.
앞서 소개한 3개의 상품 추천 기술은 일정 기간 동안 발생한 데이터를 기반으로 고객의 관심사 혹은 유사성을 유추하여 향후 구매 가능성이 높은 상품에 대한 추천을 진행하는 방식이었는데요. 이와 달리 동시에 함께 구매한 상품 데이터를 통해 함께 구매할 확률이 높은 상품을 추천하는 방식도 있습니다. 가령, '순두부, 순두부 양념, 버섯'의 조합이라거나, '스킨, 로션, 아이크림' 등과 같은 조합은 함께 구매가 될 가능성이 높은 조합이죠. 이러한 조합을 상품 추천하기 위한 기술은 앞서 설명드린 긴 기간 동안의 여러 데이터를 기반으로 구분하는 것과는 다른 기술이 필요하게 됩니다. 이렇게 구매하는 단계에서 적절한 상품을 추천하는 것은 AOV를 높이는 데 큰 도움이 되는데요. 이 때 가장 대표적으로 쓰이는 방법이 연관분석(Association Analysis)입니다.
연관 분석을 떠올렸을 때, 많은 사람들은 머릿속에서 매칭되는 짝꿍을 찾습니다. 예를 들어,맥주를 구매하려 하는 고객은 함께 육포나 아몬드 등의 상품을 많이 구매했을 것이고, 이러한 상품 조합을 AI를 통해 찾아내면 '구매가 많이 상승하겠지?'라는 생각을 하게 됩니다. 아이러니하게도 데이터를 통해서는 90년대 중반 월마트에서는 맥주와 기저귀의 매출이 동시에 상승하는 연관성을 발견했는데요. 이에 담당자가 기저귀 진열대 위치를 맥주 진열대 근방으로 바꾸자 기저귀와 맥주의 매출이 전달의 5배로 뛰게 되는 일이 있었습니다. 사람들은 발견하지 못한 지점이었지만 데이터를 통해서는 많은 남편들이 '기저귀 한 팩을 사며 맥주 한 팩을 사가는' 행동이 반복적으로 발생한 상황을 캐치할 수 있었기 때문이죠.
많은 이커머스 관계자들은 '매출 쌍끌이' 역할을 해줄 기저귀와 맥주 같은 조합을 찾기 위해 데이터를 찾곤 합니다. 궁극적으로 이러한 기술을 통해 우리가 알고자 하는 것은 혼자 팔릴 때는 큰 사랑을 받는 제품이 아니지만 어떤 상품과 함께 노출이 되면 유독 많이 팔릴 수 있는 상품이죠. 하지만 그렇다고 그저 많이 팔리는 제품 조합으로 판매를 진행하고자 한다면 대한민국에서 식재료 중 가장 판매가 잘되는 '바나나'가 모든 추천 상품으로 나와야 할 지도 모릅니다. '시원한 맥주+바나나', '바삭한 후라이드 치킨+바나나', '쫄깃한 족발+바나나'와 같이 말이죠.
그래서 제대로 연관분석을 하기 위해서는 연관성을 알고자 하는 상품 Y의 전체 구매 확률과 상품 X를 구매했을 때 상품 Y의 구매 확률 증가 비율을 계산할 수 있어야 합니다. 물론 이러한 경우에도 구매 수가 너무 적거나 많은 상품은 무의미한 데이터가 나올 수 있기에 이를 방지하는 방식의 도입도, n개의 상품 구매 시 함께 높아지는 상품에 대한 데이터도 살필 필요가 있습니다.
다이티가 최대한 쉽게 설명한 4가지 상품 추천 기술에 대한 기본적 소개 재밌게 읽으셨나요? 어쩌면 이번 콘텐츠는 문과인 우리에게는, n년차 수학과 거리두기를 하고 있는 우리에게는 조금 어려운 이야기일 수도 있습니다. 물론 이러한 통계학적 지식이 있어야만 상품 추천을 할 수 있는 것은 아닙니다. 다이티 AI 딜리버리, 다이티 AI BOX를 비롯한 편리한 AI 마케팅 솔루션이 많이 나왔기 때문이죠. 다만, 내가 사용하는 솔루션은 어떤 고민까지 하면서 비즈니스를 발전시키고자 하는지 아는 것은 조금 중요할 수 있어요. 내 비즈니스의 성장을 가까운 옆에서 도와줄 파트너이기 때문이죠.
오늘은 AI와 러신머닝이 어떠한 원리를 통해 상품을 추천하는 지에 대해 기본적인 내용을 소개했는데요. 실제 현장에서는 산업마다 가장 적합한 방식을 찾아야 하고, 같은 이름의 기술이더라도 파생 기술, 튜닝 기술이 많습니다. 그러기에 데이터를 어떻게 가공하고 새로운 특징을 발견해서 실제 성과를 높일지에 대한 고민을 이어나가고 있죠. 이것이 곧 기술 경쟁력이기도 하고요.
NHN DATA 역시 어떻게 하면 데이터 드리븐을 통해 실제 비즈니스 성과를 극대화할 지에 대한 치열한 고민을 20년 간 이어가고 있습니다. 이러한 AI/데이터 기술을 통해 이커머스 성장을 함께 이어나가길 바라는 비즈니스가 있다면 다이티와 함께하세요. 여러분의 이커머스도 최신 AI 기술을 통해 효과적으로 비즈니스 성장을 이어나갈 수 있습니다.
- 이커머스 데이터 분석가라면? 구매 데이터를 이용한 고객 세분화 기법 - RFM
- 이커머스 마케터라면? 다이티가 알려주는 CLV에 대한 거의 모든 것(기초편)
- 일반 직장인이라면? 직장인이 은근히 모르는 자료조사단계 데이터 활용법
다이티의 콘텐츠를 꾸준히 받아보고 싶다면?
아래 채널의 구독을 시작하세요 !