추천 시스템 만드신다고요? 그럼 이것부터 보세요!
오늘은 Flin AI를 기획하며 사용자가 없는 초기 서비스에 "데이터 기반 추천 시스템"을 어떻게 녹일지에 대한 고민지점을 어떻게 풀어냈는지 이 외 어떤 방안이 있는지를 복기하며 작성해 볼 예정입니다.
오늘 주제에 들어가기 전 '사이드 프로젝트 글이 왜 안 올라오지?' 하시는 분들 계셨을 것 같은데 사이드 프로젝트는 느리지만 영차영차 계속해서 하고 있답니다. MVP 개발은 마무리 된 상태고 현재 글 이후에 회고로 찾아오도록 할게요. 혹시나 제가 만든 서비스 Flin AI가 궁금 하시다면 여기를 클릭해 URL로 방문해주세요! Flin AI는 현재 최신 트렌드를 더욱 빠르게 탐색하고 원하는 콘텐츠만 Pick해서 학습할 수 있도록 하는 서비스이며 현재 초기 테스터를 모집하고 있으니 많은 관심 부탁드려요�
Flin AI는 유튜브 콘텐츠를 큐레이션하여 제공해 기획자/PM/PO 분들이 인사이트를 빠르게 얻을 수 있도록 하는 것을 목표로 하고 있으며, 지금은 초기 사용자가 없지만 추천 및 요약에 관해 기획/개발과정에서 무엇을 중요하게 여겼는지를 풀어내고자 한다.
① "끼리끼리" 협업 필터링
나와 취향이 비슷한 사람들의 선택을 믿는 것으로 A와 B가 지금까지 구매했던 물건 내역이 90% 일치한다면,
B가 구매한 물건도 A가 좋아할 것이라는 예측이다.
장점으로는 아이템의 상세를 모르더라도 추천이 가능하며 사용자도 몰랐던 의외의 취향을 발견해줄 수 있다.
단점으로는 (1) 시중 제품은 많은데 내가 구매한 제품은 단 2개인 경우 유저가 소비하는 상품보다 소비하지 않은 상품이 압도적으로 많기에, 유저 간의 공통점을 찾기 위한 데이터 부족으로 정확도가 떨어진다는 문제와 (2) 인기있는 상품 위주의 데이터가 추적(데이터가 쌓인 제품이 기회를 독점하고, 그 결과가 다시 추천으로 이어짐)되어 비주류지만 좋은 상품들은 추천 목록에서 밀려나는 '롱테일 배제 현상'이 발생할 수 있다.
② "비슷비슷" 콘텐츠 기반 필터링
내가 과거 좋아했던 것과 성질이 비슷한 걸 찾는 것으로 내가 'SF 영화'와 '동화'를 좋아했다면,
다른 사람들이 보든 말든 비슷한 'SF' 혹은 '동화' 태그가 달린 영화를 추천한다.
장점으로는 다른 사용자의 데이터가 필요하지 않으며 "당신이 본 OO영화와 비슷해요!"와 같은 추천의 근거를 설명하기 쉽다.
단점의 경우 상품 정보에만 집중하기 때문에 발생하는 한계로 유저의 과거 이력을 기반으로 비슷한 것만 찾다보니, (1) 유저의 취향이 확장되지 않고 틀에 갇히게되며 (2) '분위기가 무서운', '색감이 감성적인'과 같은 느낌의 영역을 데이터화 하지 못한다면 AI가 이를 인식하지 못해 데이터의 품질에 대한 판단이 없이 단조로운 결과를 제공하게된다.
라는 질문보다는 '어떤 논리로 추천할까요?' 라는 방향에 대한 답을 찾게된다. 이 처럼 추천 로직을 짤 때는 '우리 서비스는 유저 간 취향이 활발한가?' 아니면 '콘텐츠 각각의 특징이 뚜렷한가?'를 먼저 따져보고 개발 방향을 제안하는 것이 좋다.
이때 단순 클릭률만을 보는 것이 아닌, 추천을 통해 유저가 새로운 카테고리를 탐험하게 되었는지 등의 유저 경험 확장 측면에서의 지표를 관리하는 것이 필요하다.
이와 관련해 팀네이버 컨퍼러스인 DAN 25에서 흥미로운 지점을 알게되었는데
앞으로의 네이버 쇼핑은 라이프 스타일 전체를 읽어내려는 방향성을 내부적으로 설정하고 있었다.
(해당 내용은 굉장히 아주 많이 간략하게 풀어낸 것이기 때문에... 직접 영상을 보는 것을 추천한다.)
이 키워드를 검색했네에서 '각자의 목표와 맥락 안에서 효율적으로 구매까지 자연스럽게 연결' 하는 것을 목표로
26년 상반기 내 쇼핑 경험에 큰 변화를 줄 계획이 있다고 발표했다.
만약 네이버의 핵심인 검색에 대해 AI 활용에 대한 인사이트를 얻고싶다면
'네이버 브리핑' 대해 다룬 적이있는데 관심 있으면 봐도 좋을 것 같다.
네이버 쇼핑에서는 네이버에서 자체 개발한 추천 엔진인 AiTEMS사용하고 있다고 한다. 앞서 이야기했던 "협업 필터링"을 기억하는가? "끼리끼리"라는 워딩을 사용했었는데 위에서 보여지는 내 또래 또한 협업 필터링의 원리를 응용했다고 볼 수 있다. 나와 비슷한 특징을 그룹핑해 지금 무엇에 관심이 있는지를 찾아내어 제공해주어 제품에 대한 관심을 끌어내고 탐색을 하게 유도하는 장치 중 하나라고 생각했다.
실시간 반응을 통해 우리는 방금 전 클릭한 것, 최근 찾아본, 찜한 것들이 모두 데이터 기반으로 제품을 추천받을 수 있게되는데 네이버 플러스 쇼핑 페이지는 완전히 사용자 행동에 기반한 머신러닝이 작동하고 있는 것을 확인할 수 있다. 만약 내가 제품에 대한 구매의사가 매우 강하며 고민을 하고 있는 와중에 이 페이지를 보게된다면 자연스럽게 아! 나는 이 제품이 탐색했었지 혹은 필요했었지를 상기시키며 제품 탐색을 이어나갈 수 있게된다.
먼저 만약 상품을 추천하는 방식을 도입하고자 한다면 어느정도의 사용자 데이터가 축적되어있는지 확인해야한다. 사용자 데이터가 없는데 어떠한 기준을 가지고 상품을 제공할지를 알 수 없기 때문에 축적부터 시작해야한다. 반대로 어느정도의 사용자 데이터가 축적되어있고 실험을 해봐도 되겠다! 라는 판단이 든다면 1차원적인 추천 방식을 먼저 적용하고 1차원 추천 방식에 대해 인사이트를 얻은 시점에 여러 가지의 재료를 섞어 사용하는 하이브리드 추천 시스템을 사용하는 것이 좋다. 예를 들어 아무런 데이터가 없는 신규 유저에게는 콘텐츠 기반으로 추천하다가, 데이터가 쌓이면 협업 필터링의 비중을 높이는 식으로 사용자 데이터를 확인해 전략적인 판단이 가능해지게 된다.
이제 세부적으로 더 들어가서 기획 시 어떻게 해야하며 무엇을 고려해야하는지로 넘어가야 하는데
작성하다보니 내용이 너무나도 길어지는 것 같아 1편과 2편으로 나누어 작성해보겠다.
그럼으로 오늘은 여기까지�