brunch

You can make anything
by writing

C.S.Lewis

by 윤동구리 Mar 04. 2024

[서비스 분석] 추천 시스템

콘텐츠 기반 필터링 모델 & 협업 필터링 모델

※ Disclaimer: 공부한 내용을 바탕으로 정리한 것이나 사실과 상이할 수 있습니다. 틀린 부분은 댓글로 정정주시면 감사하겠습니다.


    추천 시스템은 크게 콘텐츠 기반 필터링협업 기반 필터링으로 나뉜다. 두 가지는 사용하는 용도와 목적이 상이하기에 어떤 것이 꼭 우월하거나 열등한 것이 아니며, 고도화된 추천을 위하여 여러 알고리즘을 복합으로 사용하기도 한다.



1. 콘텐츠 기반 필터링(Content-based Filtering)

 : 콘텐츠의 속성을 기반으로 사용자에게 추천하는 알고리즘


    콘텐츠 간의 특징을 비교하여 유사도를 계산하여 추천을 해주는 방식이다. 해당 콘텐츠에 관심이 있으면 유사한 다른 콘텐츠에도 관심이 있을 것이라는 전제를 한다. 예를 들어 고객이 스커트를 클릭 했다고 하자. 색상, 스타일, 브랜드 등 스커트의 속성을 파악하여 비슷한 속성이 있는 다른 상품을 추천해준다. 메인보다는 콘텐츠를 탐색한 후에 위치하는 경우가 많다. 

    어떤 속성을 기준으로 유사성을 비교할지, 또 어떤 속성에 더 가중치를 둘 것인지는 서비스의 도메인에 따라 상이하다. 최근에는 콘텐츠의 속성을 효율적으로 파악하기 위해 이미지에서 속성을 바로 추출해내는 기술도 활용되고 있다.


   장점   

탐색 중인 콘텐츠와 유사한 콘텐츠를 추천하기 용이 

고객의 구매/탐색 이력이 없거나 신규 등록된 콘텐츠이더라도 추천 가능

   단점       

유사하지 않은 콘텐츠는 추천이 불가하여 다채롭고 새로운 탐색을 유도하기 어려움

콘텐츠를 기반으로 하기에 해당 콘텐츠를 본 사용자 모두에게 동일한 콘텐츠 추천

콘텐츠의 속성이 모두 매핑되어 있어야 하며, 신규 속성 추가가 어려움

콘텐츠와 속성의 개수가 많아질수록 계산이 복잡해짐


   서비스 예시    (추측)

(좌) 오늘의 집  (중) 카카오웹툰  (우)사람인

오늘의 집_비슷한 상품

현재 보는 상품과 카테고리(품목)/브랜드/상품명/컬러/가격대 등이 흡사한 상품 추천

상품상세페이지 하단에 위치

카카오웹툰_이 작품과 비슷한 작품

현재 보는 작품과 장르/그림체/텍스트/작가 등이 비슷한 작품 추천

작품 하단에 위치

사람인_유사공고

현재 보는 공고와 직무/회사위치/경력/근무형태/학력/회사규모 등이 유사한 공고 추천

공고 하단에 위치


    


2. 협업 기반 필터링(Collaborative Filtering)

: 사용자들의 행동 패턴을 바탕으로 콘텐츠를 추천하는 알고리즘

*암시적 행동(클릭, 구매, 체류시간) 및 명시적 행동(평점, 좋아요)


① 사용자 기반 협업 필터링: 사용자 행동이 비슷하면 선호도가 같을 것이라고 보고 추천하는 방식이다. 사용자A가 스니커즈를 좋아한다면, 비슷한 탐색 패턴을 보이는 사용자B에게 스니커즈를 제안하는 방법이다.


② 아이템 기반 협업 필터링: 특정 아이템 간 탐색 패턴의 유사성을 바탕으로 추천하는 방식이다. 스니커즈와 양말을 함께 탐색한 고객이 많았다면, 스니커즈를 본 고객에게 양말을 제안하는 방법이다. 


  장점  

텍스트나 이미지의 유사성이 낮더라도 추천 가능

함께 구매할 만한 상품(보완재)을 효과적으로 제안하여 업셀링 유도

  단점  

충분한 양의 사용자 데이터가 필요하여 신규 사용자에게 적용이 어려움 (First-rater Problem)

사용자의 로그 데이터가 없는 신상품에는 적용이 어려움 (Cold-start Problem)

인기 콘텐츠에 사용자 탐색이 집중되어 비인기 콘텐츠 노출에 한계 (Pareto Principle)

유의미한 사용자 로그를 파악하는 전처리 과정이 필수


서비스 예시 (추측)

(좌) 멜론  (중) 네이버웹툰  (우) 컬리

멜론_믹스업

사용자들의 곡 소비 패턴과 나의 음악 감상 이력을 바탕으로 추천

하나의 음악을 선택하면 내가 좋아할만한 곡 이어서 재생

네이버웹툰_독자들의 선택

해당 작품과 같이 많이 본 작품이기에 좋아할 것이라 판단하여 추천

컬리_다른 고객이 함께 구매한 상품

해당 상품과 함께 구매가 자주 되었기에 보완재라고 판단

업셀링을 위하여 상품을 장바구니에 담을 때 노출하여 추천

단점

    단점    



추천 시스템을 알아보며 느낀 바는 아래와 같다:


1. 추천을 했다고 끝나는 것이 아니다. 사용자의 클릭이나 행동에 따라서 추천 알고리즘을 정교화해나가는 MAB(Multi-Armed Bandit) 모델을 도입하는 경우가 많다.


2. 최근에 많은 서비스들이 개인화 추천을 제공하고 있으나 추천이 항상 답인 것은 아니다. 예를 들어 배달의민족에는 추천 영역이 없다.(나는 못봤다) 추천을 할 것인지, 한다면 어느 영역에서 할 것인지, 또 무엇을 기준으로 할 것인지는 비즈니스 모델에 따라 달라진다.


3. 잘못된 추천은 안하는 것만 못하다. 오히려 서비스의 신뢰성을 떨어뜨릴 수도 있다.



  참고  

어떤 추천시스템을 사용해야 할까? (1) - 협업 필터링 모델과 한계점 (oopy.io)

카카오 AI추천 : 카카오페이지와 멜론으로 살펴보는 카카오 연관 추천 – tech.kakao.com

"한곡 선정하면, 내취향 알아서 플레이"…멜론 '믹스업' 선봬 - 머니투데이 (mt.co.kr)

[추천시스템] Multi-Armed Bandit (tistory.com)

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari