brunch

You can make anything
by writing

C.S.Lewis

by Mr text Dec 13. 2021

알고리즘의 벽

데이터 분석가가 보는 데이터 밖 세상 이야기 (2)

 요즘 들어  유튜브 추천 알고리즘의 신묘함을 새삼 느끼고 있다. '무한도전', '런닝맨' 같은 예능 프로그램 관련 영상을 몇 번 봤더니 '오분순삭'이나 '옛능'같이 예능 프로그램의 재미있는 부분을 모아 업로드하는 취향저격 채널을 추천하는가 하면, 손흥민 하이라이트에 이어 해외 축구 주간 하이라이트를 자연스레 재생하기도 한다. 유튜브를 쓰면 쓸수록 추천 알고리즘이 점점 정확해지는 기분이다.


 알고리즘과 내 취향이 점점 비슷해질수록 유튜브를 사용하는 시간은 늘어났다. 이렇게 서비스를 사용하는 시간이 늘어나면 서비스는 사용자의 데이터를 그만큼 많이 확보할 수 있게 된다. 수집된 데이터는 알고리즘을 고도화시켜 점점 더 정확도가 높아지고, 사용자는 서비스를 더욱 많이 쓰게 된다. 추천 알고리즘의 맛을 한번 보게 되면 퇴근 후의 시간쯤은 그야말로 순삭이다.


 유튜브를 예로 들었지만 추천 알고리즘은 요즘 대부분의 서비스에 적용되어 있다. 넷플릭스로 대표되는 OTT 서비스도, 인스타그램으로 대표되는 SNS 서비스에도 이런 알고리즘이 적용되어 있다. 목적은 결국 각자의 방식으로 수집한 사용자의 데이터를 활용해 그가 좋아할 것으로 추정되는 콘텐츠를 추천해서 사용시간을 늘리는 것이다. 


 사용자가 서비스를 많이 사용할수록 수집되는 데이터가 많아지고, 이렇게 수집된 데이터를 재료 삼아 알고리즘은 더욱 정교해진다. 이 알고리즘의 추천을 받은 고객은 자연스레 서비스를 더 오래, 더 많이 사용하게 되는데 이렇게 서비스에 트래픽, 즉 서비스를 사용하는 사람이 많이 모이게 되면 이때부턴 무엇을 해도 돈이 된다. 가장 대표적인 방법은 광고다. 작은 영역을 하나 따서 광고를 노출하면 바로 광고 수익이 발생하는 것이다. 이렇게 노출한 광고에 대한 고객 반응을 데이터로 활용하여 알고리즘을 고도화하는 또 다른 재료로 사용함은 물론이다.


 여기에서 그치지 않고 자체 커머스 기능을 추가하는 곳도 있다. 애초에 광고 자체가 어떤 물건이나 서비스를 사고 싶게 만들기 위한 것이 아니던가. 내 서비스/플랫폼에 사람이 많이 모였고 광고도 나가고 있는데 물건을 직접 판매하지 말라는 법은 없다. 작게 시작했던 서비스는 이렇게 몸집을 키워가며 광고 플랫폼이 되고 커머스 플랫폼이 된다.


 테크 기업 대부분의 성공 공식이 되어버린 이런 흐름 - 고객 데이터 수집 → 분석 → 추천 → 체류시간 증대 → 트래픽 확보 → 고객 데이터 수집 →..... → 광고 → 커머스 - 을 일반 개인이 벗어나기란 쉽지 않다. 자기가 재미있게 느끼는 콘텐츠를 무한정 쏟아내는데 그 추천 알고리즘을 어떻게 거부할 수 있을까. 


 추천 알고리즘은 각 기업들의 핵심 경쟁력이라 외부에 그 정보가 상세히 공개된 적은 없다. 그러나 어떤 식으로 추천이 이루어지는지는 대략 짐작해 볼 수 있는데, 크게 1) 나와 유사한 특성을 보이는 사람들이 봤던 것을 추천하거나 2) 내가 본 것과 유사성을 갖고 있는 콘텐츠를 추천하는 방식이다. A라는 사람이 손흥민 하이라이트 → 무한도전 하이라이트 순서로 영상을 찾아봤다면, 손흥민 하이라이트까지만 시청한 B에게 다음 영상으로 무한도전 하이라이트를 추천하는 것이 1)의 예시가 될 것이고, 손흥민 하이라이트와 '축구'라는 주제의 유사성을 보이는 박지성 하이라이트를 추천하는 것이 2)의 예시가 될 것이다. 각각의 추천 정확도를 높이기 위해 콘텐츠별로 메타정보를 얼마나 정확하고 많이 등록하는지, 그리고 알고리즘을 어떻게 만드는지 정도가 기업마다 차이가 있을 뿐 기본적인 추천의 콘셉트는 여기에서 크게 벗어나지 않는다. 


 사용자의 관심사에 맞는 정보를 추천해준다는 콘셉트는 실로 유용하고 아무 문제없어 보이기도 하지만 때로는 확증 편향 문제를 유발하기도 한다. 확증 편향(, confirmation bias) 자신의 가치관, 신념, 판단 따위와 부합하는 정보에만 주목하고 그 외의 정보는 무시하는 사고방식 (네이버 국어사전)을 말하는데, 쉽게 말하자면 "보고 싶은 것만을 보는" 것을 말한다. 2010년대에 들어 구글, 유튜브, SNS 등의 사용자 맞춤 알고리즘이 이러한 확증편향을 가속화한다는 비판이 나오고 있는데 이는 결국 알고리즘이 사용자들을 '보고 싶은 것만 계속 보게'만들기 때문이라는 것이다.


 비슷한 사람이 본 것이나 본 것과 비슷한 것을 추천하는 이 단순한 알고리즘의 힘은 실로 막강하다. 당장 주위를 둘러봐도 확인되지 않은 이야기를 사실로 믿고 근거를 물어보면 유튜브라고 말하는 이들이 많아지고 있다. 공중파에서 보도되는 뉴스는 믿지 않지만 특정 유튜브 채널의 출연자들이 말하는 것은 맹신하기도 하고 "내 주위에는 그런 사람 없다."며 주위 이야기에 귀를 열지 않는 이들도 많아지고 있다. 우리는, 우리도 모르는 사이에 그렇게 알고리즘의 벽 안에 갇히게 된다.


"잘 모르고 무식한 사람이 신념을 가지면 무섭다."는 말이 있다. 비슷한 맥락으로 "책을 한 권도 읽지 않은 사람보다 한권만 읽은 사람이 더 무섭다."는 말도 있는데, 요즘 같아선 '알고리즘의 벽에 갇힌 사람'도 이 무서운 사람에 충분히 포함될 수 있을 것만 같다.


출처 - Adobe Stock


 수많은 사람들이 알고리즘의 벽에 갇혀 자기 관심사 밖의 것을 보지 못한다. 그렇지만 나는 알고리즘의 벽 안에 갇혀있고 싶지 않다. 저 무서운 말들의 살아있는 예시가 되고 싶지 않다. 그래서 나는 아주 가끔씩이나마 알고리즘의 벽을 넘기 위한 일탈을 시도한다. (내 생각과 다르게 보도하더라도) 채널을 바꿔가며 뉴스를 본다거나, 다른 사람들은 유튜브로 무엇을 보는지 묻고 괜히 한번 찾아보는 식이다. 그렇게 내가 기존에 즐겨 찾던 것들과 다른 무언가를 한 번씩 첨가하다 보면 기존 알고리즘에서는 추천되지 않던 전혀 새로운 콘텐츠들이 추천되기도 한다. 재미는 당연히 없을 것이다. 내가 좋아하던 것들과 전혀 다른 내용일 테니까. 하지만 때로는 보고 싶은 것만 볼 것이 아니라 보이는 것을 온전히 보기 위한 노력도 필요하다. 분명 그럴 것이다.

작가의 이전글 임원의 시간, 직원의 시간
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari