알고리즘이 자본의 도구가 된다면?

4차 산업혁명, 어디로? 기술 사회의 비판적 상상력 토론회 토론문.

Jun 28. 2017

4차 산업혁명을 주제로 토론회가 열린다고 해서 이건 또 뭔 산으로 가는 토론회냐, 이런 생각을 했습니다. 그렇지만 이광석 교수님의 발표문을 읽어 보니, 맹목적인 4차 산업혁명 담론을 넘어 기술인권에 대한 전방위적 논의가 필요한 시점이라는 주장은 시의적절한 화두라고 생각합니다.

저는 4차 산업혁명이라고 부르는 일련의 변화가 언론에 미치는 영향, 그리고 우리 사회의 여론 형성에 미치는 영향, 그리고 정보의 투명성에 대해 이야기해 보겠습니다.

미디어 업계에서 변화의 방향을 세 가지로 정리해 봤는데요.

첫째, 뉴스 생산 차원에서는 알고리즘 저널리즘(이른바 로봇 저널리즘)과

둘째, 언론사 입장에서는 독자 데이터 분석,

셋째, 뉴스 플랫폼에서는 인공지능과 개인화가 중요한 키워드라고 생각합니다.

뉴스의 생산 방식과 유통 방식을 바꿔놓고 무엇보다도 우리 사회의 아젠다 지형을 바꿔놓을 중요한 변화가 시작되고 있다고 생각합니다. 이광석 교수님 말씀처럼 시민 사회에 어떤 영향을 미칠까, 우리가 무엇을 할 수 있을까에 대한 고민이 필요하다고 생각합니다.

앞서 말씀드린 세 가지 방향을 살펴보겠습니다.

먼저 알고리즘 저널리즘의 방향은 크게 두 가지라고 생각하는데.
첫째, 사람이 하기 너무 단순하거나 투자 대비 효용이 크지 않은 단순 노가다인 것들,
그리고 둘째, 사람이 할 수 없는 것, 사람이 보지 못하는 것들.
그런데 지금 로봇 저널리즘에 대한 논의는 첫 번째를 중심으로 진행되고 있는 것 같습니다.

증권 시황과 야구 경기 중계 등은 아직까지 단순히 기사를 생성하는 단계에 그치고 있죠. 템플리트에 기반해 팩터를 끼워넣는 방식의 기사 작성 알고리즘이 대부분인데요. 주가, 환율, 날씨, 지진 속보. 이런 기사들은 대부분 애초에 가치가 높지 않고 이게 사실 기술 자체로는 대단한 게 아닙니다. 정보를 보여주는 데 그치고 있는 것이죠. 사실 주가 기사는 그냥 문장으로 만들지 않아도 지표와 그래프가 더 정확하고 알기 쉽지 않나. 날씨 기사도 마찬가지. 시간대별 날씨 인포그래픽만 있으면 충분하죠.

알고리즘 저널리즘이라기 보다는 자동으로 문장을 구성하는 정도에 그치고 있습니다. 알고리즘 온리 기사에 우와 멋지다, 감탄하고 있는 단계가 아닐까 하는 생각이 듭니다. 이건 오해거나 아주 단편적인 접근이라고 생각하고요.

알고리즘 저널리즘에서 고민할 부분은 단순히 기사 작성을 넘어 문제를 파악하고 메시지와 아젠다를 형성하는 단계로 갈 거라는 겁니다. 알고리즘 온리가 아니라 알고리즘의 도움으로 저널리즘의 영역을 확장하거나 인공지능과 저널리스트와 협업으로 시너지를 일으킬 수 있을 거라는 거죠.

알고리즘 저널리즘의 다음 단계는 뭘까요. 좀 더 빨리 좀 더 정확한 기사를 만들어 내는 것. 그리고 표준화된 기사 양식을 만드는 것, 이런 것들은 기존 인력을 일부 대체하는 정도, 새로운 가치를 창출하기는 어려울 거라고 봅니다.

그렇지만 여기서 좀 더 나가서 퍼스널라이제이션과 인터랙션 단계로 가고, 기사에 메타 데이터를 집어넣고 구조화하면서 기사를 작성하는 게 아니라 클릭하는 순간 기사를 생성하는 단계로 가게 될 거고요. 100명의 사람들에게 각각 다른 기사를 보여주고 다른 세계관을 형성하게 될 겁니다. 이것도 필터 버블이나 에코 체임버나 상당히 우려스러운 현상입니다만. 이건 충분히 문제제기가 됐고 제가 이야기하고 싶은 건 좀 다른 측면입니다.

기사 생산 측면에서는 그동안 사람이 보지 못하는 것들을 찾아내고 만들어내는 단계로 가게 될 거라고 봅니다. 기술과 저널리스트의 협업은 굉장히 많은 가능성을 만들어 낼 거라고 봅니다. 제가 하고 싶은 건 모든 공공 데이터 베이스를 집어넣고 생성되는 즉시 API로 불러와서 자동으로 데이터를 업데이트하면서 특이점이 발생할 때 그걸 알람을 보내는 거죠. 해석은 사람이 하겠지만. 이런 걸 알고리즘이 해결해 주면 좋겠다는 생각이 듭니다.

어느 회사의 부사장이 주식을 팔았다거나 어느 회사가 브라질에서 매출이 발생했다거나 또는 태국 환율이 오르면 어느 기업이 어느 정도 이익을 보게 될 거라나 등등 모든 정보들을 교차 분석해서 새로운 데이터를 끌어내는 것. 사람이 우연히 발견하는 데는 한계가 있을 수밖에 없지만 그걸 기계가 풀타임 스크리닝을 하면서 기사 거리 수백만 개를 토해내는 거죠. 어느 지역에서 조산아 발생률이 갑자기 높아졌다거나 어느 지역에서 학생들 수학 실력이 떨어졌다거나. 그런데 이것과 소득 수준이 상관 관계가 있는 것으로 추론된다거나 등등의 데이터를 기계가 발견할 수 있게 될 겁니다.

기계가 기사를 쓰고 인간 기자가 잘릴 거라는 주장은 현실성이 없다고 보고요. 사람이 할 수 있는 일이 더 늘어나겠죠. 기계가 가설을 내면 그걸 검증하고 확인 취재하는 건 사람의 몫이겠죠. 데이터 저널리즘과 결합해서 부동산 가격을 예측한다거나, 상관관계를 짚어낸다거나. 데이터에 기반한 탐사 보도도 가능할 거고요.

물론 부패한 권력에 맞서는 언론의 감시와 비판, 폭로 역할을 알고리즘이 대체할 수는 없을 거고요. 단순 팩트 전달보다는 관점과 주장이 갈수록 더욱 중요한 역할이 될 거라고 생각합니다. 단순 사실 전달은 알고리즘에 넘겨주고 해석과 의미 부여가 중요한 영역으로 남게 될 텐데요.

괴짜 경제학이란 책에 나오는 이야기인데 일본의 스모 경기에서 7승7패인 선수와 8승6패인 선수가 붙었을 때 7승7패인 선수가 이길 확률이 비정상적으로 높다는 사실을 발견했습니다. 80%나 됐죠. 이 두 사람이 다음 경기에서 만났을 때는 40%로 줄었고요. 일부러 져주고 다음 경기에서 또 상대방에서 경기를 양보한다는 것이죠. 이게 일본에서는 엄청난 승부조작 스캔들로 논란이 됐었는데요.

스티븐 래빗은 우연히 이런 사건을 발견했지만 만약 발견을 못했다면 영원히 묻혔을지도 모릅니다. 그런데 알고리즘 저널리즘이 확산되면 기계가 이런 현상을 발견하고 신호를 줄 수 있을 거라고 생각합니다. 이건 뭔가 이상하다 뭔가 특이하다는 걸 계속해서 찾아내는 거죠.

알고리즘 저널리즘의 영역은 발생 사건이 아니라 사건 이면의 맥락과 작동 방식에 대한 고발이 될 것입니다. 왜 이런 일이 벌어지는 것일까, 이게 과거에는 정의로운 기자들의 탐사 보도로 파헤쳐졌다면 이제는 알고리즘이 수천억 건의 데이터를 뒤져서 상관 관계를 밝혀내고 본질을 드러내게 될 거라는 겁니다. 여전히 기자의 역할이 있겠지만 경향성을 파악하고 확률을 파고드는 건 사람의 영역이 아닐 수도 있습니다. 매우 어렵거나 효율이 낮겠죠.

문제는 알고리즘 저널리즘 역시 굉장히 많은 자본과 고도의 기술 투자가 필요하기 때문에
알고리즘 저널리즘이 발전하면 할수록 격차도 커질 거고요. 그게 공공의 이해 보다는 자본의 이해에 복무할 가능성이 커지고, 오히려 폐쇄된 유료독자들에게만 공개되거나 아예 주문형 상품으로 전락할 가능성이 커진다는 거죠. 삼성경제연구소가 몇 년 전부터 보고서를 공개하지 않는 것처럼 알고리즘 저널리즘이 자본의 도구로 전락할 가능성도 있다고 봅니다.

두 번째는 독자 데이터 분석입니다.

이제 뉴스를 선형으로 소비하지 않습니다. 뉴스 브랜드와 패키지가 해체되고 있고 뉴스가 파편적으로 소비됩니다. 뉴스가 독자들을 찾아가지 않으면 영향력을 확보할 수 없는 시대가 된 것이죠.

이제 뉴스도 상품이고 독자들이 원하는 걸 제공해줘야 하는 시대가 된 것입니다. 많은 미디어 기업들이 웹 사이트에 트래킹 툴을 달기 시작했고 어디서 유입돼서 어디로 가는지, 이 사람이 어디까지 스크롤을 하고 어느 지점에서 창을 닫고 나가는지 등등을 추적하고 IP 기반으로 데이터를 누적합니다. 나의 정치적 취향과 어떤 이슈를 선호하고 관심을 갖는지 조선일보나 한겨레가 나보다 나를 더 잘 알게 되는 것이죠.

내가 원하는 기사를 던져준다는 건 굉장히 효율적이고 만족도가 높은 콘텐츠 유통 방식이라고 할 수 있지만 언론사와 특히 저널리스트 입장에서는 진짜 중요한 기사를 독자들에게 노출하기가 더 어려워지게 된다는 겁니다.

우리가 중요하다고 생각하는 기사와 독자들이 읽고 싶은 기사가 일치하지 않을 때, 이걸 어떻게 극복할 수 있는지에 대한 고민이 이뤄지지 않고 있습니다. 어떻게 해야 더 많이 읽게 만들고 어떻게 해야 독자들이 다시 찾아오게 만들 것인가에 대한 고민에 투자를 하고 기술 개발을 하는 것이죠.

언론사도 이제 장치 산업으로 가고 있다고 생각합니다. 좋은 기사를 만드는 것도 물론 중요한데 그 기사를 유통하는 전략이 부족하다면 독자들에게 다가갈 수가 없습니다. 데이터에 투자를 하는 언론사가 영향력을 갖게 될 거라는 거죠.

세 번째, 유통 플랫폼의 문제와 연결되는데요.

다음이 첫 화면에 루빅스라는 뉴스 추천 시스템을 도입했습니다. 한국에서 하루 3만개 정도의 기사가 포털에 들어오는데. 독자들의 선택에 따라 뉴스 풀이 생성되고 루빅스가 파악한 독자의 성향에 따라 첫 화면의 뉴스 배열이 달라진다는 겁니다.

다음이 루빅스 알고리즘에 대한 논문을 공개했는데 핵심은 멀티 암드 밴딧이라는 알고리즘입니다. 슬롯머신의 승률을 높이기 위한 실험 방법인데요. 어떤 기사를 보여줬을 때 클릭률이 가장 높은지, 그리고 가장 체류시간이 긴지 등을 계속해서 실험과 수정 업데이트를 통해 확률을 높여가는 방식입니다. 집단지성과 인공지능의 결합이라고 할 수 있을 텐데요.

이런 시스템에서는 정말 재밌는 기사가 많고 내가 좋아하는 뉴스가 쭉 떠 있기 때문에 독자들의 만족도가 높겠죠. 그렇지만 알고리즘이 추천하는 이런 뉴스가 과연 진짜 필요한 뉴스인가 저는 의문을 갖고 있습니다.

다음과 네이버가 맞춤형 뉴스라는 걸 시작한 건 이미 점유율이 너무 높고 첫 화면에 어떤 뉴스를 걸어두느냐에 따라 여론이 요동을 치기 때문입니다. 기사 하나를 1000만명, 2000만명이 보게 되는 거죠. 편향성 논란이 끊이지 않고요. 그래서 최대한 뉴스를 분산시킬 정치적인 필요도 작동하고 있다고 봅니다. 그렇지만 포털의 뉴스 추천 알고리즘이 작동하는 원리는 철저하게 상업적입니다. 더 많이 읽고 더 오래 머물고 결과적으로 더 많은 광고를 클릭하게 하기 위해 뉴스를 미끼 상품으로 쓰는 것이죠.

이런 시스템에서는 독자들이 빠져나갈 수 없게 됩니다. 콘텐츠를 생산해서 포털에 납품하는 미디어 기업과 인공지능과 데이터 분석으로 최적화된 개인화 유통 플랫폼을 구축한 포털과의 경쟁은 갈수록 격차가 커질 것입니다. 이건 과거 네이버는 평정됐고 다음은 손 봐야 한다는 시절의 포털의 정치적 편향 논란과는 또 다른 문제라고 생각합니다.

또 다른 측면에서는 음성인식 시장에서 영어권과 비영어권의 격차가 커질 거라는 우려도 있습니다. 당장 KT와 SK텔레콤이 인공지능 스피커를 만들었지만 콘텐츠가 없기 때문에 네이버와 다음을 따라잡을 수 없죠. 구글을 따라잡기 어려울 거고요. 네이버가 어제 1000억원을 주고 인공지능 관련 연구소를 인수했다는 소식도 중요하게 살펴볼 뉴스라고 생각합니다.

구글이나 아마존에게 뉴스를 읽어달라고 할 때 어떤 뉴스를 읽어줄 것이냐도 중요한 쟁점이 될 거라고 봅니다. 인공지능 기술이 엄청난 진입 장벽을 만들 거고요. 이런 플랫폼 사업자들에 의존과 종속이 심화될 가능성이 큽니다.

한국에서는 언론사들이 결코 포털을 이길 수 없습니다. 단순히 필터 버블의 문제가 아니라 여론의 편향과 독점, 또는 여론의 왜곡 가능성을 경계해야 한다고 생각합니다. 네이버와 다음, 그리고 구글과 페이스북도 마찬가지고요. 과연 콘텐츠의 생성과 유통을 지배하는 이런 테크 공룡들이 공적인 플랫폼으로서 책무를 다하고 있는가. 중립을 지키고 있는가. 네이버와 다음이 확보한 우리의 데이터를 영리적인 목적으로 활용하는 것이 과연 바람직한가. 네이버와 다음을 과연 누가 감시하고 견제할 것인가 하는 문제가 중요한 과제라고 생각합니다.

keyword

작가의 이전글“글로벌 미디어의 고민” 집담회에 초대합니다.문빠는 2008년부터 존재했다? 작가의 다음글