포털의 뉴스 추천 알고리듬
이 얘기는 기술적으로 조금 복잡한게 사실이다. 그런게 있구나 정도로만 들어줘도 된다.
뉴스 배열에 관해 알고리듬을 쓴다면 그건 추천 알고리듬일 가능성이 크다. 크게 내용 기반 필터링과 협업 필터링으로 나눌 수 있다. 내용 기반은 이 기사가 스포츠 기사다, 정치 기사다, 사회 기사다 하는 식으로 분류하고 거기 맞춰서 추천을 해주는 것이다. 협업 필터링은 ‘최근접 이웃기반’과 ‘잠재요인’ 기반으로 나눌 수 있다. 최근접 이웃 기반은 다시 ‘상품 기반’과 ‘사용자 기반’으로 나눌 수 있다. 그러니까 이 상품을 산 사람이 같이 산 상품을 추천한다 이게 상품 기반이다. 너랑 비슷한 사람이 이런 상품을 주로 사더라, 이게 사용자 기반이다. 잠재요인 기반은 숨겨진 패턴을 찾아서 ‘너 이거 좋아할거야’라고 알려주는 것이다.
최근 들어 포털의 뉴스 추천 알고리듬의 편향성이 이슈가 되고 있다. 네이버와 다음이 모두 알고리듬으로 자동으로 추천을 할 뿐, ‘사람이 관여하고 있지 않다’고 밝히고 있다. 이게 가능한 얘기인가부터 짚어보자.
인공지능으로 고양이를 인식할 수 있게 학습을 시킨다고 해보자. 내가 가지고 있는 모든 고양이 사진을 다 인공지능을 학습시키는데 넣어선 안된다. 그중 일부를 검증용으로 따로 빼놓아야 한다. 그래야 학습이 끝난 다음, 따로 빼둔 사진을 이용해서 진짜 인식을 제대로 하는지 검증을 할 수 있다. 예를 들어 20만장의 고양이 사진을 갖고 있다면, 그중 14만장쯤을 학습에 쓰고, 6만장을 검증에 쓰는 식이다. 모든 사진을 학습하는데 넣어버리면 당연히 미리 학습한 사진들에 대해선 인식을 잘 할 수 밖에 없기 때문이다.
뉴스 추천도 마찬가지다. 인공지능에 의한 추천이 공정한 것인지를 확인하려면, ‘공정하게 추천하면 이런 모습일거야’라는 모델이 있어야 한다. 비교 셋이 있어야 추천 결과가 정확한지를 검증할 수 있을 것이다. 이 모델은 누가 만드나? 결국 사람이 하는 일이다. ‘사람이 관여하고 있지 않다’는 류의 말은 기술을 하는 사람이 함부로 해선 안되는 말중에 하나다. 아마도 그 말을 한 사람은 엔지니어가 아닐 것이다.
MBC의 시사보도 프로그램 <스트레이트>는 취재 결과 네이버와 다음의 뉴스 노출이 명백히 편향됐다고 지적한다. 다음쪽에서는 “편중 현상에 대해 인지는하고 있다”라고 시인을 했지만, “구체적인 알고리듬 개편 계획을 가지고 있지는 않다”고 밝혔다. 이상한 말이다.
네이버를 보자. MBC 취재진이 보수성향 아이디와 진보성향 아이디를 각각 새로 생성해 네이버 알고리즘으로 학습시켜본 결과, 보수 성향 아이디는 중앙일보 기사를 가장 많이 추천했고, 2위 연합뉴스, 3위 KBS, 4위 조선일보, 5위 YTN 순이었다. 그런데 진보성향 아이디로 학습한 결과가 이상했다고 취재진은 밝혔다. MBC 취재진이 진보성향 아이디로는 경향신문과 한겨레 기사 외에 그 어떤 기사를 클릭한 적이 없었는데도 네이버는 연합뉴스의 기사를 가장 많이 보여줬고, 2위와 3위는 보수언론인 중앙일보와 조선일보 기사, 그 뒤로 지상파 방송 기사가 추천됐다고 한다. 이러니 추천알고리듬의 작동원리상 의문을 제시할만 하다는 것이다. 이 기사를 본 사람이 많이 본 기사든, 당신과 비슷한 사람이 많이 본 기사든 이전에 본 것과 비슷하게 나와야 타당하지 않느냐고 의문을 제기할만 하다는 것이다.
미국 연방거래위원회가 발표한 ‘기업이 인공지능 기술을 개발하는 과정에서 어떻게 진실성, 공정성, 형평성을 추구해야 할 것인지에 관한 지침’에는 이렇게 돼 있다.
△인공지능 모형을 적용한 결과 불공정하거나 차별적 상황이 발생하지는 않는지에 대한 모니터링
△투명성과 개방성의 확보
△개별 기업이 자신의 인공지능 기술이 공정하다거나 편향이 없는 결과를 가져온다는 식의 과장된 언급을 함부로 하지 않도록 주의
△문제가 발생하면 책임을 질 준비를 할 것 등이다.
다음과 네이버 모두 이 지침을 어기고 있다는 것을 알 수 있다. 자신의 인공지능 기술이 공정하다거나 편향이 없는 결과를 가져온다는 식의 과장된 언급을 하면 안된다는 것도 어겼고, 이런 경우에 입증 책임을 기업이 져야 한다는 것도 제대로 하지 않았다. 투명성과 개방성을 확보해야한다는 것은, 같은 조건에서 실험을 실시해 알고리듬이 공정하다는 것을 입증할 책임을 진다는 뜻이다. 비교 데이터셋에 대해서도 밝히는게 옳고, 불공정한 상황이 발생하는지 여부에 대한 모니터링도 기업의 책임이다. 그런 점에서 편향성을 알고 있지만 고칠 계획은 없다는 다음쪽 반응은 있어서는 안될 일이다.
해외는 어떻게 하고 있을까?
구글은 일찌기 2017년부터 ‘왓-이프 툴(WIT·What-If Tool)’을 개발해 오픈소스로 공개하고 있다. 일부 데이터가 바뀌면 결과값은 어떻게 변할까를그래픽으로 표현해준다. 가령 채용 AI에 입력된 한 지원자의 정보에서 성별을 남성에서 여성으로 바꿔보거나, 나이를 20세에서 50세로 바꾸면, 성별과 나이가 합격과 불합격을 가르는 데 불공정한 영향을 얼마나 끼치는지가 도표로 표시된다. 이렇게 해서 불공정한 요소들을 사전에 걸러내는데 도움을 받을 수 있다.
IBM은 2018년에 ‘AI 공정성(Fairness) 360’이라는 툴키트(소프트웨어 개발 도구 모음)를 내놨다. 역시 아무나 쓸 수 있는 오픈소스다. 이 툴키트는편향을 완화할 수 있는 10가지 알고리즘을 포함하고 있다.
마이크로소프트의 자회사인 링크드인은 AI의 편향성을 해결할 수 있는 도구(LiFT)를 역시 오픈소스로 공개했다. LiFT는 데이터 세트의 편향성과 AI 모델의통계적 공정성을 검증할 수 있는 도구다.
인공지능 알고리듬을 쓸 때는 거기에 따른 윤리적 책임을 반드시 함께 져야 한다. 네이버와 다음은 이런 점에서 아주 기본적인 룰을 지키지 못하고 있다고 할 수 있다.
알고리듬으로 뉴스를 추천하는게 옳은가, 에코챔버와 필터 버블
두번째 이야기다.
뉴스를 알고리듬으로 추천하는게 옳은가? 하는 질문이다.
에코 챔버와 필터 버블 현상이라는게 있다. 에코챔버는 반향실, 그러니까 소리가 메아리로 계속 울리게 만든 방을 말한다. 이런 방에서는 똑같은 소리만 계속 듣게 된다. 필터 버블은 사용자에게 맞게 필터링된 정보가 마치 거품(버블)처럼 사용자를 가둬버린 현상을 말한다. 포털이 인공지능 알고리듬을 이용해 맞춤정보만 제공하면서 그외의 정보에는 아예 접근할 경로가 사라지게 되는 것을 말한다.
계속해서 보고 싶은 뉴스만 볼 때 에코 챔버 현상이, 계속해서 맞춤 정보만 보게 될 때 필터 버블이 생긴다. 필터 버블은 사용자의 관심에 부합하는 맞춤형 정보만을 제공함으로써 얻게 되는 수익의 창출이 가장 큰 목적이다
둘 다 이른바 '확증편향', 즉 믿고 싶은 것만 믿고, 보고 싶은 것만 보며, 듣고 싶은 것만 듣게 만드는 인지 편향을 더욱 강화시키는 주요 원인이 된다. 그 결과 전 사회의 양극화와 급진화를 부추긴다. 예를 들어 카톡으로 하루에도 수십 번씩 백신을 맞고 다리가 터졌다는 둥, 백신 맞고 60일 뒤에 죽었다는 둥 가짜 뉴스를 접한 노인 분들이 백신의 부작용에 대해 확신을 갖게 되는 것이 그런 경우다. 세계적으로도 에코챔버와 필터버블 현상에 따른 사회적 양극화, 갈등의 고조가 심각한 사회 문제로 떠오르고 있다. 트럼프 대통령의 트위터만 보고 의사당을 점거하려고 했던 극우백인집단이 그런 경우다.
그래서 네이버와 다음이 인공지능 알고리듬으로 뉴스를 추천하는게 과연 옳은가?라는 근본적인 질문이 나타나게 되는 것이다. 그 알고리듬이 에코 챔버와 필터 버블을 어떻게 막을 수 있는가?라는 질문에 두 포털은 대답할 자세를 가져야 한다. 왜냐하면 인공지능 모형을 적용한 결과 불공정하거나 차별적 상황이 발생하지는 않는지에 대해 모니터링을 하고, 투명성과 개방성을 확보하며, 문제가 발생하면 책임을 질 준비를 해야 하기 때문이다. 인공지능을 쓰는 기업의 당연한 책무다.
숨겨진 악마의 알고리듬, 광고수익 배분기준
세번 째, 그리고 가장 중요하지만 제대로 다뤄지지 않고 있는 알고리듬이 남아 있다.
네이버와 다음이 언론사에 수익을 지급하는 알고리듬이 그것이다. 두 포털은 기본적으로 클릭을 많이 받은 언론사에게 더 많은 돈을 준다. 클릭 수와 기사량 그리고 구독자 증가 등을 기준으로 하는데, 50% 이상이 클릭 수에 연동이 된다. 그러니까 이 알고리듬의 전제는 클릭수가 많은 기사가 좋은 기사고, 더 많은 기사를 생산할수록 좋은 언론사라는 것이다.
그 결과는? 한국의 모든 언론사가 사실은 포털을 위한 미끼상품 제작사로 복무를 하고 있다. 클릭을 조금이라도 높이기 위해 매시간 기사를 내보내고, 제목 앞에 ‘충격’이니 ‘헉’이니 ‘경악’이니 선정적인 문패를 붙인다. 하루 종일 쉴 틈도 없이 포털이라는 쇼핑몰에 들어갈 인형 눈을 붙이고 있는 것이다. 깊이 있는 취재를 할 틈도, 가짜 뉴스가 아닌지 팩트 체크를 할 시간도 없다.
포털이 뉴스를 공급하는 이유는 하나다. 뉴스라는 ‘미끼 상품’으로 트래픽을 올려 쇼핑 등에서 더 많은 부가가치를 올리겠다는 것이다. 그러니 더 많은 클릭이 포털의 제1가치인 것은 지극히 당연하다. 뉴스의 가치는 처음부터 고려대상이 아니다. 게다가 극소수인 CP제휴사들만 자격을 얻는다. 다양성과 공공성을 처음부터 제약하는 구조다. 생태계를 척박하게 하는 요소를 여럿 갖추고 있는 셈이다.
이런 끔찍한 알고리듬을 그대로 두는게 옳은가? 이런 머저리같은 알고리듬때문에 전 국민이 비용을 치르는 현실을 그대로 둬서 되겠는가?가 우리가 진짜 물어야 할 질문이다. 네이버가 한해 언론사에게 지불하는 돈이 3천억쯤 된다고 한다. 한국 정부의 예산이 본예산만 한해 538조다. 제대로 된 언론, 클릭 숫자에 영혼을 팔지 않아도 되는 언론을 지원하는데 이 정도의 돈은 쓸 수 있지 않을까? 한국 사회의 다음 세대를 위해서라도.
문제를 정의하는게 먼저다
나에게 1시간이 주어진다면 55분은 그 문제를 정의하는데 쓰고, 나머지 5분동안 해결책을 찾겠다. – 알버트 아인슈타인.
문제를 정의하는 일이 무엇보다도 중요하다. 예를 들어 “저 식당 별로다”라는데 합의를 했다고 해보자. 막상 얘기를 들어보니 한 사람은 음식은 괜찮은데 불친절해서 싫다고 하고, 다른 이는 사람들은 착하고 좋은데 음식이 맛이 없다고 한다. 제대로 된 합의가 아니었던 것이다.
문제를 제대로 정의하고, 그 해결책이 갖춰야할 조건에 관해 합의하는 일을 먼저 해보자고 말씀을 드리고 싶다. 그렇게 해서 해결책이 집단지성으로부터 도출되게 하는 편이, 몇몇이서 머리 맞대고 어렵게 안을 만들어 심사를 받는 것보다 훨씬 지혜롭고, 결과적으로 시간도 적게 걸릴 것이다. 어떤 일이든 앞에 시간을 많이 쓰는게 끝에 가서 보면 가장 빠른 길일 때가 많다.
어떤 문제들이 있을까?
가장 큰 문제는 역시 포털의 이익 배분 알고리듬이다
클릭을 많이 받을수록, 기사를 많이 생산할수록 보상을 하는 성과보상체계가 한국의 언론 전체를 망치고 있다. 한국의 모든 기자들이 결과적으로 포털에 납품하는 인형의 눈알을 하루 종일, 일년 내내 붙이는데 복무하도록 만들고 있다. 그러니까 선정성과 다량생산이 기준인 한은 이런 보도행태를 바꿀 도리가 없다는 것이다. 예를 들어 네이버의 알고리듬은 최근성에 대해 조금 더 점수를 준다. 또 많은 기사가 생산되는 토픽에 대해 가산점을 준다. 그 결과, 누군가 클릭을 받을 법한 기사를 내놓으면 다른 모든 기자들이 비슷한 기사를 문장만 조금 바꿔서 소나기처럼 쏟아낸다. 그래야 첫페이지를 차지할 수 있기 때문이다. 모든 언론사들이 매일 새벽 3시마다 포털에 기사를 무더기로 밀어 넣기 위해 전력을 다한다. 그래야 대목인 아침 시간대 포털 뉴스 첫페이지를 한줄이라도 더 차지할 수 있기 때문이다.
이런 식의 기준이 기사를 평가하는 잣대가 되어버린 결과는 우리가 보는 대로다. 언론 신뢰도 세계 꼴찌.
세상의 소식을 빨리 그리고 제대로 듣고 싶어서, 세상에 대한 이해를 높이고 싶어서, 전세계가 돌아가는 사정을 알고 싶어서, 다양한 견해를 접해보려고 뉴스를 받아볼텐데, 결과적으로는 모두가 포털에 납품하는 인형눈알만 받아 들고 있는 셈이다.
여러 곳에서 피해자들이 나타난다
첫번째, 기자들이 피해자다
어떤 젊은 기자가 기레기 소리를 들으며 살고 싶을까. 기자가 되려고 했을 때 “나는 하루종일 인형 눈알을 붙이는게 너무 좋아”, “취재할 틈이 없어서 SNS에 나온 유명인사 발언을 무작정 베끼는 일을 하는게 내 인생의 꿈이었어”라고 생각했을 사람이 누가 있겠나?
IT 업계에서 ‘10년된 1년차 개발자’라는 말이 있다. 개발용역쪽에서 주로 생기는 현상이다. 단기 개발 프로젝트를 이곳 저곳 다니다보면 단기계약직에게는 책임있는 일을 주지 않는다. ‘설계한 대로만 코딩해주세요’라는 업무지시가 대부분이다. 그러니 맡게 되는 일이 뻔한데, 그런 일만 10년씩 한 개발자를 부르는 명칭이다. ‘10년된 1년차 개발자’.
박재영 고려대 교수, 허만섭 국민대 교수, 안수찬 전 한겨레 기자가 지난해 펴낸 '언론사 출입처 제도와 취재 관행 연구' 보고서 내용이 아주 흥미롭다.
한국 기자들이 보도자료에서 벗어나 다양한 취재원, 현장에서 기사를 발굴하지 못하는 이유를 기자들한테 물었다. 그랬더니 “몸이 하나니까, 시간이 없으니까”라고 답했다. “포털의 조회수를 중심으로 기사 경쟁이 벌어지는 상황에서 다른 언론이 주목하는 이슈를 자신들만 외면할 수는 없고, 기사는 시간마다 내놓아야 하니 자연스레 보도자료에 기대어 이른바 발표 기사를 쓰는 것에 길들여진다”는 것.
여기서 한국 언론 특유의 ‘뉴스 홍수’ 현상과 ‘뉴스 사막’ 현상이 함께 나타난다.
“출입처 기자들이 대동소이한 기사를 쏟아내는 ‘뉴스 홍수’ 현상과, 출입처 외의 다른 어떤 사안은 전혀 보도되지 않는 ‘뉴스 사막’ 현상이 발생하고 있다는 것.” 인터뷰에 응한 아사히 신문 카미야 타케시 기자는 “한국 와서 가장 놀란 게 보도자료다. 보도자료 원고가 기사 형식으로 나온다. 심지어 어떤 기자는 보도자료를 ‘복붙’해서 기사를 쓴다. 그게 기자인가”라고 묻기도 했다.
‘나와바리’와 ‘사스마와리’라는 잘못된 관행에서 벗어나지 못하는 경로의존적 발전도 이런 왜곡에 큰 기여를 한다. 출입처에 밀착하며 내부 제보자를 통해 얻은 결정적 고발이 ‘도꾸다네’ 즉 특종이라고 생각하는 개념부터 달라져야 한다. 이런 인식에서는 발굴 기사도, 기획 기사도 설 자리가 없다.
두 번째, 언론사도 피해자다
예전에 KT와 KTF가 둘로 나뉘어져 있을 때가 있었다. 그때 KT가 가장 힘들었던게 미래전략을 세울 수가 없다는 것이었다. 유선의 미래가 무선인데, 무선은 KTF가 가지고 있었기 때문이다. 통신회사가 모바일을 빼고 어떻게 미래를 그리지? 결국 무진 애를 써서 합병을 하는데 성공했다.
신문도 마찬가지다. 종이신문은 이제 사실상 아무도 읽지 않는다. 그런데 미래인 디지털은 네이버와 다음에 전적으로 내맡긴 상태다. 남은 것은 과거뿐. 그러니 미래는 외면한 채 어떻게든 광고단가를 유지하기 위해 아무도 받아보지 않을 종이신문을 밑도끝도없이 찍어서는 계란판으로 직행하게 만들고 있다.
디지털 전환을 성공적으로 수행한 모든 언론사들, BBC, NYT, WP들이 편집국의 한가운데 디지털부문을 배치하고 있다. 말하자면 ‘디지털 퍼스트’다. 예를 들어 뉴욕타임스. 일찌기 2013년 기업 정체성을 재정의했다. 마크 톰슨 전 뉴욕타임스 최고경영자(CEO)는 아예 뉴스 제작 방식을 뒤집었다. 종이신문을 제작한 뒤 온라인에 송출하는 방식 대신 스마트폰용 뉴스 상품을 먼저 만들어 웹사이트로 내보냈고, 이를 재분류해 종이신문을 제작했다.
조직의 방향을 바꾸고 인력도 충원했다. 디지털 전문가를 대거 끌어들였다. 페이스북, 구글, 마이크로소프트 등 대형 정보기술(IT) 기업 임원과 핀터레스트, 허핑턴포스트 같은 스타트업 등에서 수십 명을 팀장급으로 영입했다. 디지털 상품을 개발하는 인력만 700여 명. 구독자 성향을 파악해 질 좋은 콘텐츠를 제공할 전력들이다. “다른 부문은 다 줄여도 기술과 저널리즘에 대한 투자는 멈추지 않았던 뉴욕타임스만의 ‘담대한 원칙’이 성과를 냈다.”
뉴욕타임스의 '독보적인 저널리즘' 보고서는 결론을 이렇게 내렸다.
"우리는 페이지뷰(page view) 경쟁을 하거나 싸구려 광고를 팔려고 하지 않는다. 우리의 비즈니스 전략은 전 세계 수백만명이 기꺼이 비용을 지불하려고 하는 저널리즘을 강력하게 제공하는 '구독 최우선(subscription-first)' 회사이다."
톰슨 CEO는 “종이신문에 특화된 분업 방식을 벗어나, 부서간 경계를 넘어 일하는 통합 조직으로 사내 문화를 바꾸었다”며 “지금 NYT는 20대 후반이나 30대 초반 사원들이 고참 리더들에 신경쓰지 않고 상품개발과 기술 로드맵을 독자적으로 결정하는 조직이 됐다”고 말했다.
한국은? 한군데도 이렇게 하고 있는 곳이 없다. 어차피 네이버와 다음에 납품하면 그만이고, 광고수익도 나눠주니 자체적으로 투자할 동기도, 의지도, 능력도 부족한 것이다. 이렇다보니 자체적인 디지털역량은 한심한 수준이다. 개발자와 디자이너, 데이터 분석가는 신문사 안에서 여전히 2등시민 취급을 받는다. 정규직보다도 계약직이 더 많다. 그러니 뛰어난 개발자와 디자이너가 올 턱이 없다. 이때문에 당장 뉴스 트래픽을 포털에서 언론사로 몰아준다고 해도 서버가 감당을 못해 받지 못할 언론사가 태반이다. 현실을 굳이 외면하는 지연된 자살, 자신이 죽은 것을 모르는 좀비 처지다.
군림하는 것처럼 보이지만 포털도 사실은 피해자다
처음에 커나갈 때는 발판이 되고 좋았겠으나, 이제는 몸집이 너무 커졌다. 무엇보다 세상이 완전히 달라졌다. 세상의 모든 것을 소프트웨어가 집어삼키면서 온라인뱅킹, 모바일쇼핑, 결제, 웹툰, 배달, 자율주행차 등 포털이 할 수 있는 영역이 전방위로 펼쳐지고 있다. 전체 사업에서 기사 제공에 따른 수익이 차지하는 비중은 갈수록 줄어들고 있는데, 사회적 정치적 리스크는 갈수록 커진다. 언론시장은 성숙시장이다. 더구나 소셜미디어 환경속에서 매출은 정체되거나 줄어들고 있다. 포털이 한국시장에서 언론사가 되고 싶을까, AI와 소프트웨어 역량을 기반으로 세계시장으로 뻗어나가는 디지털 트랜스포메이션의 선두주자가 되고 싶을까?라고 물어보면 답이 자명할 것이다. 하지만 현실에선 포털은 기사 편집권, 게재권, CP 선발권과 광고수익을 한 손에 쥐고 있는 언론사의 언론사다. 이 사실을 부정할 순 없다. 포털의 딜레마다.
모두가 피해자, 왜곡된 구조
그러니까 이 왜곡된 구조에서는 누구도 이익을 보고 있지 못하다는게 핵심이다.
피해자는 많은데 아무도 이익을 보지 못한다. 잘못된 구조에서 모두가 고통을 받고 있는 현실이라는 뜻이다.
우리는 세계최고의 OLED TV로 세계최고의 BTS 공연을 본다. 세계 최고의 반도체와 세계 최고의 OLED로 만든 휴대전화를 쓰면서 세계 최고의 배터리로 만든 국산 전기차를 탄다. 바다에는 세계 최고의 조선소가 만든 배가 떠 있다. 세계 최고의 방역시스템으로 세계 최고의 경제성장율을 과시하고 있다. 코로나 이전으로 돌아간 유일한 선진국이다. 그런데, 왜 언론만 느닷없이 꼴찌가 되어 있을까? 우리나라 기자들이 그만큼이나 형편이 없어서? 우리나라 언론사가 그렇게 저질이어서? 그렇지 않다. 구조가 터무니없이 왜곡돼 있기 때문이다. 다른 데가 다 발전했는데, 유독 여기만 이러고 있을 이유가 없다. 이런 왜곡된 구조 속에선 모두가 피해자다. 바로 잡아서, 젊은 기자들도, 언론사들도, 포털도 본연의 일을 마음 편히 잘하게 만들어야 한다. 그래야 시민들도 비로소 나라의 수준에 걸맞는 언론을 가질 수가 있게 된다. 여기서 출발할 수 있다.
해결책이 갖춰야할 조건
그러므로 나타날 해결책은 다음과 같은 문제에 대한 해법을 가지고 있어야 할 것이다.
포털이 편집권, 게재권을 가지고 유사 언론 역할을 하게 해선 안된다. 클릭량과 기사 생산량이 언론사의 기사 제작 기준이 되게 방치해선 안된다.
에코챔버현상과 필터버블 현상을 막고, 사회의 양극화를 줄일 수 있어야 한다. 알고리듬을 써서 뉴스를 추천하는 경우는, 이런 위험성이 없다는 것이 명백할 때만 가능하다.
가짜 뉴스, 프라이버시 침해 등에 대해 시민들이 자신들을 보호할 수 있는 적절한 자구책, 제도적 방어책이 마련돼야 한다.
언론사들이 디지털 전환기에 자생력을 가질 수 있도록 도울 수 있어야 한다.
기자들이 온라인 뉴스공급의 물량 경쟁에 휘말리지 않고, 취재로 경쟁할 수 있는 여건을 만들어줄 수 있어야 한다.
시민들이 일방적인 뉴스에 휘둘리지 않고, 양질의 뉴스를 균형있게 공급받을 수 있어야 한다.
지금까지 나온 대안들
끝으로 지금까지 나온 몇개의 개선안들의 장단점을 짚어보자.
네이버·카카오의 '모바일 첫 화면에서 AI 기사 배열 페이지를 없애자'
이 안은 위의 조건들을 충족한다. 다만 현실적으로 보완해야할 점이 있다. 기사를 아웃링크로, 즉 포털에서 보는 대신에 링크를 타고 그 언론사의 홈페이지에 가서 보게 할 때 상당수 언론사들이 트래픽을 견디지 못할 거라는 것이다. 네이버가 아웃링크를 채택한 적이 있었다. 갑자기 퍼붓는 트래픽을 감당하지 못해 서버가 뻗어버린 언론사들이 많았다. 대부분의 언론사들이 자체 개발능력이 모자라거나 없다. 과도기 동안 언론사들이 자생력을 기를 수 있게 도와줘야 한다. 기술적으로 다양한 방안을 찾을 수 있을 것이다. 이게 없으면 이 안은 탁상공론이 되어버릴 가능성이 크다.
- 뉴스 검색 알고리듬을 해마다 과기정통부장관과 방통위원장에게 제출해야 한다
알고리듬을 공개하면 그 규칙에 맞춘 어뷰즈가 틀림없이 나타난다. 득보다 실이 훨씬 많다. 앞에서 말했듯 최근성과 토픽성에 가산점을 준다는게 밝혀지자, 뉴스의 홍수, 베껴쓰기의 불지옥이 펼쳐졌다. 부작용이 수십 배 큰 안이다.
알고리듬이 공정하다는걸 밝힐 책임은 포털쪽에 있다. ‘알고리듬의 공정성을 확인하기 위해 이러이러한 조처를 취하고 있고, 이러이러한 기사 데이터셋을 사용해 이러이러한 방식으로 검증을 하고 있으며, 그 검증 결과는 다음과 같다’는 내용이 담긴 리포트를 포털이 발표하게 하면 된다. 알고리듬을 공개하는 대신, 이런 리포트를 공개하면 우리 사회의 수많은 시빅 해커들이 집단지성의 힘으로 검증을 해줄 수 있다. 시간도 얼마 안 걸릴 일이다.
- 기사배열 책임자 및 기준을 공개하고, 문체부 소속 뉴스포털이용자위원회에서 검증하며, 시정요구 미이행시 과태료·발행정지
기사 배열 기준과 책임자 공개는 여전히 포털의 편집권과 게재권을 인정하는 행위다. 위에서 말한 해결책이 갖춰야 할 조건 대부분을 충족하지 못한다.