AI와 성범죄를 글로 풀 때 어려움
언제나 그랬듯 쉬운 건 없다
사진=픽사베이주제를 정할 때 스스로 던지는 질문이 있다. '지금 뭐가 중요할까', '어떤 글을 써야 세상에 도움될까?'. 기자로 일할 때는 늘 강박적으로 하는 고민. 특히 언론은 시의성 있고, 우리 사회에 중요한 뉴스를 다뤄야 한다. 최대한 많은 사람의 이해관계가 걸려있는지도 중요하다. 그만큼 영향력이 큰 사안이란 의미니까. 공적 이슈가 그렇다. 이건 모든 사람에게 영향을 미치니까. 우리 사회에서 가장 중요한 인물과 관련된 소식인지도 중요하다. 대통령이나 국회의원, 정치인, 경제인이 여기에 해당한다. 그들도 우리 사회에 큰 영향을 끼치니까.
기술 작가로 글을 쓸 때도 이 고민은 마찬가지다. 기술이 의미로 전달됐으면 하는 까닭도 있지만. 기술이라는 게 문제를 해결하는 수단으로 활용하니까. 그게 창업으로 이어지기도 하고. 새로운 서비스도 그런 맥락에서 탄생한다. 그렇다면 현재 우리 사회에서 기술로 시급히 해결해야 할 문제는 뭘까. 여러 가지다. 그중에서 우선순위를 정하는 게 쉽지 않지만. 이번 주제를 정할 때 그 고민을 좀 더 많이 했다. 인공지능을 주제로 쓸 수 있는 주제는 다양하다. 근데 이게 당장 우리 사회에 시급하고 중요한 주제일까? 확신이 서지 않는 게 많았다.
그럴 때 유용한 방식은- AI와 최근 사회 현안을 연결 지어 보는 것. 생뚱맞은 것도 있을 수 있지만 의외로 잘 맞물리는 주제도 있다. 얼마 전 마감한 글 주제인 'AI로 성범죄에 대처하는 방법'이 그랬다. 주제를 선정할 무렵, 나라를 떠들썩하게 한 그 사건이 한창 언론 보도를 장식했다. 지금은 그로부터 한 달이 지나서 조용해진 듯하다만. 근데 올해는 비단 그 사건이 아니라도 연초부터 성범죄 이슈로 온 나라가 떠들썩했다. N번방 사건이 대표적이고. 이와 비슷한 또 다른 이슈도 많은 이의 공분을 샀다. 딥페이크, 다크 웹 문제도 심각하고.
사진=픽사베이디지털 성범죄, 권력형 성범죄 논란은 올해에만 있었던 일은 아니다. 매년 이슈가 되고 있다. 머신러닝에 쓸 데이터가 폭증한 덕분에 요즘 같은 AI 황금기가 없었다면. 발전한 그 AI는 당연히 이런 문제를 해결하는 데 쓰여야 한다. 이 시점에서 그 활용도를 고민한다면 당연히 성범죄 문제라고 생각했다. 그렇다면 얼마나 활용되고 있을까? 국내에서는 지난해 법무부와 과학기술정보통신부, 여성가족부에서 시범적으로 이를 도입하기 시작했다. 관련 기술을 개발하거나 이미 서비스 운영에 활용하는 기술 기업도 있다.
난 그림을 먼저 그리고 싶었다. N번방 논란 이후, 기술로 성범죄 문제에 대처하는 방식을 다룬 기사가 좀 나왔다. 거기에 맞춰 자료를 낸 걸로 보이는 기업도 엿보였다. 내가 봤을 때 기사는 대동소이했다. 나왔던 이야기를 반복하거나. 여러 가지 기술을 활용한 사례이기도 하고. AI만 파고든 기사는 잘 보이지 않았다. 기사뿐만 아니라 다른 글도. 그러면 내가 먼저 써야지. 조사해보니 국내에 많이 알려지지 않은 해법(?)도 여럿 있었다. AI만 파고들어서 이걸로 성범죄에 대처하는 방식을 글로 쓰면? 차별화할 수 있겠다는 생각이 들었다.
이건 코로나 대유행 상황과도 연관이 있다고 봤다. 주제 선정과정에서 이걸 고려한 건 아니다. 자료 조사과정에서 깨달은 부분인데. 코로나 대유행 이후, 봉쇄 조치가 이뤄지면서 아동 성착취 우려가 해외에서는 높았다. 미성년자는 자기 방어능력이 성인보다 부족하기 때문에 범죄에 노출됐을 때를 대비해 철저히 보호해야 한다. 그러나 봉쇄 조치 이후, 이들이 집에서 인터넷하는 시간도 전보다 늘다 보니 이들을 노리는 검은 손에게 더 노출될 위험이 커졌다는 우려가 있었다. 관련 콘텐츠 신고가 늘었다고도 하고. 이를 신고하는 성인도 많다고.
사진=픽사베이통신매체 이용 음란행위가 디지털 성범죄 전부는 아니지만. 검찰청과 형사정책연구원에서 내는 분기별 범죄 통계를 봐도- 1분기 통신매체 이용 음란 행위가 두 자릿수 증가했다. 전체 성폭력 범죄 증가율은 한자릿수인데 증가폭이 그걸 훨씬 뛰어넘는다. AI, 클라우드, 다크 웹은 인터넷에서 음란물을 만들고 유포하는 절차를 더 쉽게 만들었다. 2018년 뉴욕타임스 기사를 보면 기술 기업에서 확인한 아동 성착취 콘텐츠가 최근 기하급수적으로 늘고 있고. 기술이 문제를 확산하는 데 영향을 끼쳤다면 이 문제를 해결하는 데에도 기여해야 한다.
그런 문제의식을 갖고 글을 풀어냈다. 아직 출고되지 않은 글이라서 내용을 자세히 언급하기는 어렵지만(조만간 글이 발행될 예정이지만). 전개 방식은 헬스케어 AI 콘텐츠를 쓸 때 방식을 활용했다. 그때는 코로나 19 시대에 주목할만한 헬스케어 AI 기업 5곳을 추렸다. 이번에는 활용도를 다섯 가지로 추렸다. 이중 세 가지는 챗봇으로 대처하는 방식. 나머지 하나는 이미지 인식 기술, 또 다른 하나는 데이터 크라우드 소싱과 AI를 연결한 방식이었다. 활용도별로 구분하다 보니 어떤 사례에는 여러 기업을 언급하기도 했다. 아동 성매매나 직장 내 성희롱, 아동 성착취 이미지를 감시하는 게 그 예였다. 헬스케어 AI 콘텐츠를 쓸 때도 느꼈지만 5개도 힘들다. 성범죄 현안도 최대한 조사해서 글로 쓸 분량이 나오는 기술을 추렸을 때 저 정도였다.
조사했지만 글에 담지 않은 내용도 있었다. 일단 기술은 현재 개발돼서 활용되는 걸 쓰고자 했다. 고객이 있는 기술이라고 해야 하나. 아직 개발 단계에 있거나 논문 정도 나온 기술은 조사는 했지만 글에 담지 않았다. 조사과정에서 내가 놀란 건 챗봇의 활용폭이었다. HR봇 콘텐츠를 쓸 때도 유용하다고 생각했는데 성범죄에 대처할 때도 챗봇이 기여할 게 많았다. 비대면 신고를 하거나 법률 자문을 해주는 등. 이처럼 우리에게 낯설지 않은 기술이면서 글로 쓸만한 분량이 나오고 우리에게 시사점 있고 도입 가능한 방식을 골라서 글을 썼다.
사진=픽사베이내용 구성은 기존 글과 비슷하다. 이번에는 사례별로 필요성을 먼저 언급한 다음, 기술 활용 사례를 설명했다. 그다음, 의의로 마무리짓고. 필요성과 의의는 의미로 와 닿는 기술 콘텐츠를 쓸 때 꼭 필요한 부분이다. 용어 설명은 너무 많고 길어서 이번에는 글 안에서 언급하는 대신 각주, 주석을 따로 넣었다. 대신 이번 글에서 정말 중요한 게 생각한 내용 중 하나는 '기술 한계'였다. 한계만 다룬 파트를 따로 만들어서 거기에 내용을 담았다. 사례별로 도출할 수 있는 한계가 비슷한 듯해서 사례별 단락에 그 내용을 아우르기에는 어색할 듯했다.
모든 기술이 그렇듯 AI도 불완전하다. AI를 성범죄에 활용하는 사례는 초기 단계라고 봐야 한다. 이게 폭넓게 쓰이는 것도 아니다. 기술로 풀 수 없는 문제도 분명했다. 기술이 고도화되더라도 성범죄 그중에서도 성희롱은 굉장히 미묘해서 사람끼리도 판단이 엇갈린다. 그건 사람이라서 그럴 수도 있지만. 이 모호함을 AI가 명확히 구분할 수 있을까. 성범죄는 민감한 사안이고, 기술 이외 다른 해법도 절실히 필요하기 때문에 이 글에서는 그걸 분명히 짚고 넘어가고자 했다.
참고자료는 기사, 기술 블로그, 각사 홈페이지, 아동단체 글, 기술 논문, 형사정책연구원 보고서, 정부부처 보도자료, 검찰 통계자료 등을 활용했다. 검찰 통계자료는 분기별 범죄 통계인데 이것도 형사정책연구원과 함께 만드는 자료인 듯했다. 성범죄를 전문성 있게 분석한 자료는 형사정책연구원 보고서가 도움됐다. 이번에는 기업 홈페이지에 자료가 늘 풍부한 것만은 아니었다. 글로 쓸 분량은 나왔지만 기술 작동방식을 자세히 보여주지 않는 곳도 있었다. 그때는 인터뷰나 기술 블로그 회고 콘텐츠가 유용했다.
글 쓰는 순서는 비슷하다. 자료조사-개요 작성-초고 작성-추가 조사 겸 1차 내용 수정-사실 관계 확인 겸 2차 수정-3차 수정-4차 수정-이미지 편집 등. 글 분량이 기존에 쓴 글보다 많이 길었다. 주석도 많이 달리고. 내용도 한계 파트를 따로 넣으면서 분량이 더 길어졌다. 분량이 길면 좋지 않다. 시간이 많이 걸리고 쓰고 고치는 데 힘이 든다. 특히 수정할 때 정말 힘들다. 글이 길면 집중력이 약해지기 쉽다. 분량이 너무 긴 건 좋지 않다. 내용을 줄이고 싶었는데 너무 줄이면 내용이 유기적으로 연결되지 않을 듯했다.
사진=픽사베이글 쓰면서 어려움을 느낀 지점이 몇 가지 있다. 첫째, 성범죄가 민감한 이슈라는 점이다. 성범죄 특수성도 있을 수 있고. 문장 하나 잘못 쓰면, 사실관계에 기초하지 않고 내 편견대로 쓰고 이를 검증하지 않으면 이건 피해자에게 2차 가해가 될 수 있다고 생각했다. 사소한 것 하나도 다 신중하게 접근해야 했다. 기술만 알아서 될 게 아니라 성범죄 자체를 정확히 이해하는 것도 중요했다. 어떤 게 성범죄이고, 디지털 성범죄와 통신매체 이용 음란행위는 어떤 차이가 있는지도 명확히 알아야 했다.
또 성범죄 통계가 증가하는 걸 어떻게 해석해야 하는지도. 통계가 늘어난다고 그걸 성범죄가 늘어난다고 단정 짓기는 어렵다고 한다. 신고율이 낮고, 최근 인식 바뀌어서 신고를 전보다 더 많이 하는 경향도 있다고. 통계를 해석할 때는 이런 배경도 함께 고려해야 한다고 했다. 그런 건 형사정책연구원 보고서를 읽고 알 수 있었다. 실체가 잘 잡히지 않는 성범죄 통계를 정리하고 이를 분석하는데 이런 연구원이 참 많은 기여를 한다고 생각했다. 이쪽을 전문적으로 파고드는 아동단체도.
둘째, 기술 내용, 작동방식 자료가 헬스케어 AI 기업만큼 많지 않았다. 공개한 내용조차 정교하게 설명되지 않은 경우도 있었다. 때로는 기술 작동방식보다 이게 어떤 기능을 하고 어떻게 쓰이는지 설명하는 것도 의미 있다. 독자 입장에서는 그게 이해하기 더 쉬울 수도 있고. 그래도 기술 콘텐츠라는 점에서 좀 더 기술 작동방식 자료가 풍부했으면 하는 아쉬움이 있었다. 어쨌든 사안이 사안인지라 절박한 마음으로 썼다. 정말 이 문제를 해결하는 데 내 글이 도움되길 바랐다. 이 글을 쓸 때 마음에 와 닿는 헤밍웨이 어록을 봤다. "모든 초고는 쓰레기다." 너무 공감 가는데 뜨끔하고 슬프기도 하고. 쓰레기는 어떻게 헤쳐 나왔다만.
조사, 글 작성 과정에서 느낀 게 또 있다. 코로나 대유행과 성문제 관계가 중요하다는 것. 코로나 봉쇄 조치 이후, 가정폭력이 심해졌다는 이야기도 있는데 아동 성착취도 심각할 수 있다는 것. 영국에서는 코로나 봉쇄 시기에 어린이가 보낸 음란 메시지가 183% 늘었다는 기사도 봤다(영국 스타트업 세이프투넷에 따르면). 마음이 착잡했다. 미국 지역자치단체 코로나 방역지침을 보면 성관계를 포함한 스킨십 조언도 있다. 어떤 제언은 당황스러웠다. 그런 의미인지는 모르겠지만 이런 것도 디지털 성범죄로 악용되지 않을까.