요즘 다시 만화 기사 스크랩을 올려보고 있는데, 사실 안 올려도 됩니다. 제 메일함에는 꼬박꼬박 알아서 쌓이고 있거든요. 그걸 남에게 보여줄 수 있는 형태로 '가공'해서 올리는 과정이 있을 뿐입니다.
원래대로라면 이런 과정이 있습니다. 뉴스 사이트에서 특정 키워드, 이를테면 '만화'와 관련된 기사만 긁어다가(또는 API로 받아온 후) 원하는 형태로 필요한 데이터만 골라 모양을 내 나열한 후, 이를 블로그 API를 이용해 자동으로 올리게 하는 겁니다.
저는 그 짓을 꽤 오래 해 왔습니다. 특정 시간에 알아서 올라가게. 머리가 조금만 굴러가면 이런 걸 만들어서 손을 편하게 하는 건 일도 아닙니다. 프로그램 꽤 자주, 다양하게 만들어서 DB에 쟁였더랬어요. 만화 쪽에서 저만큼 '관련 데이터'의 DB를 구축했던 사람이 있을까 하면 많지는 않을 겁니다. 그런데 이 자동화에는 몇 가지 문제가 있습니다.
자동으로 올리는 데이터를 검수하는 과정을 생략하는 경우, 1) 데이터에 문제가 있거나 2) 프로그램 또는 API가 문제가 있거나 할 때 3) 대상이 되는 사이트의 구성이 바뀌어서 크롤링이 안 될 때 대응이 늦습니다. 내가 보는 것과는 상관 없이 이미 처리가 됐거나 일찌감치 망가져 있는 상황이 발생하죠. 그리고 또 다른 문제가 있는데, 자동화에 기대기 시작하면 그렇게 모은 데이터를 어느 사이엔가 내가 안 보게 됩니다. 지나가는 거죠.
저는 그 모든 상황들이 귀찮아지기 시작했습니다. 그 때 그 때 프로그램이나 DB를 다시 손 보는 게 귀찮을까, 내가 필요할 때 손으로 처리하면서 구석구석 읽어내리는 게 귀찮을까. 어차피 데이터 수집은 그 자체가 수고스러운 손실인데, 어느쪽 손실이 클까. 스크랩이란 게 그렇습니다. 돌아가는 상황 파악을 빨리 하려는 거죠. 하지만 필요한 때 대응이 늦는 경우가 곧잘 발생한다면 그걸 해다 바쳐야 하는 입장에서는 머리가 돌 겁니다.
어차피 방법은 알지요. XML 데이터(예를 들어 RSS)로 뉴스를 제공하는 사이트에서, 국내외 만화 뉴스를 가져다가, 스프레드시트에 넣고, 포맷을 균질화하고, 번역까지 돌리게 한 후, 가져다가 정규식을 먹여서 적당히 가공해서... 그냥 올린다. 나중에 검색 가능하게. 그리고… 빨리 읽어내고 빠르게 요약할 수 있다. 내 머리로.
그냥 손으로 해 보니까, 나쁘지 않네요.
어차피 방법은 알지요.
어차피, 방법은 안다고요.
기계에게 다 맡기려 할 때 어 하다가 망할 일도 없습니다.
내가 할 거냐 안 할 거냐만 있을 뿐.
요즘의 AI 이슈에 대해서도 이렇게 생각하는 편입니다.
시간을 줄일 수 있는 좋은 도구지만,
가끔 접속이 안 될 때 그것에만 매달렸던 사람들은 순간 멈춤 상태가 되겠죠.
맡기려 해도, 시키려 해도 방법은 알아야 합니다.
AI가, 자동화가 무조건 좋은 것만은 아니에요.
_서찬휘(2023.03.20)