이것도 15년 전 사진
15년 전의 내가 현재의 나와 같다고 볼 수 있을까? 아니면 다른 사람이라고 봐야 할까?
성인이 되면, 더 이상 키는 더 이상 커지지 않고 성장기 때에 비해 상대적으로 느리게 진행되는 노화 말고는 커다란 변화가 생기지 않는다. 그래서 그런지 초중고 때의 1년과 대학교 2학년 때부터 1년은 시간의 속도가 매우 다르게 느껴진다.
그렇게 별 변화가 없었다고 생각할 수도 있지만, 15년 전의 나와 지금의 나는 분명히 다르다고 자신 있게 말할 수 있다. 어렸을 때 썼던 일기장을 보면서 느꼈던 낯선 느낌처럼, 나에게는 2003년부터 써오던 블로그 글이 남아 있으니 말이다.
내 블로그가 애니메이션이나 시즌 드라마였다면, 크게 내 블로그는 크게 3기로 진행되었다고 볼 수 있다.
1. 2003년 ~ 2006년 (네이버 블로그)
2. 2007년 ~ 2010년 (TextCube)
3. 2011년 ~ 그 이후 (Wordpress, 브런치)
그중 가장 멀리 떨어져 있고 지금의 나와 가장 다른 건 아무래도 2003년과 2006년 사이에 쓰던 글들일 것이다. 나는 절대 그때로 돌아갈 수 없고 그래서도 안된다. 그렇지만, 초등학교 때 썼던 일기장을 보던 것처럼 나 답지 않은 모습에, 그리고 잠시 까먹고 있던 예전의 일들이 떠올라서 그 나름의 재미가 있다. (뭐 그 재미 자체도 내가 읽을 때만 느껴질 거 같긴 하나)
회사에서 만든 서비스 중에 Teachable NLP라고 텍스트 데이터만 있으면, 그 텍스트 내용을 바탕으로 그 텍스트를 만들 사람처럼 글을 써주는 AI를 만드는 서비스가 있다. 이걸 이용해서 15년 전의 블로그 글을 쓰던 나를 AI를 만들어 보고 싶었다.
그렇게 모두 비공개로 돌린 Naver 블로그에 있는 600개 정도를 백업받고 텍스트 파일 하나로 만들었다. 600개나 되니 내용이 많을 줄 알았는데, 글을 길게 쓰던 시절은 아니어서 그런지 다 모아봤자 600KB 정도밖에 안되었다. 최소 1MB는 있어야 하고 10MB 정도는 되어야 잘 나오는데, 그래도 어쩔 수 없지. 15년 전으로 돌아가서 글 좀 길게 쓰라고 닦달할 순 없으니 말이다.
그렇게 만들어 놓은 내 첫 번째 AI.
나를 1% 정도 닮은 것 같은 AI가 탄생했다. (동네 주민 여러분, 와서 구경하고 가세요, 대충 치고 Tab)
데이터가 너무 적어서 그런지 여러 번 해야 내가 블로그에 썼던 내용들이 나오는 것 같았다. 직접 보지는 않았지만, 주변 지인들에게 전달했더니 '검은 스타킹 신는 걸 좋아했다'라던가, '퀴즈의 이해'라는 존재하지 않는 영화를 좋아했다.
100% 객관적인 문장도, 100% 주관적인 문자도 없듯이. 어차피 나도 15년 전 나를 모르고 99%는 아니더라도 1%는 내가 쓴 내용이 나오니 이것도 가상의 나라고 봐도 되지 않을까 싶었다. 그래서 10문 10답 형식으로 웹사이트를 하나 만들었다.
래영에 대하여 - https://about-laeyoung.vercel.app/
AI에 의해 매번 달라지는 답변을 보다 보면, '이런 것도 있었지'하며 놀라게 되는 순간들이 있다. 그것 때문에 나는 내가 만든 게 생각보다 괜찮다고 생각했던 것 같다. 나는 뭐가 진짜이고 뭐가 가짜인지 알 수 있으니, 가짜들 중에 반짝이는 진실을 바로 보고 있었으니.
그러나 다수는 뭔지 모르겠다는 의견이 많았다. 한 발짝 떨어져서 보니 내가 봐도 그런 것 같고. 결과물이 좋아지고 10문 10답이 아니라 원하는 질문을 넣을 수 있는 방법으로 해야 할 것 같은데. 결과적으로는 데이터가 너무 적다. 15년 치 블로그 글을 다 모으면 괜찮지 않을까? 하는데 데이터 전처리도 좀 귀찮고.
만들다 보니, 나무위키에서 특정한 페이지들(예를 들면, K-pop 관련 글 모음이라던가, 영화 관련 모든 글)을 모아서 AI로 만들면 괜찮지 않을까 생각해 보았다. 나무위키를 읽다 보면 재미는 있지만 시간이 너무 오래 걸리니 AI가 말해주면 좀 짧고 중요한 것들로 말해주지 않을까?
더 나아가 뭔가 특정 시기의 글들을(예를 들어, 삼연벙 때 커뮤니티 글)을 모아 AI로 만들어 놓으면, 그때를 이해하는데 좀 더 도움이 되지 않을까 싶다. 말하고 보니 AI가 아니어도 그냥 글만 모아 놓아도 좋겠다.
사실 나도 잘 모르겠다.
0x35 0x1A