처음부터 끝까지
아기는 첫 걸음을 떼기 위해 수없이 넘어진다. 물론, 나도 제대로 걷기조차 힘든 시기가 있었다. 하지만 러닝을 취미로 하기에 이른 지금, 최근에 넘어진 경험을 떠올리기가 어렵다. 이제는 빨라도 넘어지지 않는다. 이미 '걷기'에 통달해서, 다음 수준인 '뛰기'도 잘해낼 수 있게 되었다.
러닝 러버는 논문 신생아가 됐다. 엑셀에 꽉꽉 들어찬 숫자들을 보기만 했지, 빈 엑셀 판에 데이터를 하나씩 채워본 적 없다. 수백 장이 넘는 논문을 여럿 읽었어도, 빈 워드 판에 논문 운을 떼기는 생경하다. 빅데이터나 데이터 사이언스가 아무리 유행이라도 해도, 통계 프로그램을 혼자서 돌려본 적은 전무하다. 공선성? 상관관계? 다중회귀? 다 도대체 뭔지 갑갑하지만 하다.
ChatGPT나 claude가 없었다면 어떻게 이 답답함을 이겨냈을까? 논문 로직, R프로그램 코드, 통계 돌린 결과가 한 번에 매끄럽게 이어지기는 사실상 불가능이다. 대소문자 차이, 기울기 차이, 연도 차이, 이 크고 작은 돌에 걸리면 넘어질 수밖에 없다. 넘어졌을 때 손을 뻗는 곳이 바로 ChatGPT나 claude다. "나는 (설명) 이 맥락으로 이 로직/코드/통계를 썼어. 그런데 (결과) 이렇게 오류가 있어. 혹시 내가 발견하지 못했어도 범한 오류가 있는지 검토해줘. 그리고 오류를 수정할 수 있는 방법을 제안해줘." 이 간절한 손길에 정말 친절하게 답해주는 이 친구가 고맙기만 하다.
한편, 쉽게 해결되는 역경은 진짜가 아니다. 그 뒤에 더 어마무시한 위험이 도사리기 마련이다. '술술 풀리잖아!'라며 안심하고 ChatGPT와 만들어낸 코드를 프로그램에 넣는 순간, 에러 창이 뜬다. 사소한 오류가 있는지 아무리 눈 씻고 찾아봐도 없다. 그때 머릿속에서 경고등이 울린다. 당혹감에 뇌가 작동을 멈추고, 그 뒤로는 프로그램을 계속 붙잡고 있어도 소용이 없다. 계속 에러, 에러, 에러...
그래도 이 과정을 놓지 못하는 건 선배들 덕분이다. 몇 시간, 심지어는 며칠에 걸쳐 내가 ChatGPT와 씨름해도 풀리지 않던 난제를 선배들에게 털어놓았다. 그 이야기를 듣자 '나는 절대 ChatGPT에게 물어볼 수 없는', 'ChatGPT는 절대 답할 수 없는' 묘안을 만들어냈다. 예를 들면, 30년이 넘는 시계열을 가진 데이터에서 [기울기가 바뀌는 지점]을 찾아보니 중구난방이었다. a 경우에는 1999년, b 경우에는 1999년과 2005년, c 경우에는 그런 연도가 없었다. ChatGPT는 1999년을 메인으로, 나머지 1-2개 연도를 서브로 축을 삼아 그 전후 비교를 해볼 것을 제안했다. 선배는 연도 Dummy 변수를 만드는 방법을 쓰면 과적합 이슈를 막으면서도 데이터 손실을 줄일 수 있다고 알려주었다. 그 이야기를 들으며 알았다. '나는 이걸 모르기 때문에 ChatGPT에게 물어볼 수조차 없었구나. 나도 어서 [앎이 체득된 사람]이 되고 싶다!'
ChatGPT가 세상에 나오기 전, 선배들은 어떻게 물어보고 묘안을 알게 됐을까? 그들은 벽돌책을 펼쳤다. 내 질문에 대한 답을 찾으려면 관련된 부분을 다 읽어야만 했다. 어쩔 수 없이 시간이 오래 걸리지만, 그 덕분에 내가 궁금한 부분과 관련된 정보를 폭넓게 알 수 있었다. "a 경우에는 ㄱ 방법을 써야 하지만, b 경우에는 ㄱ 방법이 무용하다. 그것은 ~ 때문이다." 하는 식이다. 지금 나는 "ChatGPT, 나는 ~~한 경우야. 내가 쓸 수 있는 방법은 뭐야?"라고 경우를 [내 언어]로 [내가 이해한 만큼만] 설명하고, [내가 아는 수준에서] 답을 얻는다. 그러니 내 머릿속에서 벗어나지 못한다. 넘어지긴 하지만, 다시 넘어지지 않는 것에만 집착해서 새로운 도전에 몸을 사리는 꼴이랄까.
뭐 하나도 쉽게 안 되서 답답한 날, 선배는 말했다. "석사는 처음부터 끝까지 해보는 것만으로도 많이 배우는 거예요." 그 이야기를 집 가는 길에 여러 번 곱씹었다. 그리고 알았다. 내가 논문을 쓰려고 하는 이유는, 내가 이 갑갑한 루틴에 나를 밀어넣은 이유는, [새로운 능력 하나를 얻기 위해 잘 넘어지고 일어서는 법을 배우기 위함]이었구나!