★★★★
지난 번의 인공지능 관련 도서는 별로였지만, 이번 책은 훨씬 좋다. 생성형 언어모델이 등장한 이후에 드러난 막연한 불안감을 조금이나마 해소시켜주는 책이었다.
마음을 떠나지 않는 질문은 '기술 진화의 속도를 어떻게 효율적으로 따라잡을 수 있을까?' 나 '인공지능이 모든 것을 수행할 수 있는 미래에 인간은 어떻게 될까?'가 아니었습니다. 그보다는 '지금 여기에서 우리는 읽고 쓰는 인공지능을 어떻게 이해해야 할까?' '새로운 존재와 함께 읽고 쓰는 행위는 어떤 가치와 한계를 지닐까?' '리터러시 생태계의 근본적 변화 속에서 읽고 쓰는 존재로서의 우리 자신을 어떻게 더 잘 돌볼 수 있을까?' 였죠.
무엇보다도 현재 문해력 담론이 구조화되는 방식을 비판적으로 성찰하며 질문의 방향을 바꿉니다. '인공지능의 시대, 읽기와 쓰기는 어떻게 변화해야 하는가?'가 아니라, '여전히 깊이 읽고 정성 들여 쓰기가 의미와 가치를 갖는 시대, 우리는 인공지능과 어떤 관계를 맺어야 하는가?' 라고 묻는 것입니다.
인공지능의 시대라고 불린다. 바둑 인공지능 알파고, 생성형 언어모델 인공지능 챗지피티, 단백질 구조예측 인공지능 알파폴드, 2024년 노벨물리학상에 머신러닝의 수상 등등, 인공지능에 관련된 뉴스가 끊이지 않는다. 제일 최근에는 중국발 저비용 고효율 인공지능 딥시크까지 전세계 주식시장을 들썩이게 했다. 인공지능에 관련된 뉴스와 더불어서 인공지능에 관련된 사설이나 전문가의 의견에는 "인공지능의 시대, 적응할 것인가? 도태될 것인가?" 라는 캐치프레이즈를 내세운다. 그 캐치프레이즈와 함께 인공지능에서 도태되면 큰일난다는 공포심과 불안감이 전세계를 집어삼키고 있다.
나도 그 인공지능의 시대라는 흐름에 휩쓸려 인공지능을 활용한 단백질-리간드 결합 예측 모델 이라는 프로젝트를 수강하고 활용해봤다. 이번 달에도 알파폴드를 사용하여 단백질 구조 예측을 진행했다. 브런치 글에 같이 업로드하기에 적당한 일러스트를 DALL-E 그림 인공지능으로 그렸다. 그리고 오늘 하루도 논문을 작성하면서 끊임없이 언어모델 인공지능을 사용했다. 인공지능이 대두된지 얼마 되지도 않았지만, 인공지능은 너무 깊숙히 나의 학문 생활에 자리잡았다. 나 또한 인공지능을 제대로 활용하지 못하면 도태된다는 불안감에 이 AI, 저 AI 를 다 다루려고 했다.
보통 글쓰기의 가장 큰 기능을 생각의 표현-expression 혹은 외화라고 합니다. 머릿속의 생각을 신체 외부의 글이라는 매체로 변환하기에 이런 용어를 사용합니다. (중략) 물리적 실체로 우리 앞에 드러난 생각, 즉 텍스트는 우리를 노려보기 시작합니다. 단어 하나하나, 사용된 은유, 문장의 길이, 동원된 문법이 우리 마음에 영향을 주게 됩니다. 보이지 않던 것들이 보이게 되면서 막연했던 생각이 구체적인 언어가 됩니다. (중략) 이런 과정에서 텍스트가 사고 과정에 개입하게 되는데, 이를 저는 '내압-inpression'이라고 부릅니다. 글쓰기는 이 두 과정, 즉, 표현-expression과 내압-inpression이 끊임없이 교섭하는 과정입니다.
생각을 정리하고 (그 후에) 쓰는 게 아닙니다. 단지 생각을 정리하려고 쓰는 것만도 아닙니다. 생각을 내어 놓고 검토하고 발전시키려고 쓰는 것입니다. 보이지 않는 생각의 흐름이 보이는 텍스트가 되고, 이것이 다시 사고의 재료가 되는 과정, 그 전부가 쓰기입니다. 이런 면에서 쓰기는 잡히는 것과 잡히지 않는 것을 엮어 내는 신비한 도구이기도 합니다.
"물질화된 문장만이 논리적 흠을 발견할 수 있고, 논리적 흐름을 맺을 수 있다." 최근에 논문을 작성하면서 내가 확실히 느낀 점이다. 머릿 속에 떠다니는 생각만으로는 논리가 부족하다. A라는 실험 결과를 서술하는데, 논리적 흐름이 매끄럽지 않아서, 그 흐름을 메꾸기 위해 a 분석을 더 진행한 적이 한 두 번이 아니다. 매 문장마다 전부 다시 분석을 했다. 분명히 머릿 속에서는 가설과 결과가 잘 들어맞았는데, 문장 속에서는 잘 들어맞지 않았다. 그 때마다 문장을 다시 쓰거나, 논리를 고치거나, 새로운 분석결과를 도입했다.
대부분의 프롬프트는 말 걸기라기보다는 요청이나 명령에 가깝습니다. 인간이 기계에게 잘못을 저지르고 있다거나, 기계가 대화 상대가 되지 못한다는 뜻이 아닙니다. 지금의 상호작용이 대화가 되지 못하는 것은 현재의 거대언어모델 알고리즘과 인터페이스가 지닌 기본 특성입니다. 거대언어모델에 기반한 챗봇은 대화하는 존재가 아니라 뭔가를 '만들어 내는' 존재입니다. 생성형 인공지능과의 상호작용은 기본적으로 '프롬프트-반응'으로 이루어집니다.
프롬프트는 새로운 장르의 글이고, 프롬프트 엔지니어링은 프롬프트라는 글을 쓰는 일임을 기억하세요. 이 새로운 장르의 글은 그 자체로 기능을 수행하지 않습니다. 프롬프트의 임무는 여러분의 세계와 거대언어모델의 세계를 연결하는 일입니다. 일종의 터널인 셈이지요. 터널을 통해 두 세계의 개념과 생각들이 오고 갑니다. 그렇기에 여러분의 세계를 풍성하게 만들지 않고서 프롬프트만으로 할 수 있는 일은 많지 않습니다.
양심 고백. 현재의 나는 생성형 언어모델이 없으면 논문을 작성할 수 없다.
내가 생성형 언어모델로 논문을 작성하는 과정은 다음과 같다. 논문에 쓰고 싶은 문단을 최대한 한국어로 자세하고 명확하게 작성한다. 그 한국어 문단을 프롬프트에 입력하고, 프롬프트 마지막에 이 문구를 추가한다. "위 내용을 생물물리학 논문에 맞는 학술 영어로 번역해줘." 프롬프트의 입력에 따른 영어 문장 결과물을 한 문장씩 읽어본다. 주어로 와야하는 파트가 목적어에 위치하거나, 이 학문 분야에서 적확하지 않은 어휘를 사용하고 있거나, 앞뒤의 문장/문단과 자연스럽게 이어지지 않는 등, 문장에 다양한 에러가 존재한다. 그래서 언어모델에서 생성한 문장을 템플릿으로 삼아서 내 마음에 들도록 문장을 수정한다. 수정한 문장에 영어 문법적 오류가 있는지 프롬프트에 수정한 영어문장을 입력하고 이 문구를 추가한다. "위 문장이 문법적으로 올바른지 확인하고, 추가적으로 학술적인 코멘트가 있다면 코멘트도 해줘." 그 후, 논문에는 문법만 수정한 문장을 선택하고, 언어모델이 제공하는 학술적인 코멘트는 참고만 한다.
생성형 언어모델은 두 단계에서 쓰인다. 첫 번째, 한국어 문장에서 영어 문장으로 번역하는 단계와 두 번째, 영어 문장의 문법적 오류가 있는지 여부를 확인하는 단계. 첫번째 단계에서 내가 원하는 대로 문장이 번역되는 일은 5% 보다 낮다. 그리고 올바르게 번역하는 그 5%의 문장들은 굉장히 쉬운 문장들이다. (In equation 1, K is the binding affinity for the interaction.) 95%의 문장들은 내 마음에 쏙 들게 번역되지 않는다. 그래도 생성형 언어모델의 좋은 점은, 문법적으로는 틀리지 않은 템플릿 문장을 제공해준다는 점이다. 주어진 템플릿 문장에서 특정한 뉘앙스와 어휘로 조금 문장을 변형시켜, 내가 원하는 영어 문장을 제작한다. 그리고 그 변형하는 과정에서 언어모델을 두 번째 사용한다. 적당한 유의어를 검색하고, 수동태로 바꿨을 때, 그 문법이 올바른지 체크하는 과정이다. 내가 제 아무리 20년 넘게 영어 공부를 했지만, 나는 원어민 사용자가 아니기 때문에 이 문장이 이상한지 아닌지 모든 단어에 촉각을 곤두세우며 문장을 읽어도 문법적으로 틀리는 부분이 꼭 생기기 마련이다.
교수님은 생성형 언어모델로 논문을 쓰지 말라고 항상 말한다. 교수님이 생성형 언어모델로 논문을 쓰지 말라고 하는 이유는 다음과 같다. 첫째, 본인께서 논문을 쓰라고 지시를 했는데, 만족할만한 정확성을 가진 결과물이 아니었다. 둘째, 그리고 그 결과물이 학생들 수준 정도지, 뛰어난 문장력은 아니었다. 하지만 나는 교수님의 말을 귓등으로 듣고, 생성형 언어모델을 활용하여 논문을 작성한다. 왜냐하면 교수님의 이유가 타당하지 못하기 때문이다. 첫번째 이유. 교수님이 입력하신 프롬프트는, "단백질 결합에 대한 열역학적인 논문을 작성해줘." 정도의 수준이었다. 정보량이 적고, 애매모호한 지시의 프롬프트는 정확하지 못한 결과물을 낼 뿐이다. 두 번째 이유. 내가 교수가 될 것도 아닌데, 굳이 내가 뛰어난 문장력을 갖춰야 하는가. 영어 문장으로 정확한 의미만 전달할 수 있다면 나에게는 충분한 문장력이다. 그래서 나는 생성형 언어모델을 적극 사용한다.
멀티미디어와 인터넷이 없는 강의실에서 우리는 '그 어떠한 기술의 도움도 받지 않고' 수업을 진행한다고 생각하면서, 인류가 가장 오랜 시간 발달시킨 언어라는 기술이 작동하고 있음을 인지하지 못합니다. (중략) 그렇기에 기술에 대한 이해는 사용자가 인지하는 도구에 대한 분석이 아니라 투명함 속으로 존재를 숨겨 버린 '마법'에 대한 분석에서 시작해야 합니다.
인공지능과의 협력 이전에도 우리는 언제나 수많은 사람의 생각과 언어에 잇대어, 펜과 종이, 책과 안경, 타자기와 워드프로세서, 인터넷과 검색 등에 기대어 글을 읽고 썼습니다. 리터러시 생태계에 새로운 친구를 맞이했다고 해서 갑자기 모든 기존 관계를 청산할 이유는 없습니다.
나는 생성형 언어모델이 없으면 논문을 작성할 수 없다. 마찬가지의 맥락으로 인터넷 사전이 없으면 논문을 작성할 수 없고, 워드 프로세서가 없으면 논문을 작성할 수 없다. 그리고 구글 학술 검색, 교수님의 수식 자료, 손목쿠션 키보드가 없으면 나는 논문을 작성할 수 없다. 펜과 종이, 주변 사람들과의 디스커션과 아이디어가 없으면 논문을 작성할 수 없다. 이 모든 기술들은 그 나타난 시점의 차이가 있었을 뿐이지, 지금의 나에게는 모두 글을 쓰기 위한 도구이다.
먼거리를 이동하기 위한 교통수단으로 자동차가 나타난 이후에도 자전거는 자취를 감추지 않았다. 지금도 공유 자전거 사업은 성행하고 있듯이 말이다. 그리고 먼거리를 이동해서 특정 건물에 들어가거나, 공간을 누리기 위해서는 결국에 차 문을 열고, 안장에서 내려, 두 발로 그 공간에 걸어들어가야 한다. 이동을 하기 위해서는 두 발로 걷기라는 기본적인 행위를 해야한다. 오래된 기술과 새로운 기술은 계속 공존했고, 사람들은 오래되고 새로운 모든 기술을 활용하여 삶을 영위하고 있다. 그리고 그 기술들의 원형은 사람들이 행하는 가장 기본적인 행위이다. 생성형 언어모델도 단지 그 뿐이다. 생성형 언어모델이라는 글쓰기를 도와주는 도구가 생겼을 뿐이지, 생성형 언어모델은 결코 그 이전의 모든 글쓰기를 대체하지 못할 것이다.
지난 한 해 반동안 생성형 인공지능과 관련된 문헌과 뉴스를 광범위하게 검토하며 가장 자주 접한 단어는 '생산성-productivity'였습니다. 주어진 시간 내에 일정한 품질을 유지하면서 얼마나 많은 산출물을 낼 수 있는가로 계산되는 바로 그 생산성 말입니다. 하지만 왜 우리에겐 '과정성-processivity'이라는 말은 없는 것일까요? 과정이 사라진 결과는 어떤 가치를 가질까요?
인공지능의 물결 속에서도 여전히 하나하나 익혀야 하는 일들이 있는지 살피는 일 또한 필요합니다. 그 과정이 지난하고 이렇다 할 산출물이 없어서 "100을 배워서 1 밖에 못 써먹을 거, 뭘 100 씩이나 배워야 하는가"라는 질문을 받을지라도 말입니다. 그런 질문을 던지는 분들은 그 1을 써먹으려면 반드시 100을 배워야 한다는 걸, 나아가 100을 경험하는 동안 배우는 이의 몸과 마음이 완전히 달라진다는 걸 무시하곤 하니까요.
생성형 인공지능은 길이가 긴 논문, 글, 뉴스, 영상을 "요약"하는 일을 가장 잘한다.
하지만 내가 절대로 인공지능으로 하지 않는 일이 바로 이 "요약"이다. 논문을 요약해서 읽고 싶으면 저자가 작성한 초록, abstract 을 읽으면 된다. 저자가 제공하는 graphical abstract 도 있는데 굳이 인공지능으로 요약을 할 필요가 없다. 전혀 모르는 분야의 논문을 쉽게 접근하기 위한 목적이라면, 또는 다른 사람의 저널클럼 10분 전에, 정말 정신이 없을 때 읽기 위한 목적이라면, 이 정도는 이해할 수 있겠다. 무지하거나 다급한 상황이 아닌 일반적인 상황에서는 인공지능 논문 요약을 읽지 말아야 한다. 그래서 나는 논문 초록만 읽는 일도 거의 없다. 논문을 요약해서 읽으려면 도대체 논문을 왜 읽는지 이해를 못하는 편이다.
논문을 왜 읽는가. 내가 전공하고 공부하는 분야의 최신 연구 동향을 파악하기 위함이다. 또는, 과거의 선행연구를 공부하면서 지식을 쌓기 위함이다. 최신 논문을 읽던, 과거 논문을 읽던, 학자는 그 논문을 자세하게 읽어야 한다. 논문의 논리 흐름을 읽고, 논리 흐름의 빈틈을 찾고, 실험 디테일을 읽고, 숫자와 이미지를 보면서 팩트 체크를 해야 한다. 내가 연구 주제를 찾으려면 논문의 빈틈을 찾아야 하는데, 논문의 빈틈은 쉽게 드러나지 않는다. 오랜 시간동안 정성을 들여서 읽어야, 그 빈틈이 조금 보인다. 과거 논문으로 공부를 한다고 하면 그 디테일이 더욱 중요하다. 실험을 재현하거나, 수식을 따라가야하는 경우에, 요약된 텍스트만으로는 그 이해의 깊이가 부족해질 수 밖에 없다. 논문은 꼼꼼히 읽어야 한다.
"아니 요즘 딥리서치 같은 인공지능은 논리 흐름의 빈틈을 찾는 것도 다 해주는데?" 이런 반박도 나올 수 있다. 그렇지. 좋은 AI가 많이 나오기도 했다. 하지만 논문을 읽으면서, 본인이 이 필드를 공부하는 이 과정에서 체화하는 부분이 분명히 있다. 이 분야에 익숙해지고, 이 분야를 사랑하면서 증오하는 이 과정의 연구자의 성장이 분명히 있다. 나는 이 과정동안의 성장을 하기 위해 박사를 하고 있다. 저자는 이 책에서 이 포인트를 "과정성"이라고 명명한다. 나를 비롯한 연구자 인간들은 계속 읽고, 쓰고 리터러시의 모든 과정과 시간을 온전히 받아들인다.
나중에 저자분을 만나게 된다면 얘기하고 싶은 질문들.
질문 1. 며칠전에 뉴스를 들으면서 느낀 건데, 우리는 인공지능에게 왜 반말을 하는 걸까요?
질문 2. 그래서 요즘 사람들은 productivity 를 중요하게 볼까요? 아니면 processivity 를 중요하게 볼까요? 저는 사람들은 역설적으로 과정에 더 가중치를 둔다고 생각합니다. 왜냐면 결과는 금방 드러나니까요. 안성재 셰프가 미슐랭 3스타를 받기 이전에, 대중은 그가 미국에서 고생한 그 과정을 사랑합니다. 음... 생산자는 생산성을 중요하다고 생각하지만, 소비자는 과정성을 더 사랑한다고 느껴집니다.
덧 1. 꽤나 두꺼운 책임에도 불구하고, 술술 읽혔다. 문사철 학자의 논문은 이렇게 쓰는 것인가...
대학생 때 철학과 인문학 분야의 수업을 들었을 때 이런 생각을 했다. "인문학 교수님들은 90분 동안 똑같은 말을 이렇게 하고, 저렇게 하고, 굉장히 반복적으로 주장하네. 결국에 오늘 강의의 쟁점은 '과학은 패러다임 시대와 패러다임 혁명으로 구성된다.' 라는 거 잖아. 핵심만 말하면 되는데, 이걸 90분이나 얘기하고 있는 거야?"
철학과 인문학은 자연과학과 공학에 비해서 굉장히 배울 게 없고, 얕다고 판단했다. 앞서 들었던 생각처럼, 인문학의 핵심은 10 분 정도만 말해도 충분히 이해했다. 반면에 과학은 핵심만 90분 동안 말해도 시간이 부족했다. 그래서 과학 강의의 과제를 할 때에는 쟁점만 딱딱딱 작성해서 제출했다. 그리고 쟁점이 과제 채점에 가장 중요하기도 했다. 세포생물학 강의에 다음과 같은 과제가 나온다고 해보자. '~~라는 가설을 증명하기 위해서는 어떤 실험을 해야하는지 설계하시오.' 그렇다면 과제에는 실험군과 대조군 설정, 실험 프로토콜, 예상 결과, 결과 해석 등, 각 단계를 명료하게 설명하면 된다. 이런 방식으로 과제를 작성하던 나는 철학 강의의 레포트를 작성하기가 너무 어려웠다. 분명이 주요 쟁점을 다 언급했는데도, 아직도 분량이 한참이나 남아서 너무나도 힘들어 했던 기억이 있다.
이런 방식으로 작성하면 안 되었다. 그냥 별의별 이야기를 다 해야했다. 다양한 접근법을, 각 접근법을 깊게 서술해야했다. 역사적, 사회적, 논리적, 정치적 접근법을 전부 다뤄야 했다. 비슷한 것 같지만 각 접근법마다 조금씩 다른 말들을 작성해야 했다. 어우 너무 어려웠다. 내 방법이 틀렸다는 것을 깨닫기는 했지만 맞는 방법이 정확히 무엇인지는 몰랐다. 그리고 이 책이 올바른 방법으로 쓰여진 인문학 레포트라고 깨달았다. 그래서 잘 읽히는 텍스트를 감탄하며 읽었다.
좋은 텍스트는 좋은 텍스트 그대로 감탄하고 좋아하고 싶다. 하지만 요즘 계속 논문을 쓰고 있기 때문에, 계속 내 논문을 어떻게 쓰면 좋을지로 고민한다. 으으 좋은 텍스트를 작성해야지.
덧 2.
생성"형" 언어모델이라고 타이핑해야 하는데, 생성"현" 언어모델이라고 자꾸 타이포가 난다.