brunch

You can make anything
by writing

C.S.Lewis

by 이마크 Jul 21. 2024

인공지능과 사서

얼마 전 북미도서관 동아시아협회의 연례회의에 다녀왔다. 각 세션의 주제는 온통 인공지능이었다. 목록사서로서 가장 인상 깊었던 것은 생성형 AI인 챗GPT에게 LCSH(주제명)와 MARC21을 설명하고 분류/목록을 시켜보는 세션이었다. 물론 100% 정확하지는 않았지만, 그럴싸하게 주제명을 주며 흉내 내는 것을 보니 인공지능의 등장으로 목록사서의 미래가 밝지는 않아 보였다. 


생성형 AI는 아니지만 인공지능의 하나인 구글 번역기는 실제로 내 업무에 상당히 자주 사용되고 있다. 조직 개편 후 내가 분류/목록 규칙과 관련 지식을 얼마나 알고 있는지, 내게 어떤 트레이닝이 더 필요한지를 파악하기 위한 방법으로 내 미국인 상사는 내가 작성한 한국책 및 영어책의 서지레코드를 모두 검토하고 있다. 문제는 한국책이다. 책의 내용을 알아야만 분류번호는 정확한지, 주제명은 제대로 주었는지 등을 확인할 수 있는데 언어를 모르니 책의 내용을 확인할 길이 없다. 그래서 내 상사는 구글번역기를 사용한다. 구글 번역기를 돌려 서명과 소제목을 확인 후, 내가 부여한 주제명을 보고 대충 어떤 책인지 짐작하여 검토를 마친다. 때로는 구글번역기 앱에서 카메라를 사용해 서명, 책 커버 재킷, 본문 등을 훑어보고 내게 피드백을 주기도 한다. 나는 구글 번역기가 상당히 유용하다는 인상을 받았는데, 한국어를 하나도 모르는 상사가 내 서지레코드에 책 내용을 알아야만 가능한 피드백을 주는 경우가 종종 있었기 때문이다. 


물론 마케팅을 위해 서명에 책 내용을 그대로 반영하지 않은 경우도 있다. 하지만 경험이 풍부한 목록사서라면 서지레코드만을 보고도 이 정도는 파악할 수 있다. 그리고 이런 경우 한국어를 모르는 상사는 책 내용을 짐작하기가 어렵기 때문에 물음표를 붙여 이런 주제명은 어떠니?라고 피드백을 남긴다. 혹시 내가 더 정확한 주제명을 놓쳤을까 노파심에 남긴 피드백으로, 내가 해당 주제명을 살펴보고 적합하면 사용하라는 뜻이다. 언어를 모르기 때문에 상사로서 보다 정확한 피드백을 주는데 한계도 있지만, 구글 번역기 덕분에 언어의 장벽을 꽤나 허물 수 있었다. 


그러던 어느 날, <저출산 탈출 대책과 하브루타 격대교육>이라는 책으로 구글번역기의 한계를 제대로 체험했다. 나도 처음엔 제목만 보고 교육학에 대한 책인가 싶었는데, 실제 책의 내용을 살펴보니 조부모에 의한 자녀

교육인 격대교육 (Grandparenting)에 분류를 하는 게 더 적합하다 싶었다. 그런데 마치 나의 생각을 읽기라도 한 듯, 상사는 교육학에 분류하는 게 어떻냐고 피드백을 주었다. 상사는 책은 격대교육에 대한 책이 아니고, (아니면 격대교육은 살짝  언급만 되는 정도 거나) 하브루타에 대한 책이지 않냐고 물으며 혼란스럽다는 말을 덧붙였다. 


나는 처음에 구글 번역기가 번역을 잘못했을 생각은 못하고, 상사는 "창의력, 추리력, 고등사고력을 높여주는 질문법"이라는 소제목을 보고 교육법에 초점을 맞춘 책으로 짐작했다고 생각했다. 그런데 상사와의 미팅에서 "제목에서는 하브루타와 격대교육 둘 다를 언급하고 있어 나도 조금 고민했지만..."이라고 말을 하자 상사가 깜짝 놀랐다. 구글 번역기는 격대교육에 대한 언급 없이 하브루타만 번역을 해서 본인이 캐치를 못했다고 했다. 어쩐지, 내가 부여한 주제명이 상사에게 혼란을 야기할 정도는 아니었는데 피드백이 이상하다 싶었다. 궁금한 나는 구글 번역기에 뭐라고 나오는지 같이 확인해 보자고 했다. 제목 전체를 번역기에 돌리자 역시 '격대 교육' 부분을 번역하지 않았다. 나는 상사에게 다 지우고 '격대 교육'만 남겨보라고 했다. "college education"이라는 전혀 엉뚱한 번역에 이번엔 내가 깜짝 놀랐고, 상사는 나의 놀란 반응을 재밌어하며 구글번역기의 번역이 심상치 않음을 바로 알아차렸다. (아직은 미국인 상사와의 관계가 어색해 평소의 나처럼 리액션을 잘하지 않는데, 엉뚱한 구글번역에 너무 놀라 나다운 리액션이 나왔다.)  


상사는 갑자기 구글 번역기에서 Poor translation을 누르고 Grandparenting이라고 번역을 수정했다. 구글 번역기가 피드백을 수용해 정확한 번역을 학습하기까지 얼마나 시간이 걸릴 진 모르겠지만, 앞으로 구글이 '격대교육'을 제대로 번역한다면 내 상사 덕분이다! (구글 번역기가 예전보다 퀄리티가 좋아졌다 싶었더니만, 이렇게 피드백을 제공하는 사람들이 있어서 그런가 싶다.)


'아직 인공지능이 갈 길이 멀구먼!'이라고 생각하던 찰나 분류/목록을 위해 내 손에 들어온 <독도법과 군대부호>라는 책은 인공지능과 비교하여 나의 어휘력은 얼마나 풍부한지 되돌아보게 했다. 

독도(獨島) 관련 자료는 워낙 도서관에서 많이 수집하는 자료였기 때문에 서명을 보자마자 당연히 독도와 관련한 특별 군대법에 대한 책인 줄 알았다. 독도에 어떤 특별한 군대부호가 따로 있나 목차를 훑어보니 뭔가 이상했다. 독도에 대한 내용이 하나도 없었다. 알고 보니 독도법은 지도를 읽는 법을 뜻하는 것으로 한자로는 이었다. 


이 책을 보니 북미도서관 동아시아협회 연례회의에서 만났던 도서 납품업체의 기술담당자분과의 만남이 생각났다. 연례회의 주제처럼 우리의 대화도 자연스레 인공지능으로 흘러갔는데, 본 업체는 빅데이터와 인공지능을 통해 도서의 분류와 주제명 부여를 시도해 도서 납품 단가를 낮추는데 많이 활용하고 있다고 했다. 인공지능을 어떻게 도서 분류에 활용할 수 있는지 궁금했던 나는 자세히 여쭤봤었는다. (안타깝게도 기술에 문외한 나는 자세한 나의 질문만큼 자세한 답변을 모두 알아들을 수는 없었다.) 


개별 도서관 제공용으로 주제별 추천 리스트를 만드는 경우 신규 출판물 전체 리스트에서 사람이 하나하나 고르는 대신에 기계가 일차적으로 리스트를 뽑으면 사람이 최종 검토를 해 주제에 적합하지 않은 자료는 리스트에서 제외하는 등의 검수작업만 하면 되기 때문에 인건비를 많이 줄일 수 있다고 했다. 


이 문제의 독도법 책은 해당 업체로부터 구입한 것이었다. 업체가 제공한 리스트에서 선택을 해 구입한 것인지, 사서선생님께서 업체 사이트에서 직접 검색을 통해 구입한 책인지는 알 수 없지만 어떤 경우든 인공지능과 사람들 모두 독도(獨島)와 독도(圖)를 구분하지 못한 것은 틀림없다.


격대교육과 같은 상황을 피하기 위해, 상사에게 서지레코드를 검토받기 전에 내가 먼저 구글 번역기를 돌려보았다. 역시나 구글번역기는 독도법을 Dokdo law로 번역해서 알려주었다. 독도법에 대해 Map reading이라는 주제명을 부여한 나는 상사에게 Tok Island (Korea)에 대한 책 아니니?라는 피드백을 받기 전에 먼저 설명을 남겼다. 나도 난생처음 들어보는 단어인데, 이 책의 '독도'는 Tok Island가 아니라 map reading입니다. 구글 번역기를 믿지 마세요! 


이런 것을 보면 실제로 인공지능이 목록사서의 일을 대신하려면 아직 한참 먼 것 같다. 다만 확실한 것은 과거의 기술들이 그래왔듯이, 인공지능을 잘 활용하면 사서들에게 업무의 효율성을 가져다줄 수 있을 것 같다. 지금의 인공지능이 나와 상사의 업무 진행을 수월하게 해 주듯이 말이다. 이 똑똑한 인공지능을 도서관에 어떻게 활용할 수 있을지 잘 생각해 봐야겠다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari