LLM 시대, 기록관리의 새로운 기회
AI 시대, 많은 전문직이 자신의 역할에 대해 고민합니다. 기록관리 분야도 예외가 아닙니다. "LLM이 문서를 읽고 분류까지 한다면, 우리는 무엇을 해야 하는가?"
지난 12월 11일, 국가데이터처 업무보고에서 이재명 대통령이 흥미로운 지적을 했습니다.
"정부 공문서가 양질의 데이터인데 기계가 못 읽는다는 거 아닙니까?"
아래한글(HWP) 문제였습니다. 우리가 아래한글로 문서를 작성하고 '온갖 오묘한 테크닉을 발휘'하다 보니 기계가 읽지 못한다는 것이죠. 대통령은 "데이터가 많지 않을 때는 품질이 중요하다"며 입구 관리의 중요성도 강조했습니다.
저는 이 대화를 보며 생각했습니다. 만약 LLM이 HWP를 읽을 수 있게 된다면? 그것은 위협일까요, 기회일까요?
저는 HWP야말로 '문서의 갈라파고스'라고 생각합니다. 그리고 갈라파고스가 열리면, 오히려 기회가 됩니다.
갈라파고스 제도의 생물들이 고립된 환경에서 독자적으로 진화했듯이, HWP는 한국이라는 고립된 환경에서 독자 진화한 문서 포맷입니다. 이런 비유는 제가 만들어낸 게 아니라, 아래한글을 두고 자주 언급되는 비유입니다. 전 세계 어디서도 쓰지 않는, 오직 한국의 공공기관과 일부 기업에서만 사용하는 포맷이죠.
정부의 30년 치 공문서. 정책 결정의 근거가 된 검토 의견서. 회의록과 보고서. 이 모든 양질의 데이터가 HWP라는 폐쇄적 포맷 안에 갇혀 있었습니다. 기계가 읽지 못하니 분석도, 연결도, 활용도 불가능했습니다.
우리는 수십 년 치 지식의 보물창고 위에 앉아 있으면서도 열쇠가 없어 들어가지 못했던 것입니다.
그런데 이제 LLM이 HWP를 읽을 수 있게 되었습니다. 최신 Gemini 모델은 이미 HWP 파일을 직접 읽고 메타데이터를 추출할 수 있습니다.
이것이 왜 위협이겠습니까? 드디어 갈라파고스가 열리는 것입니다. 지금까지 읽지도 못하고 쌓아두기만 했던 문서들, 정리하고 싶어도 양이 너무 많아 엄두도 내지 못했던 기록들. 이제 활용할 수 있는 진정한 자원이 되는 것입니다.
기록관리 영역에서 생산성 측면은 AI가 압도적으로 잘 수행할 것입니다. 정확도, 비용, 신뢰도, 속도 모든 면에서요. 이 추세는 되돌릴 수 없습니다.
그렇다면 기록연구사, 기록물관리전문요원들은 무엇을 해야 할까요? 우리 기록 전문가들은 기록 정리 작업, 메타데이터 작성 작업, 분류 작업, 공개 재분류 작업 같은 반복적인 지식노동을 시쳇말로 '지식노가다'라고 부릅니다. 그러나 이제 그런 지식노가다는 AI가 맡게 되고, 전체 흐름을 기획하는 설계자로서의 역할을 수행해야 합니다.
지금까지는 일을 직접 수행하는 데에 시간과 돈, 노동력을 쏟았다면 이제는 본질적인 Why와 What, What to do에 더 집중하는 것입니다. 무엇을 남길 것인가, 무엇을 버릴 것인가, 무엇을 보여줄 것인가. 그리고 가장 중요한, 이 모든 것을 왜 하는가.
LLM이 HWP를 읽는다고 기록관리 일이 없어지는 게 아닙니다. 드디어 '정리'에서 '해석'으로 넘어갈 수 있게 된 것입니다.
오케스트라를 지휘하는 마에스트로를 생각해 보세요.
마에스트로는 모든 악기를 직접 연주하지 않습니다. 하지만 악기의 특성을 다 알고, 음악이론을 이해하며, 현장의 분위기를 읽습니다. 연주자의 성격과 특성, 악단의 장단점을 파악하고, 곡의 의미를 이해합니다.
그리고 이 모든 것을 종합하여 하나의 연주를 완성합니다. 팀 구성, 연습, 공연, 티켓 판매, 홍보까지. 처음부터 끝까지 전체를 설계하고 지휘합니다.
마에스트로가 바이올린, 첼로, 플루트, 심벌즈와 같은 각 악기의 음색과 특성을 꿰뚫고 있듯이, 기록관리 전문가는 LLM, 벡터 검색, 온톨로지, CLI 등 AI 도구들의 강점과 한계를 이해해야 합니다. 마에스트로가 화성학과 대위법 같은 음악이론을 체화하고 있듯이, 우리는 출처주의, 원질서 존중, 기록의 4대 속성 같은 기록관리 원칙을 숙지해야 합니다.
마에스트로가 각 연주자의 성격과 컨디션을 파악하듯이, 우리는 다루는 데이터의 특성과 시스템의 장단점을 파악해야 합니다. 마에스트로가 악보 너머의 작곡가 의도와 시대적 맥락을 해석하듯이, 우리는 기록이 생산된 맥락과 그 가치를 해석해야 합니다.
그리고 마에스트로가 이 모든 것을 종합해 하나의 연주를 완성하듯이, 우리는 기록 서비스를 설계하고 실행합니다. 기록관리 전문가는 AI라는 악기를 자유자재로 다루면서, 기록이라는 음악을 설계하고 지휘하는 마에스트로가 되어야 합니다.
음악에도 장르가 다양합니다. 클래식, 재즈, 오페라, 뮤지컬, 그리고 팝 뮤직은 더 다양합니다. 힙합, 발라드, 뉴에이지, 록, 록 종류에서도 사이키델릭, 펑크... 그런데 아카이브는 더 다양합니다. 공공기록, 기업기록, 예술기록, 과학기록, 개인기록... 인간 사회가 다양한 만큼 그 속의 서사도 다양합니다. 이런 다양한 분야의 아카이브 마에스트로들이 서로 시너지를 낸다면 어떨까요?
데이터와 AI를 자기 도구나 에이전트로 삼아서 자유자재로 다룰 수 있는 설계자들. 이들이 서로 연결되고 협력한다면, 그것이야말로 기록인들의 진정한 강점이 될 것입니다.
HWP 갈라파고스가 열리면, 기록관리 전문가는 어떤 일을 할 수 있을까요?
먼저, 시간을 연결할 수 있습니다. 30년 치 정책 문서가 읽히게 되면, 오늘의 정책이 어떤 과거 결정에서 비롯되었는지 추적할 수 있습니다. 흩어진 회의록과 검토 의견서를 연결해 정책의 계보를 그릴 수 있죠.
또한 기관의 기억을 설계할 수 있습니다. 각 부처가 AI를 도입할 때, 무엇을 먼저 학습시킬지 결정하는 건 기록을 아는 사람의 몫입니다. 대통령이 강조한 소위 '입구 관리'가 바로 이것입니다. 양질의 데이터를 선별하고 큐레이션 하는 일이죠.
질문을 설계하는 역할도 생깁니다. 30만 건의 문서가 검색 가능해졌을 때, 정책 연구자나 시민에게 '이런 질문도 던져볼 수 있습니다'라고 프레임을 제시하는 건 기록의 맥락을 아는 사람만이 할 수 있습니다.
신뢰를 보증하는 일도 우리 몫입니다. AI가 찾아준 문서가 정말 맥락에 맞는지, 할루시네이션은 아닌지 검증하고 '이 답변의 근거 문서는 여기입니다'라고 확인해 주는 역할이죠.
그리고 궁극적으로, 맥락을 연결합니다. 정부 30년 치 공문서를 AI가 이해할 수 있는 '맥락'으로 설계하는 것. 이것이야말로 기록관리 전문가만이 할 수 있는 일입니다.
이것이 위협입니까? 아닙니다. 끊임없이 Why와 What, What to do를 고민하고 실행에 옮기는, 창조적 전문가 그 자체입니다.
그래서 저는 기록인들이 새로운 흐름에 적극적으로 뛰어들어야 한다고 생각합니다. AI 없는 아카이브는 확장성이 제한되고, 아카이브 없는 AI는 맥락을 상실합니다. 그리고 인간 없는 둘은 의미를 잃습니다. 우리는 그 의미를 만드는 사람들입니다.
[참고]
- 국가데이터처 업무보고 영상 (2025.12.11): https://www.youtube.com/watch?v=8cSqPRsM_Yg
- [이재명 대통령, 기획재정부·국가데이터처 업무보고 - 뉴시스](https://www.newsis.com/view/NISI20251211_0021093378)
- [국가데이터처, AI 기본사회 실현 위한 데이터 혁신 - 뉴스핌](https://www.newspim.com/news/view/20251211001226)