'영구 보존'이라는 불가능한 임무와 문헌정보학
인류 역사상 지금처럼 많은 기록을 생산하는 시대는 없었습니다. 매일 쏟아지는 사진, 동영상, 이메일, 연구 데이터, 소셜 미디어 기록까지. 우리는 모든 것을 '저장'하고 있다고 믿습니다.
하지만 이 믿음은 위험한 착각일 수 있습니다. 역설적이게도, 수천 년 전 점토판이나 파피루스보다 오늘날의 디지털 파일이 훨씬 더 '사라지기 쉽기' 때문입니다.
문헌정보학과 기록관리학계가 심각하게 경고하는 '디지털 암흑시대(Digital Dark Age)'의 도래 가능성은 바로 이 지점에서 출발합니다. 미래의 역사가들이 21세기를 연구하려 할 때, 방대한 데이터가 존재했음에도 불구하고 아무것도 '읽을 수 없게 되어' 이 시대가 마치 암흑기처럼 공백으로 남을 수 있다는 끔찍한 시나리오입니다.
1. 무엇이 우리의 디지털 기록을 위협하는가?
종이는 그 자체로 100년, 1000년을 버틸 수 있지만, 디지털 정보는 '읽어주는 장치' 없이는 무의미한 0과 1의 집합일 뿐입니다. 그 위협은 크게 세 가지입니다.
1) 매체 자체의 노후화 (Media Degradation)
CD, 하드디스크(HDD), USB 메모리 등 데이터를 담는 물리적 매체는 수명이 있습니다. 습기, 온도, 자기장에 의해 데이터가 손상되거나(‘비트 부패’), 단순한 시간의 흐름만으로도 읽기가 불가능해질 수 있습니다.
2) 기술적 종속성 (Technological Obsolescence)
더 무서운 위협입니다. 15년 전 '아래아 한글 2007'로 작성한 문서를 지금의 최신 컴퓨터로 완벽하게 여는 것을 장담할 수 있나요? 3.5인치 플로피 디스크에 담긴 귀중한 자료는 디스크 드라이브가 사라진 지금 어떻게 읽을 수 있을까요? 하드웨어(HW)와 소프트웨어(SW)는 너무나 빠르게 발전하고, '구형' 포맷으로 저장된 데이터는 '고아'가 되어버립니다.
3) 링크의 휘발성 (Link Rot)
웹은 영원하지 않습니다. 우리가 참고문헌으로 인용했던 수많은 웹페이지와 뉴스 기사의 링크는 몇 년만 지나도 '404 Not Found' 오류를 띄우며 사라집니다.
2. '저장'이 아닌 '보존'이라는 임무
문헌정보학의 하위 분야인 '디지털 보존(Digital Preservation)'은 이 문제에 맞서는 학문입니다. 여기서 핵심은 '백업'이나 '저장(Storage)'이 '보존(Preservation)'과 다르다는 것을 인식하는 것입니다.
저장: 단순히 데이터를 '복사해서 쌓아두는' 행위입니다.
보존: 데이터가 10년, 100년 뒤에도 '접근 가능하고', '이해 가능하며', '진본성(Authenticity)'을 유지하도록 관리하는 '지속적인 과정'입니다.
3. 문헌정보학은 어떻게 싸우고 있는가?
디지털 보존 전문가는 '아키비스트(Archivist)'로서 이 디지털 암흑시대에 맞서 여러 전략을 구사합니다.
1) 마이그레이션 (Migration)
가장 일반적인 방법입니다. 구형 파일 포맷(예: hwp)을 더 개방적이거나 표준화된 포맷(예: PDF/A)으로 '변환'하여 저장하는 것입니다. 하드웨어가 노후화되기 전에 데이터를 새로운 저장 매체로 계속 '옮겨 심는' 작업도 포함됩니다.
2) 에뮬레이션 (Emulation)
매우 흥미로운 접근법입니다. 과거의 파일을 변환하지 않고 '원본 그대로' 놔두는 대신, 과거의 하드웨어와 소프트웨어 환경 자체를 현대의 컴퓨터 안에서 '흉내 내는(Emulate)' 프로그램을 만드는 것입니다. 1990년대 게임을 최신 PC에서 '에뮬레이터'로 돌리는 것을 생각하면 쉽습니다.
3) 웹 아카이빙 (Web Archiving)
'인터넷 아카이브(Internet Archive)'의 '웨이백 머신(Wayback Machine)'처럼, 웹페이지를 통째로 '박제'하여 수집하고 보존합니다. 전 세계 국립도서관들이 이 임무를 수행하고 있습니다.
문헌정보학은 단순히 오래된 책을 지키는 학문이 아닙니다. 그것은 이 시대의 모든 기록, 즉 우리의 '디지털 문명' 전체가 한순간에 증발하지 않도록 막아내는 가장 현대적이고 절박한 '기억의 수호자' 역할을 수행하고 있습니다.