오늘만 무료

디지털인데 왜 건물에 가야 하나요

프랑스 국립도서관에서 AI를 만나다

by 아키비스트J

파리 13구, 센강 남쪽에 네 개의 거대한 유리 타워가 서 있습니다. 펼쳐진 책의 형상을 본뜬 이 건물이 프랑스 국립도서관(Bibliotheque nationale de France) 프랑수아 미테랑관입니다. 4,900만 건의 소장 자료 안에는 중세 필사본도 있고, Gallica라는 디지털 도서관에 담긴 수백만 건의 디지털화 자료도 있습니다.

저는 이곳에 연구자 패스를 들고 들어갔습니다. 아키비스트로서, AI가 기록관리의 현장을 어떻게 바꾸고 있는지를 직접 보기 위해서였습니다. 그런데 문을 열자마자 마주한 것은 AI가 아니라 IP 주소였습니다.



BnF의 전문 열람 시스템 portaildocumentaire는 도서관 내부 워크스테이션에서만 접근 가능합니다. 같은 건물 안에 있어도 개인 노트북으로 방문자 Wi-Fi에 접속하면 차단됩니다. 도서관 컴퓨터는 내부 네트워크로, 방문자 Wi-Fi는 외부 인터넷으로 라우팅되기 때문입니다.


콘텐츠는 완전히 디지털입니다. 하지만 접근은 여전히 물리적이죠. 건물의 네트워크 설계가 누가 무엇을 볼 수 있는지를 결정하는 구조입니다. 열람실 제한이라는 오래된 원칙을 IP 인증으로 구현한 것이라고 볼 수 있습니다.


그런데 흥미로운 점을 발견했습니다. 옆에 놓은 개인 노트북으로 data.bnf.fr에는 자유롭게 접속할 수 있었습니다. 같은 BnF의 데이터인데, 어떤 것은 잠겨 있고 어떤 것은 활짝 열려 있었습니다.


호기심이 생겨 BnF의 데이터 인프라를 체계적으로 탐색해 봤습니다. 그 결과 세 개의 서로 다른 레벨이 확인되었습니다. 첫 번째 층은 방금 말한 portaildocumentaire입니다. 저작권 자료와 전문 콘텐츠가 있고, 건물 안 전용 컴퓨터에서만 열립니다. 두 번째 층은 api.bnf.fr입니다. 1,400만 건 이상의 카탈로그 레코드, Gallica의 수백만 건 디지털 자료, 필사본 기술 정보까지 담겨 있습니다. 인터넷만 되면 누구든 프로그래밍으로 접근할 수 있고, SRU, OAI-PMH, SPARQL, REST, IIIF까지 8개 API가 제공됩니다. Python과 R 래퍼 라이브러리까지 있습니다.


세 번째 층은 data.bnf.fr입니다. 저자, 저작, 주제 같은 레퍼런스 데이터(전거데이터)를 완전히 개방합니다. Wikidata, VIAF, 미국 의회도서관, 독일 국립도서관 등 글로벌 지식 그래프(Knowledge Graph)에 연결되어 있습니다. 그냥 오픈한 데이터가 아니라 링크드 오픈 데이터(Linked Open Data)입니다. 즉 콘텐츠는 보호하되 메타데이터는 접근 가능하게, 레퍼런스 데이터는 개방한다는 겁니다.


한국에 돌아오면 만날 풍경이 떠올랐습니다. 국가기록원의 기록물은 원칙적으로 '공개'이거나 '비공개'입니다. 그 사이가 거의 없고, 도서관도 비슷합니다.


BnF가 보여준 것은 그 사이에 중간 지대를 만든 설계방식입니다. 저작권이 걸린 원문은 건물 안에서 보호합니다. 하지만 그 원문의 메타데이터(누가 썼고, 어떤 주제이고, 어디에 소장되어 있는지)는 API로 열어둡니다. 그리고 인물, 주제, 장소 같은 레퍼런스 데이터는 아예 글로벌 웹에 연결합니다.


이 구조에서 AI 봇이 스크래핑할 수 있는 것은 세 번째 레벨의 레퍼런스 데이터뿐입니다. 이 데이터는 처음부터 열어놓기로 결정한 것이므로, 스크래핑의 윤리적 문제가 크게 줄어듭니다. 원문과 상세 메타데이터는 각각 물리적으로 접근하는 것을 제한하고, 스크래핑 속도를 제한하는 것으로 보호하고 있습니다.


가장 놀라운 발견은 워크스테이션에서 찾아낸 한 장의 PDF였습니다. data.bnf.fr의 최초 프로젝트 프레젠테이션으로, 날짜는 2011년 11월 15일이었습니다. 15년 전 문서에 이미 이렇게 적혀 있었습니다.


'우리는 BnF의 자원이 도시에서 도서관이 보이는 것만큼 웹에서도 보이기를 원한다.'

Présentation générale du projet data.bnf.fr, p2.

HTML 페이지와 RDF 데이터를 동시에 출력하는 이중 채널 구조는 나중에 덧붙인 기능이 아니라 창립 원칙이었습니다. 2026년 3월, 제가 보고 있는 시스템은 이 15년 전 설계도 위에서 여전히 작동하고 있었습니다.

이 작가의 멤버십 구독자 전용 콘텐츠입니다.
작가의 명시적 동의 없이 저작물을 공유, 게재 시 법적 제재를 받을 수 있습니다.

brunch membership
아키비스트J작가님의 멤버십을 시작해 보세요!

솔로프러너이자 기록물관리전문요원이며, AI 네이티브로 아카이브 스타트업을 운영하고 있습니다. AI 시대 모두가 잠재력을 극대화하고 인지적 평등이 실현되는 세상을 꿈꿉니다.

139 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 최근 30일간 1개의 멤버십 콘텐츠 발행
  • 총 41개의 혜택 콘텐츠
최신 발행글 더보기