brunch

AI는 무엇을 '먹고' 똑똑해지는가

AI 시대, 우리에게 '문헌정보학'이 필요한 이유

by 김경훈


오늘날 우리는 챗GPT와 같은 생성형 인공지능(AI)이 만들어내는 놀라운 결과물들을 목격하고 있습니다. AI는 어떻게 그토록 방대한 지식을 학습하고, 인간처럼 논리적인 글을 쓰거나 복잡한 이미지를 생성할 수 있게 되었을까요?


그 해답은 AI가 '학습'하는 재료, 즉 '데이터'에 있습니다. 하지만 여기서 중요한 전제가 있습니다. AI는 그저 데이터를 많이 '먹기만' 해서 똑똑해지는 것이 아닙니다.


컴퓨터 공학의 오랜 격언인 'Garbage In, Garbage Out (쓰레기를 넣으면 쓰레기가 나온다)'은 AI 시대에 그 어느 때보다 중요해졌습니다. AI의 성능, 편향성, 신뢰도는 전적으로 학습 데이터의 '질'에 달려있기 때문입니다.



1. '데이터 큐레이션'이라는 숨은 조력자


AI에게 무질서하고 편향된 데이터를 그대로 주입한다면, AI 역시 편향되고 잘못된 정보를 생산해 낼 것입니다. AI가 세상을 올바르게 인식하고 유용한 결과물을 내놓기 위해서는 학습 이전에 데이터를 선별하고, 정제하며, 체계적으로 조직하는 과정이 필수적입니다.


이 과정을 우리는 '데이터 큐레이션(Data Curation)'이라고 부릅니다. 그리고 이 분야는 문헌정보학 전문가들이 가장 탁월한 역량을 발휘하는 영역 중 하나입니다.


미술관의 큐레이터가 작품을 선별하고 의미 있는 맥락을 부여해 전시하듯, 데이터 큐레이터는 방대한 데이터 속에서 가치 있는 것을 선별하고, 정제하며, AI가 '이해할 수 있는' 형태로 가공합니다.



2. 기계가 이해하는 언어, '메타데이터'


문헌정보학은 어떻게 이 일을 수행할까요? 핵심은 '메타데이터(Metadata)'와 '정보 조직(Information Organization)'에 있습니다.


'메타데이터'는 '데이터에 관한 데이터'를 의미합니다. 쉽게 말해 '꼬리표'나 '라벨'입니다. 예를 들어, 'IMG_1234.jpg'라는 파일명만으로는 AI가 그 안의 내용을 알 수 없습니다. 하지만 문헌정보학의 원칙에 따라 여기에 '파리', '에펠탑', '야경', '2025년 촬영'이라는 체계적인 메타데이터를 부여하면, 비로소 AI는 이 이미지를 '학습 가능한' 정보로 인식하게 됩니다.


더 나아가 문헌정보학은 '파리'는 '도시'이고, '프랑스'에 속하며, '에펠탑'은 '랜드마크'라는 식의 관계망, 즉 정보 분류 체계(Taxonomy & Ontology)를 설계합니다. AI가 단순히 데이터를 암기하는 것을 넘어, 지식의 구조를 학습하고 추론할 수 있게 되는 기반을 마련하는 것입니다.



3. 보이지 않는 질서의 설계자들


결국 AI의 눈부신 발전 뒤에는 이처럼 보이지 않는 곳에서 데이터의 질서를 잡는 '데이터 큐레이터'들의 노력이 숨어있습니다.


'문헌정보학'은 단순히 오래된 문헌을 보관하는 학문이 아닙니다. 그것은 본질적으로 '정보를 분류하고, 조직하며, 가치를 부여하고, 접근 가능하게 만드는' 학문입니다. AI라는 최첨단 기술이 제대로 작동하기 위해 가장 고전적이면서도 본질적인 '정보 관리'의 원칙이 핵심 기반으로 작용하고 있는 것입니다.


이들이 설계한 질서 위에서 AI는 더 정확하고, 더 공정하며, 더 유용한 방향으로 발전할 수 있습니다. 문헌정보학이 '미래 학문'이라 불리는 이유가 바로 여기에 있습니다.

keyword
매거진의 이전글'진짜'를 판별하는 능력은 어떻게 만들어지는가