Chapter 9. 데이터 수집하는 일상

by 민준

"진짜 승부는 어떤 데이터를 가지고 있느냐에 달렸어."


회사 최고들의 문서를 학습시킨 AI를 만들겠다는 목표가 생기자, 나는 완전히 다른 사람이 되었다.

아침에 출근하면 가장 먼저 하는 일은 공유 폴더 순찰이었다.

밤사이 새로 올라온 문서가 있는지, 혹시 놓친 우수 사례가 있는지 확인하는 것이다.


"오늘은 뭔가 새로운 보물이 있을까?"


데이터 사냥꾼의 탄생

점심시간이면 다른 부서의 공유 폴더를 기웃거렸다.

“전략기획팀 - 2024 사업계획서 (기획팀 에이스 김차장 작성)”
“마케팅팀 - 고객분석 보고서 (임원진 호평)”
“영업팀 - 분기실적 발표자료 (CEO 보고자료)”

이런 제목을 보면 심장이 두근거렸다. 마치 보물을 발견한 기분이었다.

"이건 꼭 다운받아야 해."

회의록, 아카이브, 심지어 휴지통까지 확인했다. 혹시 실수로 버려진 진주 같은 자료가 있을까 싶어서.


골룸의 심리

어느 순간부터 나는 데이터에 집착하는 골룸이 되어 있었다.

좋은 문서를 찾으면: “내 소중한 것…”
다른 사람이 같은 파일을 열면: “저 사람도 노리는 건가?”
누군가 내 화면을 힐끗 보면: “혹시 눈치챘나?”

USB에 저장하고, 개인 클라우드에 백업하며, 혹시 몰라 복사본을 쌓아두었다.
"언제 회사가 막아버릴지 몰라."


ChatGPT Image 2025년 10월 7일 오후 08_38_37.png


품질의 기준

모든 문서가 다 쓸모 있는 건 아니었다. 자연스럽게 나만의 품질 등급이 생겼다.

S급: 임원진이 칭찬한 전략 문서, 외부 발표용 최종본

A급: 회사 보고서 에이스들이 작성한 보고서, 정교한 분석자료

B급: 일반 직원 보고자료

C급: 흔한 회의록이나 업무 메모


나는 오직 S급과 A급만을 수집했다. 내 AI에는 최고만 들어가야 했다.


회사 vs 개인의 이중생활

마침 회사에서도 SLM 구축을 위해 전사 문서 수집에 들어갔다.

“모든 직원은 보유 문서를 제출해주시기 바랍니다.”

대부분의 직원은 별생각 없이 폴더를 통째로 올렸다. 개인정보든 미완성 자료든 가리지 않고.

하지만 나처럼 개인 AI를 만드는 이들은 달랐다.
“이건 개인 메모라서…”
“완성도가 부족해서…”

결국 핵심 자료들은 빼고 제출했다.


역설적인 결과

며칠을 지켜본 결과는 놀라웠다.

회사 AI는 무관심층이 낸 양질의 문서와, 관심층이 낸 평범한 문서를 섞어 학습

개인 AI는 관심층이 엄선한 최고 자료들만 학습


“아이러니하게도, 회사 AI보다 개인 AI가 더 좋은 데이터를 가진다.”


수집품 관리자의 집착

내 집에는 완전한 개인 데이터 아카이브가 구축됐다.

S급 문서/ 전략기획/ 마케팅/ 영업실적/ 임원발표/

A급 문서/ 팀장급 보고서/ 분석자료/ 우수사례/


파일 이름에는 날짜, 작성자, 품질 태그까지 달았다. 마치 귀중품을 분류하는 수집가 같았다.


품질 격차의 실감

몇 달 후, 내 개인 AI와 회사 SLM을 비교해볼 기회가 왔다.

질문: “효과적인 전략 보고서 작성 방법은?”

회사 SLM 답변 : 교과서 같은 원론적 조언

내 개인 AI 답변 : 김 차장의 노하우가 녹아 있는 실전적 지침


"역시… 데이터 품질이 답이었어."


은밀한 우월감과 새로운 욕망

사람들이 “회사에서 구축한 AI 시스템은 별로인 것 같아”라고 불평할 때마다 속으로 웃음이 났다.
"너희는 모를 거야. 진짜 AI가 어떤 건지."

그러다 욕망이 커졌다.
"혹시 다른 회사의 자료도 모을 수 있지 않을까?"

전 직장 동료, 외부 컨설턴트, 세미나 발표자료… 머릿속에서 새로운 데이터 사냥 지도가 그려지고 있었다.


정보 불평등의 시작

그제야 확실히 보였다.
AI 시대의 불평등은 기술이 아니라 데이터에서 나온다.

데이터 부자: 고급 정보로 학습한 강력한 AI를 가진 사람들

데이터 빈자: 공개 자료에 의존하는 평범한 AI 사용자


나는 확실히 데이터 부자의 길을 걷고 있었다.


다음 이야기

그러나 점점 불안이 스며들었다.

“내가 이렇게 모은 자료들, 개인 정보와 회사 기밀까지 다 학습시킨 내 AI가… 결국 나 자신보다 나를 더 잘 알게 되는 건 아닐까?”

편리함과 맞바꾼 위험.


“내 AI가 나를 삼키는 날이 오면 어떡하지?”

월요일 연재
이전 08화Chapter 8. 나를 닮은 기계 길들이기