brunch

You can make anything
by writing

C.S.Lewis

by YJ May 11. 2024

당신을 포렌식 하였습니다

 Rag (Retrieval-Augmented Generation, 검색 증강 생성)도 못하면서
무슨 AI 개발자라고 본인의 프로젝트 기여도를 주장하지요?


 대한민국도 바야흐로 AI 시대에 들어섰습니다. 하루가 다르게 쏟아지는 혁신기술 속에서 정치와 법은 흐름을 따라가지 못하고 있습니다. 그녀는 변호사 사무실에 앉아 업무를 보고 있습니다. 최근 AI 관련 소송이 급증하고 있었지만, 판례가 없어 모두가 애를 먹고 있었습니다. 문과 출신의 수사관과 법을 전공한 검사, 변호사들은 기술을 전혀 이해하지 못했습니다. 영문 회사명조차 정확하게 발음하지 못하는 수사관을 앞에 앉혀두고 결국 그녀는 기술 용어부터 차근차근 설명해야 했습니다.


“할루시네이션(hallucination)에 대해 들어본 적 있으시죠?”


그녀가 물었을 때, 뇌순남 진 순경의 반응은 그녀의 예상을 한참 벗어났습니다.  


“그거 게임에서 나오는 거 아니에요?”


답변에 순간 당황했지만, 연주는 겨우 웃음을 참았습니다. 피해자로서 수사를 받고 이 상황을 풀어가야 했기 때문에 모른다고 화를 낼 수는 없었습니다. 옆집 할머니에게 설명하듯, 할루시네이션이 무엇인지, 그리고 왜 문제가 되는지를 풀어가기 시작했습니다. 가해자의 잘못이 무엇인지, 뭐가 잘못된 것인지에 대하여 네 시간 동안 쉴 새 없이 목소리를 높여 진술했습니다. 시간이 흐를수록 목이 아파왔습니다.


미리 준비해 온 자몽허니블랙티, 일명 자허블을 꺼냈습니다. 식어 미적지근해진 차 한 모금이 지친 목을 달래줬습니다. 그녀는 문득 후회가 밀려왔습니다. '차라리 공대 나온 변호사를 모셨어야 했나?' 저작권법 위반을 설명하던 중, 수사관은 "그러면 당신 회사에 AI 특허가 있는 거냐?"라고 우문을 물어왔고, 그녀는 피가 거꾸로 솟구치는 듯 인내심의 한계를 느꼈습니다.


“생성형 AI특허는 Google, MS 같은 글로벌 기업이 가지고 있는 거죠. 우리는 그 위에 애플리케이션을 만들어 사업하는 스타트업일 뿐이에요. 도대체 몇 시간을 설명했는데 이해가 안 가세요?”


그녀는 차분하게 설명했지만, 머릿속에서는 끊임없이 복잡한 감정이 교차했습니다. AI 기술을 다루는 시대에, 법은 아직도 얼마나 뒤처져 있는가. 그녀는 이 소송이 단순한 싸움 그 이상이라는 것을, 그리고 기술과 법의 접점에서 벌어질 또 다른 수많은 싸움들을 예감하고 있었습니다.


차 한 모금을 들이키며, 잠시 눈을 감았습니다. 먼 길이 남아 있지만, 그녀는 준비되어 있었습니다. AI 시대의 법적 투쟁은 이제 막 시작되었고, 그녀는 최전선에 서 있습니다.


 데이터 전문가들의 몸값이 상한가였을 때가 있습니다. 기업들이 앞다투어 인재를 영입하면서 전공 선호도 1순위이기도 했습니다. 그런데 블록체인과 AI 열풍이 불더니 인재 쏠림현상이 발생했습니다. 요즘은 마케팅의 기본이 데이터를 가공하는 것인데 대체 고수들은 어디에 숨어있는 것일까요? DB가 무엇이냐고 물으신다면 불규칙하게 보이는 데이터를 활용할 수 있도록 태깅해 놓은 것입니다. 하루가 멀다 하고 쏟아져 나오는 낯선 용어에 대한 개념을 잡기 어려울 때는 비유를 하면 편리합니다. 내가 아는 것과 공통점과 차이점을 찾다 보면 막연하던 개념이 선명하게 그려집니다. 데이터는 일반 파일과 달리 검색, 추출, 입력과 정렬이 수월합니다. 아무나 접근하지 못하게 보안 기능을 추가해야 합니다. 수정과 삭제가 불가능한 블록체인의 분산 원장 같은 데이터베이스도 있습니다. AI에서 벡터 테이터와 LLM이 연결된 랭체인 (LangChain) 프레임워크를 통해 연결되는 구조입니다. 벡터화된 토큰에는 음성, 이미지, 텍스트 등을 넣을 수 있고요. 수치화된 데이터 저장과 유사도 측정으로 의미기반의 쿼리를 추출합니다.


20세기 엑셀은 누구에게나 익숙한 프로그램이었습니다. 회의록, 가계부, 통계 분석까지 모든 데이터가 엑셀에 들어갈 수 있을 것만 같았던 때가 있습니다. 하지만 빅데이터의 시대가 오면서, 엑셀의 한계가 드러나기 시작했습니다. 1,048,576개 행과 XFD 열까지—마지막 셀이 끝나는 지점은 분명히 있었습니다. 수많은 열과 행을 채워도, 빅데이터 앞에서는 턱없이 부족했습니다.


그녀는 컴퓨터 앞에서 깊은 한숨을 내쉬었습니다. 17,179,869,184개의 셀에 모든 정보를 담을 수 있을 거라 믿었지만, 현실은 달랐습니다. 이젠 엑셀을 넘어선 무언가가 필요했습니다. 그래서 나온 것이 관계형 데이터베이스였죠. 오라클 같은 시스템은 방대하지만, 그만큼 가격도 만만치 않았습니다. 연매출이 10억 원도 안 되는 자영업자들에게는 손이 닿지 않는 꿈같은 도구였을 뿐입니다.


그녀는 10년 전 오라클의 거대한 시장 점유율을 바라보며, 더 나은 대안을 찾기 시작했습니다. 때마침 클라우드형 데이터베이스가 등장했습니다. AWS, MS—누구나 익히 알고 있는 글로벌 기업들이 하나둘씩 클라우드 솔루션을 내놓았습니다. 그중에서도 MySQL은 특히 매력적이었습니다. 다른 시스템과도 쉽게 호환되고, 관계형 DB로서 그만한 효율을 자랑했습니다. 그러나 SNS가 등장하면서, 전통적인 관계형 데이터베이스로는 처리할 수 없는 새로운 형태의 데이터들이 넘쳐났습니다.


이때 나타난 것이 NoSQL, 말 그대로 'Not Only SQL (SQL 만이 아니다)'. 그녀는 새로운 패러다임의 등장에 놀랐습니다. 모든 것이 빠르게 변해가는 세상에서, 흐름을 잡으려면 더 큰 유연성이 필요했습니다. 혜성처럼 등장한 MongoDB는 NoSQL의 중심에 있었습니다. 그리고 또다시, 기술의 흐름은 돌고 있었습니다.


하지만 오라클은 MySQL을 인수했습니다. 세상은 다시 독점으로 회귀하는 것처럼 보였습니다. 그녀는 오라클의 거대한 그림자 아래 무언가 큰 변화가 일어날 것을 직감했습니다. 그리고 그 직감은 적중했습니다. MySQL의 창립자가 회사를 떠나 새로운 길을 열었습니다. 그가 만든 MariaDB는 오픈소스 기반으로, MySQL과 완벽하게 호환되었습니다. 그녀는 MariaDB의 로고를 보며 미소를 지었습니다. 돌고래와 물개가 서로 거울처럼 마주 보고 있는 이미지는 어딘가 익살스럽고 상징적이었습니다. 기술의 끝없는 순환을 상징하는 듯했습니다.


그녀는 다시 한번 깊은숨을 들이마시며 새로운 시대, 새로운 도구. 데이터의 홍수 속에서 기술은 끊임없이 진화하고 있음에 설렙니다. 선택은 그녀의 몫이었습니다. 그리고 이제, 그녀는 그 선택의 기로에 서 있습니다.


 역사의 변증법과 같습니다. 인상주의에 반대한 후기 인상주의가 일어나듯 모더니즘이 지루해지며 포스트 모더니즘이 등장합니다. 삶이 역사와 무관한 듯싶지만 한 세대를 지나 보면 반복되는 패턴이 눈에 들어오기 시작합니다. 초파리에게 일 년 사계절의 변화가 무의미하듯, 연륜이 부족한 청년에게는 기성세대의 무용담이 픽션처럼 들릴 수 있습니다. '아는 것이 힘'이라는 대명제는 착각일 수 있습니다. 지식으로만 알고 실천을 못한다면 진정 무언가를 안다고 할 수 없습니다.


 "도대체 글만 읽으면 밥이 나옵니까? 쌀이 나옵니까?"

 -연암 박지원의 <허생전>에서


예나 지금이나 출신대학을 따지는 한국에서 MBA와 박사 학위는 자기만족일 수 있습니다. 이찬우 당신도 결국 16년 공무원 재임기간 중에 2년간 석사학위를 따고 2년 반 가족과 연수를 빙자하여 외유한 세속적인 사람이었습니다. 참, 당신의 이름 한자를 보고 웃음이 났습니다. 찬우 (粲雨), 하얀 쌀밥이 비로 내리다니 평생 밥 굶을 걱정은 없어 좋겠습니다.


나는 공부하는 것이 즐거워 사브작 결과물을 냈지만, Meta나 Apple 같은 대제국 하나 만들지 못했으니 루저입니다. 뿐만 아니라 국내 재직기간 10년을 채우지 못해 당신처럼 국민연금도 못 탈 실정이지요. 다행인 것은 아직도 꿈이 있고 호기심 가득하며 소통을 즐긴다는 것이죠. 영원한 제국은 없습니다. CPU가 전부인 시대는 가고 AI가 급부상하면서 GPU가 중심으로 등장하였습니다. 더 이상 관계형 DB에 저장하고 꺼내 쓰기가 어려워졌습니다. 쉽게 말하자면 '친구의 친구'가 당신의 가치를 증명하는 시대가 되었습니다. 비트코인은 반감기를 맞으며 화폐로서의 기능은 분리되고 스마트 컨트랙트로 민주주의를 뒷받침하는 하이퍼 레저로 활용하기에 이릅니다. 매일 검색하고 대화하고 로그인하는 생활반응, 당신의 모든 행동이 데이터를 생성합니다. 어디에 가고, 무엇을 사고, 무엇을 먹는지 데이터가 쌓이고 이를 분석하면 정책이 나올 수 있습니다. 과거에는 책을 통해 지식이 전파되었지만 이제는 데이터를 읽고 미래를 예측하고 인사이트를 얻습니다. 세상이 바뀌었는데 젊은 꼰대를 마주할 때면 시간이 너무 아깝게 느껴지는 것은 혼자만의 착각이 아니겠지요.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari