brunch

You can make anything
by writing

C.S.Lewis

by YJ May 11. 2024

네 죄를 네가 알렷다

 Rag (Retrieval-Augmented Generation, 검색 증강 생성)도 못하면서
무슨 AI 개발자라고 본인의 프로젝트 기여도를 주장하지요?


셰일라 힉스의 섬유뭉치 설치 [착륙] Copyright 2024. Diligitis. All rights reserved.

 바야흐로 대한민국도 AI 시대에 진입했나 봅니다. AI 관련 소송들이 쏟아져 나오는데 판례가 없어 애를 먹고 있습니다. 문과 출신의 수사관이나 변호사들은 기술을 잘 알지 못해 용어부터 친절하게 설명을 하고 들어가야 합니다. "할루시네이션 (hallucination)은 알지요?"라고 물어봤더니 "게임에서 나오는 것 아니냐?"라며 상상을 초월하는 답변을 내놓습니다. 피해자로서 고소를 진행해야 하니까 화를 내지는 못하고 웃픈 상황이 연출되었습니다. 옆집 할머니께 쉽게 설명을 해드리듯 용어를 풀어봅니다. 왜 그 사람이 잘못을 했고, 무엇을 어떻게 잘못했는지에 대해 네 시간 동안 목청을 높여 진술하고 나니 목이 아픕니다. 이럴 줄 알고 챙겨간 자허블 (자몽허니블랙티)로 목을 축여봅니다. 공대 나온 변호사님을 모실걸 후회까지 듭니다. 저작권법 위반을 이야기하는데 무슨 AI 특허가 있냐고 바보 같은 질문을 하는 건가요? "특허는 MS 등 글로벌 기업이 가지고 있어요. 저는 그 위에 애플리케이션을 만들어 사업하는 작은 스타트업에 불과합니다."라고요.


 데이터 전문가들의 몸값이 상한가였을 때가 있었습니다. 기업들이 앞다투어 인재를 영입하면서 전공 선호도 1순위이기도 했습니다. 그런데 블록체인과 AI 열풍이 불더니 인재 쏠림현상이 발생했습니다. 요즘은 마케팅의 기본이 데이터를 가공하는 것인데 대체 고수들은 어디에 숨어있는 것일까요? DB가 무엇이냐고 물으신다면 불규칙하게 보이는 데이터를 활용할 수 있도록 태깅해 놓은 것입니다. 하루가 멀다 하고 쏟아져 나오는 낯선 용어에 대한 개념을 잡기 어려울 때는 비유를 하면 편리합니다. 내가 아는 것과 공통점과 차이점을 찾다 보면 막연하던 개념이 선명하게 그려집니다. 데이터는 일반 파일과 달리 검색, 추출, 입력과 정렬이 수월합니다. 아무나 접근하지 못하게 보안 기능을 추가해야 합니다. 수정과 삭제가 불가능한 블록체인의 분산 원장 같은 데이터베이스도 있습니다. AI에서 벡터 테이터와 LLM이 연결된 랭체인 (LangChain) 프레임워크를 통해 연결되는 구조입니다. 벡터화된 토큰에는 음성, 이미지, 텍스트 등을 넣을 수 있고요. 수치화된 데이터 저장과 유사도 측정으로 의미기반의 쿼리를 추출 가능하게 합니다.


 남녀노소 누구나 한 번씩은 사용해 본 엑셀이 있습니다. 하지만 빅데이터가 등장하면서 엑셀에 입력가능한 용량을 훌쩍 넘어섭니다. 1,048,576이 행의 최대이고 XFD 열이 마지막이네요. A-Z가 26개, AA-ZZ가 676개, AAA-WZZ가 15548개, XAA-XEZ가 130개, XFA-XFD가 4개이니, 열의 최대는 16,384입니다. 셀의 최대는 1,048,576 ×16,384=17,179,869,184입니다. 모든 정보를 다 담을 것 같았는데 이 정도로는 턱없이 용량이 모자랍니다. 그래서 나온 것이 관계형 DB로 잘 알려진 오라클인데 높은 시장 점유율만큼 가격도 수 억대로 연매출 10억 원 이하의 자영업자에게는 부담스러울 수 있습니다. 결국 사용한 만큼 가격을 지불하는 클라우드형 DB가 등장했습니다. AWS, MS 등 우리가 알고 있는 글로벌 기업으로 MySQL은 관계형 DB로 다른 시스템과도 호환이 잘 됩니다. 그런데 sns가 나오면서 관계형 DB로 처리할 수 없는 데이터가 생겨나고요, NoSQL (Not Only SQL) 개념이 등장합니다. 혜성같이 MongoDB가 나오는데 MySQL과 호환이 되어 편리합니다. 그런데 오라클이 MySQL을 인수해 버리면서 독점 체재로 되돌아갑니다. 결국 MySQL의 창립자가 나와 오픈소스 기반의 MariaDB를 다시 만들지요. MySQL과 완벽하게 호환되고 로고를 보면 돌고래와 물개가 묘하게 거울 대칭으로 닮았습니다.


 역사의 변증법과 같습니다. 인상주의에 반대한 후기 인상주의가 일어나듯 모더니즘이 지루해지며 포스트 모더니즘이 등장합니다. 삶이 역사와 무관한 듯싶지만 한 세대를 지나 보면 반복되는 패턴이 눈에 들어오기 시작합니다. 초파리에게 일 년 사계절의 변화가 무의미하듯, 연륜이 부족한 청년에게는 기성세대의 무용담이 픽션처럼 들릴 수 있습니다. '아는 것이 힘'이라는 대명제는 착각일 수 있습니다. 지식으로만 알고 실천을 못한다면 진정 무언가를 안다고 할 수 없습니다. 박지원은 <허생전>에서 "도대체 글만 읽으면 밥이 나옵니까? 쌀이 나옵니까?" 예나 지금이나 사농공상을 따지는 한국에서 고급 MBA와 박사 학위는 자기만족일 수 있습니다. 배우는 것이 즐거워 사브작 결과물을 냈지만 메타나 애플 같은 대제국 하나 만들지 못했으니까요. 다행인 것은 아직도 꿈이 있고 호기심 가득하며 소통을 즐긴다는 것이죠. 영원한 제국은 없습니다. CPU가 전부였던 시대는 가고 AI가 급부상하면서 GPU가 중심에 등장하였습니다. 더 이상 관계형 DB로 저장하고 꺼내 쓰기가 어려워졌고요. 친구의 친구가 당신을 증명하는 시대가 되었습니다. 10년 전 등장했던 비트코인은 반감기를 맞으며 화폐로서의 기능은 분리하고 스마트 컨트랙트를 민주주의라는 하이퍼 레저로 활용하기에 이릅니다. 매일 검색하고 대화하고 로그인하면 받는 생활반응, 당신의 모든 행동이 데이터를 생성합니다. 어디에 가고, 무엇을 사고, 무엇을 먹는지 데이터가 쌓이고 이를 분석하면 정책이 나올 수 있습니다. 과거에는 책을 통해 지식이 전파되었지만 이제는 데이터를 읽고 미래를 예측하고 인사이트를 얻습니다. 세상이 바뀌었는데 젊은 꼰대를 마주할 때면 시간이 너무 아깝게 느껴지는 것은 혼자만의 착각이 아니겠지요.

이전 14화 창과 방패의 대결
brunch book
$magazine.title

현재 글은 이 브런치북에
소속되어 있습니다.

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari