[방구석5분혁신.디지털&AI]
[방구석5분혁신=안병민] 금융의 역사는 두 가지 질문에 대한 끝없는 도전이었다. ‘미래는 어떻게 될 것인가?’라는 예측의 문제, 그리고 ‘이 거래를 어떻게 믿을 것인가?’라는 신뢰의 문제. 인류는 이 두 과제를 해결하기 위해 날카로운 직관과 복잡한 법률, 그리고 중앙은행이라는 거대한 시스템을 만들었다. 인간의 경험과 사회적 약속에 기반한, 지극히 인간적인 해법이었다.
그러나 이제, 인간의 뇌를 초월한 ‘예측의 신(AI)’과 인간의 신뢰를 코드로 구현한 ‘계약의 신(블록체인)’이 강림했다. 이 두 신적인 존재는 인간의 개입이라는 변수를 지우고, 오직 데이터와 알고리즘으로 금융의 판을 새로 짜려 한다. AI는 ‘성장’의 엔진을, 블록체인은 ‘분배’의 규칙을 제시한다. 이 두 거대한 코드가 만나 어떻게 금융이라는 세계를 근본부터 재설계하는지, 그 혁명의 현장으로 깊숙이 들어가 보자.
1부: AI, 불확실성의 영역을 정복하다 (성장의 엔진)
AI로 점집을 차려보겠다는 발칙한 상상? 단순한 농담이 아니다. 미래를 정확히 예측할 수 있다면, 그것이야말로 최고의 비즈니스 아닌가. 예컨대, 어떤 책이 몇 권 팔릴지, 어떤 주식이 얼마나 오를지를 미리 아는 것. 이것이 바로 AI를 통해 실현하려는 미래 예측의 핵심이다.
1. 인간이 물러서자, 신의 지능이 탄생했다
데이터와 지능의 관계를 이렇게 설명할 수 있다. 데이터를 많이 주면 지능은 더 똑똑해진다. 기존의 머신러닝도 데이터를 통해 똑똑해지지만, 어느 순간 성장의 한계에 부딪힌다. 하지만 딥러닝, 즉 우리가 열광하는 AI는 다르다. 그 성능 곡선은 한계 없이 치솟는다. 데이터를 먹으면 먹을수록 AI 지능은 인간 수준을 아득히 뛰어넘어 버린다. 이 현격한 격차는 어디서 오는 걸까? 바로 ‘인간의 개입’ 여부다.
전통적인 머신러닝은 데이터 마이닝 전문가가 기계와 함께 일하는 방식이었다. "신용카드 연체 기록이 있으면 대출 불가"처럼, 어떤 변수를 쓸지, 어떤 기준으로 판단할지 인간이 직접 규칙을 정의하고 기계를 가르쳤다. 똑똑한 ‘김 대리’ 수준의 자동화가 그래서 가능했다. 하지만, 전 세계 20억 명의 얼굴 사진을 주고 누가 누구인지 식별하는 규칙을 만들라고 한다면? 인간은 불가능하다. 인간이 외려 시스템 전체의 병목이었던 셈이다.
딥러닝은 이 전제를 파괴한다. 인간이 과감하게 뒤로 물러나 기계에게 모든 것을 맡긴다. “전 세계 유튜브 영상을 다 보고 결론을 내려.” “어젯밤 쏟아진 모든 자료를 읽고 포트폴리오를 짜.” 이건 인간의 영역이 아니다. 아무리 뛰어난 인재라도 불가능한 일이다. 하지만 기계는 할 수 있다.
인간이 자신보다 똑똑한 존재를 만들 수 있을까? 사실상 불가능하다. 접근법을 바꿔야 하는 이유다. 가르침의 영역이 아니라서다. 믿음의 영역이라서다. ‘될 것이다’라고 믿고 달리는 것. 챗GPT가 그 증거다. 웬만한 사람보다 똑똑하고, 방대한 지식을 요약하며, 어떤 질문에도 답하는 이 지능을 누가 가르쳤을까? 수십 명의 선생님이 붙는다고 될 일이 아니다. 상상조차 힘든 양의 데이터를 학습시켰더니, 기계 ‘스스로’ 지능을 터득한 것이다. 누군가는 그 가능성을 믿고 달렸고, 세상은 이에 응답했다. ‘범용 근사 정리(Universal Approximation Theorem)’라는 단단한 이론적 토대 덕분이다. 이 정리가 약속하는 바는 명확하다. 만약 어떤 과업이 ‘학습 가능한 것’이라면, 인공 신경망은 그것을 ‘반드시 학습할 수 있다’는 것. 맹목적인 믿음이 아니었다. 이론적으로 보장된 가능성이었다.
수십 년간 언어학자들은 단호했다. “기계가 인간처럼 언어를 배우는 건 불가능해! 30개 국어를 자유자재로 구사하는 로봇을 만든다고? 그 언어들을 누가 다 가르칠 건데?” 하지만 그런 기계, 대형언어모델(LLM)이, 탄생했다. 챗GPT 개발팀은 ‘언어는 학습 가능한 것’이라 믿었다. 그리고 인공 신경망에 상상조차 힘든 방대한 양의 데이터를 쏟아부었다. 기계는 ‘스스로’ 언어의 구조와 맥락, 심지어 뉘앙스까지 터득했다. 어떻게 해냈는지는 인간의 지성으로 온전히 이해할 수 없다. 중요한 건 그게 가능하다는 사실이다.
여기서 얻을 수 있는 중요한 시사점? 인간 중심의 사고방식으로는 혁신에 도달할 수 없다는 거다. 인간의 관점을 내려놓고 초월적 상상으로 나아갈 때 비로소 새로운 서비스가 태어난다. 자신보다 뛰어난 지능을 만들어낸 인간의 발명도 핵심은 ‘나’를 내려놓는 데 있었다. 노자와 장자가 말했던 ‘비움’과 ‘버림’의 미학이 겹쳐 보인다. 챗GPT 개발팀의 철학도 다르지 않았다. “우리는 기계에게 언어를 가르치려 하지 않았다. 다만 기계가 스스로 터득할 수 있도록 했을 뿐이다.” 학습 환경을 만들어주면, 기계는 스스로 학습한다. ‘키움’이 아니라 ‘자람’이다. 인간의 개입을 최소화할 때, 비로소 인간을 뛰어넘는 지능이 탄생한다. 새로운 판의 규칙이다.
이 거대한 변화의 핵심을 이해하기 위해 간단한 프레임워크를 보자. 학습 데이터를 누가 제공하고(Data Provided by), 학습을 누가 수행하는가(Modeling by).
1) 기계 학습 (Machine Learning): Human(데이터) + Human with Machines(모델링)
전통적인 방식이다. 인간이 만든 데이터를 인간과 기계가 함께 학습한다. "신용카드 연체 기록이 있으면 대출 불가"처럼 인간이 만든 규칙(Rule) 기반이다.
2) 딥러닝 (Deep Learning): Human(데이터) + Machine only(모델링)
여기서 혁신이 시작된다. 데이터는 여전히 인간이 만들지만, 학습 과정에서 인간이 빠진다. ‘노동으로부터의 해방’인 동시에, ‘인간이 할 수 없었던 일’이 가능해짐을 의미한다. 예를 들어보자. 전 세계 50억 명의 얼굴 사진을 주고 누가 누구인지 식별하는 규칙을 만들라고 한다면? 인간은 불가능하다. AI는 해낸다. 99.9%의 정확도로.
핵심은 이것이다. ‘인간이 할 수 없는 과업’을 정의하고 AI에게 맡기는 것. 그러니 인간의 한계를 인정하고 상상력의 크기를 키워야 한다. “AI로 전 세계 모든 언어를 통하게 할 수 있을까?”처럼 거대한 꿈을 꿀 때, 그에 걸맞은 거대한 결과물이 탄생한다.
알파고를 통해 이 변화를 더 쉽게 이해해 보자. 알파고는 어떻게 탄생했을까? 앞서 본 프레임워크에 따르면, 알파고는 ‘인간의 데이터(Human Data)’로 학습했다. 프로 기사들의 모든 대국 기록, 즉 인간의 기보를 통째로 학습한 거다. 어깨너머로 배운 수준이 아니다. 인류 바둑의 역사를 단 하루 만에 마스터한 셈이다.
과거 우리가 바둑을 배울 땐 ‘정석’을 외웠다. “이 상황에선 이렇게 둬야 해.” 승리 확률이 가장 높은, 검증된 수순. 머신러닝의 ‘룰 베이스’와 같다. 하지만 딥러닝으로 학습한 알파고는 달랐다. 누가 가르쳐주지 않아도, 스스로 최적의 수를 ‘터득’했다. 인간의 개입 없이 기계가 스스로 깨우친 것이다.
이세돌 9단과의 네 번째 대국. 이미 승패가 결정된 상황에서 이세돌은 질문을 던진다. “네가 배운 인간의 바둑, 그 틀을 벗어난 수를 두면 어떻게 할 건데?” 그리고 이어진 ‘신의 한 수’. 알파고는 학습한 적 없는 수 앞에서 무너졌다. 이 일화는 중요한 사실을 알려준다. 딥러닝 AI도 결국 데이터의 산물이다. 학습하지 못한 데이터 앞에서는 취약할 수 있다.
하지만 핵심은 이거다. 학습 과정에서 ‘Human’이라는 글자가 빠지면서, 우리는 인간의 한계를 뛰어넘는 분석을 AI에게 맡길 수 있게 되었다는 거다. “인간이 하던 만큼, 인간이 하던 대로 분석해”라는 요구로는 챗GPT 같은 혁신을 이룰 수 없다. 리더의 꿈이 더 커져야 하는 이유다. 인간의 한계를 넘어선 과업을 상상하고 정의할 때, AI는 비로소 진정한 잠재력을 발휘한다.
2. 미래를 읽는 데이터 예언자: AI가 서점의 운명을 바꾸다
이러한 사고의 전환이 어떻게 현실의 문제를 해결하는지, 실제 프로젝트를 살펴보자. 코로나 팬데믹. 온라인 도서 판매량이 40% 폭증했다. 서점 창고가 터져 나갔다. 재고 관리가 무너졌다. 한 대형 서점의 SOS. 과제는 단 하나, “이 책이 내일 몇 권 팔릴 것인가?”를 맞추는 거였다.
기존 방식은 단순했다. ‘지난 4주간 판매량의 평균’을 쓰는 거다. 그럴듯해 보이지만, 이 방식은 뾰족한 현실을 뭉툭하게 만든다. 갑작스러운 수요 급증이나 급감 같은 변동성을 전혀 예측하지 못한다. 결과는 둘 중 하나다. 재고가 부족해 팔 기회를 놓치거나(날아간 매출), 재고가 남아돌아 창고에 돈이 잠기는 것(재고 비용). 둘 다 문제다.
AI는 이 문제를 어떻게 풀었을까? 과거 판매량의 시계열 데이터를 ‘어텐션 LSTM’ 같은 정교한 딥러닝 알고리즘으로 학습했다. 단순히 평균을 내는 게 아니다. 데이터에 숨겨진 복잡한 패턴과 주기성을 파악했다. 예컨대, 도서 판매 데이터에는 세 가지 뚜렷한 패턴이 보인다. 첫째, 초기 폭발형이다. 베스트셀러에서 흔히 나타난다. 초반에 판매가 폭발적으로 늘고 이후에는 긴 꼬리를 남기며 서서히 감소한다. 둘째, 계절성이다. 특정 시기가 되면 불티나게 팔린다. 봄의 ‘벚꽃엔딩’, 크리스마스의 캐럴, 새해 수학 참고서가 그 예다. 셋째, 꾸준함이다. 잡지처럼 매일 혹은 매주 일정량이 안정적으로 팔린다. AI는 이런 과거의 리듬을 학습해 미래를 예측한다. 결과는 놀라웠다. 예측 오차율을 기존 방식 대비 40% 이상 줄였다. 미래를 더 정확히 예측하는 것만으로, 양쪽에서 새는 돈을 막고 비즈니스의 효율을 극대화한 거다.
프로젝트가 순항하던 어느 날, 진짜 질문이 날아왔다. “기존 책은 알겠고, 신간은 어떻게 할 건데?” 판매 기록이 전혀 없는, 세상에 처음 나온 책의 미래를 예측하라는 것. 과거 데이터라는, 기댈 곳이 사라진 거다. 과거가 없는 책의 미래는 어떻게 알 수 있을까? 이건 완전히 다른 차원의 문제, 진짜 ‘점’을 쳐야 하는 영역이었다.
여기서 다시 한번, 생각의 전환이 필요했다. 판매량 데이터가 없다면? 책 자체를 데이터로 삼으면 된다. 발상은 단순하고 과감했다. AI에게 10만 권의 책을 통째로 읽게 했다. 왜 10만 권일까? 해당 서점에 있는 책은 무려 350만 종. 이걸 모두 분석하는 건 불가능하다. 범위를 좁혔다. 1년에 단 한 권이라도 팔리는 책은 약 60만 종이다. 여기에 파레토 법칙을 적용했다. ‘전체 매출의 80%는 상위 20%의 책에서 나온다’는 것. 60만 종의 20%는 12만 종. 그 핵심, 최상위 10만 권을 타겟으로 삼았다. 이 10만 권만 제대로 분석해도 전체 매출의 80%를 커버할 수 있다는 전략적 판단이었다.
단순한 텍스트 분석이 아니었다. 여러 종류의 데이터를 동시에 다루는 ‘멀티모달 러닝(Multi-modal Learning)’이었다. 먼저, 텍스트 데이터는 책의 본문이다. BERT 알고리즘이 단어와 문장의 맥락을 분석해 내용의 가치와 판매 잠재력을 평가한다. 다음, 이미지 데이터는 책의 표지다. 디자인이 주는 시각적 매력도를 수치화한다. 실제로 표지는 판매량의 약 15%를 좌우하는 변수로 작용한다. 마지막으로, 메타 데이터는 작가의 인지도, 출판사의 평판, 가격 등 책을 둘러싼 모든 부가 정보를 포함한다. 이렇게 이질적인 세 가지 데이터를 AI가 종합적으로 분석해, 한 권의 책이 맞이할 미래를 ‘대박’, ‘중박’, ‘소박’, ‘실패’ 네 가지 결과로 예측하게 했다.
지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠