brunch

코드 범람의 시대, 데이터 희소의 시대에서 개인의 기회

묻고 따져서 개념을 만들고 실행하는 디지털 전환

by 안영회 습작

이 글은 링크드인에서 만난 좋은 글이 만들어 준 생각을 풀어낸 것입니다.


명확한 관점 제시나 새로운 관점 전환이 주는 지적 자극

<코드가 공짜가 될 때, 진짜 돈은 어디서 나오는가>에서는 빅테크의 발 빠른 LLM 서비스 업데이트의 목적을 다음과 같이 명료하게 요약해 줍니다.

그 목적은 두 가지다. 첫째, 우리를 paying customer로 만드는 것. 둘째, 우리가 만든 결과물을 활용하고 선전해서 추가적인 고객을 끌어들이는 것. 유튜브나 UGC 플랫폼의 사업모델과 정확히 같다. User Generated Contents가 아니라 이제는 User Generated Code라고 해야 할까.

생각을 만드는 문장들은 마치 먹음직한 음식처럼 흥미로운 지적 자극을 만듭니다. 이러한 지적 자극을 받아들이는 배경 지식으로 마윈이 말했던 IT시대에서 DT(Data Technology) 시대로의 전환이라는 메시지가 작동합니다. 2년 만에 다시 관련 기사를 찾았더니 이번에는 다른 구절이 눈에 띕니다.

마 회장은 "IT시대는 자기 제어와 자기 관리를 위주로 한다면 DT시대는 대중 서비스와 생산력 촉발을 위주로 하게 된다"며 "양자 사이에 특정한 기술적 차이가 있는 것처럼 보이지만 사실은 사고관념 측면의 차이"라고 말했다.

마윈의 기사에서 '사고관념'이라고 쓴 말은 제 표현으로는 관점 혹은 관점 전환인데요. 앞서 인용한 글이 지적 자극을 주는 이유도 빅테크의 관점을 명확하게 제시해 주기 때문입니다. 군비 경쟁 수준의 엄청난 규모로 지속되는 경쟁적 투자와 막대한 전력을 요구하는 빅테크 입장에서는 일종의 독점적 지위나 규모를 이뤄내야 합니다. 그래서 paying cusomer를 만드는 일에 대해 기하급수적인 성장 방식이 필요할 것입니다.


AI 운영체제 역할을 꿈꾸는 빅테크의 행보

<욕망에 부합하는 가치와 재미를 전하는 생존 양식>을 쓰면서 뚜렷해진 생각이 떠오릅니다. 스마트폰을 인프라 삼아 앱스토어가 성공한 방식과 비슷하게 접근하는 듯합니다. 그렇다 보니 나타나는 현상이 MCP 같은 기술은 최종 사용자는 없고 해당 기술을 이용한 일종의 공급자들만 넘쳐나는 일이죠. 마치 응용 프로그램이나 도구 개발을 외주화 하는 일에 비유할 수 있습니다. 그들과 이익을 공유하거나 인센티브를 제공하는 방식으로 생태계를 키우는 것은 앱스토어의 성공 공식과 유사한 모델입니다. 생각을 달리하면 최종 소비자들에게 필요한 유익을 빅테크 독자적으로 만드는 대신에 네트워크를 이뤄 만드는 일은 자동차 제조업체의 생산 양식과 유사하다고 볼 수도 있습니다.

오픈AI는 이미 이렇게 응용에 대한 개발은 외주화 하고, 자신들은 AI 운영체제 같은 역할에 집중하겠다고 공언한 바 있습니다. 여기에 더하여 스타게이트 프로젝트를 비롯해서 국가급 투자를 동반한 압도적인 AI 투자 생태계를 구축하고 있는 모습도 보입니다.


기술이 만든 새로운 규모의 경제 환경에 대한 인식

그 과정에서 보이는 또 다른 흥미로운 현상이 코드 자체가 새로운 User Generated Contents가 되는 모양새입니다. 그러나, UGC가 된 코드(User Generated Code) 자체보다는 거기서 비롯된 데이터가 만들어질 때 가치가 더 늘어나기 때문에 그 코드는 기능적 관점에서 둘로 나눠야 할 듯합니다. 바이브 코딩 열풍을 만든 데이터 성격의 UGC는 상대적으로 소수인 창작자 풀을 생각하면 데이터 자체의 가치보다는 학습 데이터로써의 역할이 더 커 보입니다. 이와 다르게 빅테크 입장에서 아직은 유입되지 않는 미래의 수요가 더 매력적일 듯합니다. 빅테크가 만든 Agentic AI 개념에서는 툴(Tool)이라고 부르던 외주화 한 실행 코드들이 가치 있는 데이터를 생산해 낼 때 앱스토어와 비슷한 효과가 날 것 같습니다.


이런 유추는 paying cusomer를 늘리는 게임에서 효율성과 생산성을 높이는 IT시대의 방식보다는 데이터로 가치를 생산하는 DT시대 방식으로 세상을 보는 것이 유리하다는 생각에 바탕을 두고 있습니다. 인용한 역시 '데이터 게임'에 대해 이야기를 전개합니다.

그러면서 먼저 '과거로부터 배우는 패턴'이라는 제목으로 다음과 같은 교훈을 전합니다.

대량지식의 상징은 구글 검색창이었지만, 진짜 제국을 건설한 건 데이터를 독점적으로 수집하고 정제해서 재판매하는 플랫폼들이었다. 구글, 메타, 아마존. 검색은 무료였지만, 검색 데이터는 금맥이었다.

지식을 수집하고 정제해서 팔릴 만한 가치나 재미를 만드는 플랫폼이 되는 것이죠. 그런데 이것은 플랫폼이 될 수 있는 극소수의 기업이나 야심 넘치는 창업가를 제외한 대부분의 사람들에게는 큰 영감을 주지 못합니다. 인용한 구절에서 주목해야 할 단어는 '정제'입니다.


코드 범람의 시대, 데이터 희소의 시대에서 개인의 기회

'정제' 작업이 바로 데이터를 가치 있게 만드는 일을 통칭한 이름이라 할 수 있습니다. 저자는 이에 대해 이렇게 부연합니다.

진짜 고급 데이터의 핵심은 정보력이다. 정보력이란 의사결정을 바꾸고, 예측 정확도를 높이며, 불확실성을 제거하는 힘을 말한다.

LLM이 코드 생성을 목표로 삼은 현실을 두고 저자는 '코드 범람의 시대, 데이터 희소의 시대'라고 규정합니다. 이때, 개인이 취할 수 있는 전략을 세 가지로 제시합니다. 이 내용도 주목할 만합니다.


첫 번째는 플랫폼과 달리 '작지만 깊은 데이터'를 구축하라고 조언합니다.

대형 플랫폼은 넓고 얕게 간다. 당신은 좁고 깊게 가야 한다.

뒤이어 다음과 같이 구체적인 예까지 제시합니다.

전국의 모든 식당 데이터는 이미 카카오가 가지고 있다. 하지만 서울 강남 오마카세 전문점 50곳의 실제 원가율, 예약률, 재방문율 데이터는? 이건 어디에도 없다.

두 번째는 데이터가 없어도 할 수 있는 데이터 해석자가 되라는 조언입니다.

공개 데이터는 이미 넘쳐난다. 공공데이터포털에만 수십만 개의 데이터셋이 있다. 상장사 공시는 모두에게 열려 있다. 논문 데이터베이스도 접근 가능하다. 문제는 이 데이터들 대부분이 그냥 방치되어 있다는 것이다. 제대로 읽고 인사이트를 뽑아내는 사람이 드물기 때문이다.

세 번째는 데이터 소유자와 사용자를 연결하라는 조언입니다.

당신이 할 일은 간단하다. 니치 영역에서 데이터를 가진 곳을 찾고, 파트너십을 맺고, 툴들을 활용해 그 데이터를 쓸 수 있는 형태로 가공하고, 작은 앱이나 대시보드로 패키징 하는 것이다. 데이터 소유자는 추가 수익을 얻고, 당신은 독점 데이터 접근권을 확보하고, 사용자는 가치 있는 서비스를 얻는다.


지난 묻고 따져서 개념을 만들고 실행하는 디지털 전환 연재

1. 뜻밖의 상황에 등장한 '제어 역전'이 주는 지적 자극

2. 대체 전략을 어디에 써먹고 어떻게 실천할까?

3. 욕망에 부합하는 가치와 재미를 전하는 생존 양식

keyword
작가의 이전글맞춤법 오류 분석 인덱스 v1.24