brunch

데이터가 왜 중요한 거예요?

모든 업무를 데이터가 둘러싸는 data moat strategy

by 브라키오사우루스

데이터 원천사를 무시하지 마라, 이런 말 혹시 들어보셨나요? 데이터 사업을 하다 보면 가끔 들리는 말입니다. 대기업의 직접 참여가 제한되는 계약이 많아 중소기업이 앞에서 입찰 및 계약 진행을 하게 되는 경우가 있습니다. 고객과의 접점을 갖는다는 건 사업에서 큰 힘으로 작용합니다. 이렇게 힘이 생긴 제휴사가 데이터 공급사에게 협의되지 않은 요구를 하거나, 데이터 견적을 낮추고 중간 마진을 남기는 경우가 반복되면 어떻게 될까요? 같이 일할 때 어느 한쪽이 너무 손해 보는 상황이 되면 이 관계는 오래 유지되기 어렵습니다. 사업을 넘어 모든 관계에서 그렇습니다.


데이터 원천사가 중요한 이유는 데이터 때문입니다. 외부로 보내는 데이터보다 내부에 있는 데이터가 더 다양하고 양이 많습니다. 계속 데이터가 쌓인다는 것도 큰 장점입니다. 데이터는 왜 중요한 걸까요? 데이터와 AI가 만나 만들어갈 다음 단계에서 데이터는 어떤 역할을 하고 활용될까요?


Data first

2026년에는 기존에는 보지 못했던, 고품질 데이터가 등장할 것 같습니다. 다수가 누리는 범용데이터보다는 소수가 누리는 고품질 데이터입니다. 에이전트 시대의 가장 큰 도전 과제는 훈련 데이터의 부재일지 모릅니다. 특히 사람에 대해 이해할 수 있는 데이터에 대한 수요가 높아집니다. 이런 데이터는 아직 시장에 없지만 만들어진다면 부르는 게 값일지도 모릅니다. 기업이 보유한 고유한 데이터, 이런 데이터를 구축할 수 있다면 데이터 사업이 안되려야 안될 수 없겠죠. 다른 기업들이 따라오기 어렵게 만드는 장벽이 돼줄 겁니다.


데이터 상품을 기획하면 이거 새로 만들면 얼마를 벌 수 있냐고 물어봅니다. 사과는 5백 원, 배는 1천 원… 우리는 과일가게 장사는 아니죠. 데이터는 모두 연결되어 있습니다. 고객이 데이터를 살 때는 데이터 자체도 검토하지만, 이 데이터를 파는 기업의 이미지도 봅니다. 그리고 연결할 수 있는 다른 데이터도 보겠죠.

신규 데이터는 더 벌기 위해서 만드는 게 아니라 뒤로 밀리지 않기 위해서 만듭니다. 가만히 있으면 현상 유지가 아니라 뒤로 밀리기 마련이거든요. 모든 일이 그렇습니다. 특히 데이터 시장처럼 급변하는 흐름에서 가만히 있는다는 건 사업을 이제 점진적으로 접겠다는 뜻과 다르지 않습니다. 팔란티어의 목표는 잠자는 데이터로부터 가치를 찾는 것이라고 합니다. 데이터가 잠자고 있을 때는 이유가 있겠죠. 활용상에 법적인 제약이 있다거나, 정제가 덜되었거나, 활용이 어렵거나… 그럼에도 불구하고 찾아서 활용가능하게 만드는 겁니다. 왜 그래야 하나고요? 데이터 그 자체로 해자(moat)를 만들어 더 높은 곳에서 사업을 할 수 있으니까요.


Data in, Action out

두 번째는 에이전트를 구성하는 데이터입니다

데이터를 조건에 맞춰 뽑아내는 시대는 지나가고 있습니다. 데이터에서 인사이트를 찾는 것도 시시해지고 있죠. 최근 5개년 전통시장 데이터를 분석했더니 이런 인사이트를 찾았어, 데이터 분석하기 전에는 몰랐지? 하는 선언은 보고서에 있습니다. 이제는 인사이트를 넘어서, 그걸 토대로 무엇을 해야 하는지 알려주는 에이전트 시대가 왔습니다.

이건 원래 그래, 작업이 오래 걸려, 이런 말을 넘어서 기존의 방식에 경종을 울리면서 진입가능한 사업이 어떤 것이 있을까요? 그중 하나로 저는 데이터 결합을 생각했습니다. 결합은 원래 오래 걸려요, 우리만 그런 게 아니고 1등 플레이어에 맡겨도 오래 걸리고, 다 이유가 있고… 이런 것에서 벗어나.. 신속 결합이 될 수 없을까요? 데이터의 가치는 해상도, 적시성 2 개축의 영향을 받습니다. 가명데이터는 해상도는 어느 정도 만족시키지만 속도가 느립니다. 데이터는 필요할 때 확인할 수 있어야 합니다. 원래 가명결합이라는 게 다그래, 이 말에 반격을 가할 수 없을까요?


AI는 학습할 데이터가 없으면 스스로 데이터를 만들어서 학습합니다. 그런 거 다 옛날에 생각했는데 안 되는 건 다 이유가 있어 같은 말들은 더 이상 말할 가치가 없습니다. 없으면 만들면 되고 안 되는 건 되게 만들면 됩니다. 지금 중요한 건 속도고 선점하는 것이 중요합니다. 시장을 선점하면 가치가 증폭합니다. 나만 가진 데이터로 차별화를 만든 후, 시장을 선점하면 후발주자의 진입을 어렵게 만드는 시간적 해자 요소가 될 겁니다.

Data monetization

서로 다른 데이터가 손에 손을 잡고 연결 돼서 뿜어낼 엄청난 가치를 생각합니다. 이 연결을 어렵게 하는 건 뭘까요? 제휴는 기술이 아니라 사회 수용도가 문제입니다. 해보고 싶게 만들어야 되는데 내 눈에 바로 보이는 수익이 없으면 고객의 우선순위에서 밀리게 되겠죠. 결국에 처음만 거창하고 흐지부지 되기 쉽습니다. 이러한 벽을 넘기 위해 중요한 건 결국 “수익성 증명”입니다. 기업을 움직이게 할 수 있는, 기업 안의 사람을 움직일 수 있게 하는 가장 강력한 요소입니다. 기대할 수 있는 수익이 비용보다 크고, 그 수익이 오래 걸리지 않아 나온다고 보여줘야 참여를 이끌 수 있습니다.

이를 위해 3~5년의 장기 계획이 아닌 3~5개월 안에 고객에게 수익창출을 보여줘야 합니다. 같이 하는 사업에서는 내 돈을 써서라도 수익을 증명함으로써 시장을 선점해야 합니다.

데이터는 연결될 때 가치가 복리로 늘어납니다. AI에 필요한 데이터도 많은 양질의 데이터가 모여야 만들 수 있습니다.


능력자 1명과 에이전트 10개

기업들은 소수 정예인간과 다수 AI에이전트 구조로 전환 중입니다. AI가 저렴해져도 기업의 복잡한 데이터는 여전히 고유합니다. 변하지 않고 유지될 수 있는 것은 ‘데이터’, 데이터 중에서도 ‘나만이 가진 데이터’입니다.


빅데이터보다는 고품질 스몰데이터, 단독 데이터보다는 연결된 데이터, 베스트셀러 상품보다는 독점적으로 구할 수 있는 데이터, 그냥 데이터보다는 AI와 함께 작동하는 데이터들이 나오고 있습니다.

데이터를 보다 보면, 다른 데이터와 연결하고 싶고, 어딘가에 저장해서 관리하고 싶고, 보기 좋게 대시보드로 만들고 싶고, 대시보드가 실시간으로 업데이트되고 반응했으면 좋겠고, 따로 확인하지 않고 플랫폼 안에서 물어보고 답을 얻으면 좋겠고, 데이터를 관찰하고 분석해서 지식을 얻는 게 아니라 에이전트가 먼저 말해줬으면 좋겠는 거죠. 접속하자마자 “아 지난번에 민생소비쿠폰 데이터 봤었지. 소비 분석해 볼까? “ 하고요. 응 그래, 하면 데이터와 분석보고서를 보여주죠. “언론 기사용으로 자극적인 타이틀을 뽑아줘”하면 또 만들어주는, 반응형, 실시간, 데이터 기반의 … 누구나 생각하는 것이고 이제 여기서 다시 우리가 박 터지게 만날 것 같습니다.





keyword