네트워크, 독점, 인텔리젼스, 에코시스템으로 구축하는 데이터 해자
쿠팡의 청문회 태도와 사과·보상 관련 커뮤니케이션에 많은 사람들이 실망했다. 최근 주변에서도 쿠팡 와우멤버십을 해지했다는 이야기를 자주 들었다. 사용 빈도에는 차이가 있었지만, 거의 모든 사람이 이미 와우멤버십을 쓰고 있었다는 사실을 다시 한번 체감할 수 있었다.
그럼에도 불구하고 “그래서 정말 해지할 수 있는가”라는 질문 앞에서는 쉽게 결정을 내리지 못하는 모습을 보며, 쿠팡이 이미 매우 강력한 프로덕트 해자를 구축했다는 점을 실감한다. 이 경험을 계기로 ‘우리 프로덕트는 어떤 방식으로 해자를 만들어야 하는가’라는 질문을 던지게 되었고, 공부를 하는 과정에서 프로덕트 해자의 핵심 구성 요소 중 하나인 데이터 해자(Data Moat)에 대해 정리해보게 되었습니다.
우선 해자를 간단히 설명하면, 성곽을 둘러싼 방어벽이다. 보통 비즈니스에서는 산업의 이익구조를 좌우하는 요소(진입자/대체재/구매자/공급자/기존 경쟁자)들로부터 우리를 유리하게 만드는 진입장벽을 의미한다. 이런 이유에서 투자자 워렌버핏도 기업을 투자할 때, 이런 해자를 가진 기업을 선호한다는 것을 여러 차례 밝히기도 했다. :)
경제적 해자를 가지면 돈이 될까? 이 질문에 대해, 경제적 해자가 정말 기업의 이익에 도움이 되는가라는 질문에 대해 최근 수년간의 정량 연구와 실증 분석은 생각보다 일관된 답을 내놓고 있다.
Morningstar와 Haggard(2024)의 연구는 공통적으로 경제적 해자를 향후 여러 해 동안 경쟁으로부터 이익을 방어하며 높은 자본수익을 유지할 수 있는 구조'로 정의한다. 논문은 해자의 원천을 전환비용, 네트워크 효과, 무형자산(브랜드·특허), 비용우위, 효율적 규모 등으로 정리하며, 이 요소들이 지속적 경쟁우위를 만든다고 설명한다.
Haggard(2024)는 Morningstar의 moat 등급(Wide, Narrow, No Moat)을 활용해 5,304개 기업을 분석했다. 그리고 위 그룹에 따른 기업의 장기 성과를 직접 비교한다. 결과는 직관적이다. 10년간의 연환산 수익률을 단순 비교하면 Wide moat 기업은 연 14.95%, Narrow moat는 8.23%, 반면 No moat 기업은 –3.78%를 기록했다. 산업·시가총액·팩터를 통제한 회귀분석을 해도 결과는 유지된다. No moat 기업 대비 Wide moat 기업의 성과 프리미엄은 여전히 통계적으로 유의미하다.
연구의 결론을 보면, 해자가 있는 기업은 고객 전환 비용이 높아 가격 인하 경쟁이 늦게 시작되고, 네트워크 효과나 브랜드로 신규 진입자가 쉽게 따라오지 못하며, 규모의 경제를 통해 비용 구조 자체를 다르게 가져가고 있기 때문에 유리함을 가진다. 경쟁이 발생해도 마진 하락 속도가 느리고, 자본수익률(ROIC·ROE)이 높은 상태를 오래 유지한다 반대로 해자가 없는 기업은 차별화가 약하고, 경쟁사가 빠르게 모방하며, 가격 경쟁이 바로 시작된다. 즉, 매출은 늘 수 있어도 이익률과 초과이익(economic profit)은 빠르게 사라질 수 있다.
최근 이런 해자를 구축한 것 같은 프로덕트를 분석해보면, 앞서 논문에서 다루는 주요 요소인 전환비용, 네트워크 효과, 무형자산(브랜드/신뢰), 규모의 경제와 함께 데이터라는 5가지 항목들이 서로 조합되어 프로덕트의 해자를 구성한다는 점을 알 수 있었다.
이 중 내가 PM으로 다루는 프로덕트인 '데이터'에 대해 이야기해본다. 현대의 프로덕트 전략에서 데이터는 단순한 기록을 넘어 경쟁사가 넘볼 수 없는 강력한 해자(Moat)를 형성하는 핵심 자산이다. 그러나 단순히 데이터의 '양'이 많다고 해서 해자가 구축되는 것은 아니다. 진정한 데이터 해자는 데이터가 프로덕트 내부에서 선순환하며 가치를 증폭시키고, 결과적으로 고객이 떠날 수 없는 구조를 만들 때 완성된다.
(1) 데이터 네트워크 효과: 사용자와 데이터의 선순환
데이터 해자의 가장 기초적인 형태는 데이터와 네트워크 효과가 결합된 구조에서 만들어진다. 사용자가 늘어날수록 더 많은 데이터가 쌓이고, 이 데이터가 다시 제품의 품질을 개선해 더 많은 사용자를 끌어들이는 선순환이 형성된다.
중요한 점은 단순히 데이터를 “수집한다”가 아니라, 사용자 행동이 제품 품질에 직접 반영되는 피드백 루프를 의도적으로 설계해야 한다는 점이다. 이를 위해 서비스의 핵심 가치를 데이터 기반 알고리즘에 의존하도록 설계하고, 클릭·구매·체류 시간과 같은 사용자 피드백이 추천이나 예측 품질에 실시간으로 반영되도록 구조화해야한다. 이 루프가 안정적으로 작동하기 시작하면, 후발 주자는 사용자 수와 데이터 양 모두에서 불리한 위치에 놓이게 된다.
대표적인 사례가 Tesla다. 전 세계 테슬라 차량에서 수집되는 실시간 주행 데이터는 자율주행 알고리즘(FSD)을 지속적으로 고도화하며, 이는 전통적인 완성차 업체가 단기간에 따라잡기 어려운 강력한 데이터 해자로 작용한다.
(2) 독점적인 데이터: 오직 우리만이 가질 수 있는 자산
‘내가 가진 데이터가 얼마나 희소한가’는 데이터 해자의 깊이를 가르는 절대적인 기준이 된다. 누구나 접근 가능한 공공 데이터가 아니라, 다른 비즈니스가 구조적으로 가질 수 없는 데이터를 확보하는 것이 핵심이다. 예컨대 Amazon이 광고 비즈니스에 진입했을 때 가장 높게 평가받았던 지점은, 사용자가 실제로 돈을 지불한 주문·구매 데이터를 압도적인 규모와 밀도로 보유하고 있다는 사실이었다.
독점 데이터는 특정 산업군의 비즈니스 프로세스 깊숙이 침투할 때 만들어진다. 이를 위해 사업개발을 통해 데이터 확보를 위한 협약을 맺거나, 기존에 존재하지 않던 행동과 의사결정 과정을 디지털 이벤트로 전환해야 할 수도 있다. 시간이 지날수록 이러한 데이터는 엄청난 자산으로 축적된다.
헬스케어 영역의 Tempus AI가 대표적이다. 임상 데이터와 유전체 데이터를 결합한 독점 데이터셋을 기반으로 경쟁 우위를 형성하고 있다. 특히 병원·연구기관과의 장기적 파트너십을 통해 데이터 생성 단계부터 관여함으로써, 후발 주자가 동일한 데이터 구조를 재현하기 어려운 해자를 쌓아가고 있다.
(3) 데이터 가공과 인텔리전스: 지능의 해자
데이터를 해석해 실제 의사결정으로 전환하는 인텔리전스도 중요한 해자가 된다. 동일한 데이터를 보유하고도 어떤 기업은 단순한 통계에 머무는 반면, 어떤 기업은 전략과 실행을 만들어낸다.
이 차이를 만드는 핵심 요소가 바로 데이터 가공 능력과 도메인에 특화된 해석 구조다. 로우 데이터를 의미 있는 신호로 전환하는 전처리 파이프라인을 고도화하고, 특정 산업과 문제에 최적화된 머신러닝 모델을 지속적으로 개선한다. 데이터가 축적될수록 모델의 정확도는 높아지고, 고도화된 모델은 다시 더 정교한 데이터 생성을 유도하는 선순환 구조를 만든다. Alexander Wang이 이끈 Scale AI가 높은 기업가치를 인정받은 이유 역시, 데이터 라벨링과 가공 자체를 핵심 인텔리전스로 정의하고 이를 산업 표준으로 만든 그들의 판단을 인정했기 때문이다.
또한, 인텔리전스의 해자를 구축한 대표적인 기업으로 팔란티어도 빼놓을 수 없다. 팔란티어의 온톨로지는 단순히 데이터를 시각화하거나 조회하는 도구가 아니라, 조직 내에 흩어져 있는 복잡한 데이터를 하나의 공통된 의미 체계로 정렬하는 역할을 한다. 각 데이터가 무엇을 의미하고, 서로 어떤 관계를 가지며, 어떤 의사결정에 연결되는지를 구조적으로 정의함으로써, 분석 결과가 곧바로 실행 가능한 판단으로 이어지게 만든다. 이 온톨로지 설계 자체가 조직과 도메인에 깊이 결합되기 때문에, 동일한 데이터를 보유한 경쟁사가 쉽게 모방할 수 없는 인텔리전스 해자로 작동한다.
(4) 데이터 통합과 에코시스템: 운영 체제가 된 프로덕트
데이터 해자의 마지막 단계는 개별 기능의 우위를 넘어, 프로덕트가 하나의 운영 체제처럼 작동하는 상태에 도달하는 것이다. 사용자의 워크플로우 전반에서 생성되는 데이터가 하나로 통합될수록, 데이터는 단절된 로그가 아니라 맥락과 연속성을 가진 자산이 된다. 이 지점에서 데이터 해자는 자연스럽게 비즈니스 해자의 핵심 요소인 전환 비용과 결합하며 강력한 구조적 우위를 형성한다.
이를 위해 프로덕트는 다양한 서드파티 앱과 연동되며 데이터의 허브 역할을 수행한다. 데이터가 한곳에 축적될수록 사용자는 단일 기능이 아니라 전체 흐름과 맥락을 보기 위해 해당 프로덕트에 의존하게 되고, 일부 기능만 대체하는 솔루션은 실질적인 대안이 되기 어렵다. 결과적으로 데이터를 옮기는 비용뿐 아니라, 맥락과 운영 방식 자체를 다시 학습해야 하는 비용이 전환 장벽으로 작동한다.
Braze는 정교한 텍소노미와 최적화 엔진을 통해 고객 행동 데이터를 통합하며, 캠페인 운영 로직과 성과 맥락까지 함께 묶어 다른 툴로의 이전을 어렵게 만든다. 이처럼 데이터 통합은 단순한 편의성을 넘어, 전환 비용과 결합된 가장 강력한 데이터 해자로 작동한다.
이처럼 데이터 해자는 단순히 서버에 데이터를 쌓는다고 해서 자동으로 구축되지 않는다. 데이터는 그 자체로 휘발성이 강하며 모방하기 쉽고, 설계가 잘못되면 오히려 유지 비용만 발생시키는 부채가 되기도 한다. 데이터가 진정한 해자가 되기 위해서는 네트워크 효과, 인텔리전스, 전환 비용과 결합되어 스스로 강화되는 선순환 구조 속에 놓여야 한다.
이 과정은 결코 쉽지 않다. 요즘 많이 확인하는 Braze와 같은 잘 만들어진 솔루션을 사용할 때도 Braze SDK를 심고, 이벤트를 정의하고, 텍소노미를 정교하게 설계하는 지루한 작업을 감내해야 한다. 그러나 이 과정을 통해 축적된 데이터가 점차 경쟁력을 갖기 시작하며, 고객의 의사결정과 운영 흐름을 끌어당기는 중심축으로 자리 잡는다. 시간이 지날수록 데이터는 단순한 기록이 아니라, 떠나기 어려운 맥락과 관성으로 변한다.
결국 훌륭한 프로덕트란 고객에게 편리함을 제공하는 동시에, 고객이 그 안에서 쌓아온 데이터와 맥락의 가치가 너무 커서 쉽게 이탈할 수 없게 만드는 구조를 설계해야한다. 따라서 프로덕트 매니저는 제품을 기획하는 단계부터 우리가 수집하는 데이터가 어떻게 장기적인 '지속 가능한 경쟁 우위'로 변모할지 끊임없이 자문해야 한다.