brunch

CDP 구축 단계에서 마주하는 문제들

데이터 드리븐 고객 경험을 읽고

by 경민


KakaoTalk_Photo_2025-06-14-09-27-02.jpeg


CDP PM으로 새로운 커리어를 시작했습니다. CDP는 Customer Data Platform의 약자로, 고객 데이터를 하나로 통합해 비즈니스에 효과적으로 활용할 수 있도록 구축하는 데이터 플랫폼을 말합니다. 웹, 앱, 오프라인 등 다양한 채널에서 수집된 고객 데이터를 통합하여 단일 고객 뷰(Single Customer View)를 만들고, 이를 기반으로 세그먼트 분류, 개인화 마케팅, 데이터 분석 등을 가능하게 합니다. Salesforce나 Amplitude 같은 글로벌 SaaS들이 대표적인 CDP 솔루션입니다.


그동안 BA 직무로 일하면서 데이터 엔지니어링, 백엔드 개발자와 협업해 왔지만, CDP는 상대적으로 개념이 추상적이고 복잡하게 느껴졌습니다. 그래서 입사 후 관련 개념과 구조를 체계적으로 이해하기 위해 공부를 시작했고, 그 과정에서 책 <데이터 드리븐 고객 경험>을 소개받아 읽게 되었습니다. 이 책은 고객 경험을 개선하기 위해 데이터를 어떻게 활용해야 하는지에 대해 깊이 있게 다루고 있습니다.


사실 CDP는 최근에 등장한 개념은 아닙니다. 대학 시절 마케팅을 공부할 때에도 디지털 마케팅의 핵심 역량 중 하나로 자주 언급되곤 했습니다. 하지만 국내 대기업부터 IT 스타트업에 이르기까지 여러 회사를 거치면서, 실제로 CDP를 내부에서 자체 구축해 효과적으로 활용하는 사례는 거의 보지 못했습니다. 왜 많은 기업들이 CDP 구축에서 이토록 많은 어려움을 겪는 걸까요?




CDP 구축은 왜 어려운 걸까?


첫 번째 과제는 데이터 사일로(Data Silo) 문제입니다. 데이터 사일로란 각 조직이나 시스템이 고립되어 서로 데이터를 공유하거나 활용하기 어려운 상태, 혹은 동일한 기능을 중복 설계한 상황을 의미합니다. 예를 들어, 옴니채널 분석을 시도할 때 부서마다 서로 다른 고객 식별자(CI: Connecting Information)를 사용해 데이터를 적재하고 있다면, 서로 다른 채널의 데이터를 통합하는 데 큰 어려움이 발생합니다.


이는 많은 기업이 추구하는 개인화 마케팅 역시 CDP 없이는 구현에 한계를 가져옵니다. 다양한 채널과 시스템에 흩어진 고객 정보를 하나의 프로파일로 통합해야만 진정한 개인화가 가능하기 때문입니다.


데이터를 통합적으로 관리하지 못하고 수요가 발생할 때마다 개별적인 데이터 레이크를 구현한다는 것이다. 통합되지 않은 데이터 레이크가 너무 많아 데이터를 제대로 활용하기 어렵게 되면, 결국 데이터 사일로 현상을 발생시키게 된다. (p.180)


책에서는 이러한 문제를 해결하기 위한 거시적인 방법론으로 CDP 레퍼런스 아키텍처라는 청사진을 제안합니다. 모두가 동일한 큰 그림을 공유해야 불필요한 중복 작업을 줄이고, 일관된 방향으로 시스템을 설계할 수 있기 때문입니다.


Figure-1.-Marketing-CDP-reference-on-AWS-1024x592.png CDP Reference Architecture (Source : AWS)


입사 직후, 저는 CDP의 목적과 방향성을 정리한 뒤, CDP에 저장될 원천 데이터를 수집하는 역할을 맡은 프로덕트팀을 먼저 만났습니다. 이 자리에서는 CDP가 어떤 역할을 할지, 향후 어떤 방식으로 협업할 수 있을지에 대해 논의했습니다. 또한 다양한 엔지니어링팀을 만나서, R&R을 정리하여 중복된 작업이 발생하지 않도록 논의했습니다. 이 과정에서 통합된 고객 데이터를 구축하기 위해 해결해야 할 여러 과제들을 식별할 수 있었고, 이를 기반으로 시점별 주요 과제(Initiatives)를 도출할 수 있었습니다.


미시적인 관점에서도 고려한 것들이 많습니다. 대표적으로 구조적으로 표준화된 모델링과 함께 고객 식별자 간의 연결을 강조합니다. 즉 ID Resolution인데, 책에서는 로그인, 아이디 기반으로 맵핑하는 결정론적 방식(Determinstic)과 고객 행동 패턴에 따라 ID의 동일 가능성을 제공하는 확률론적 방식(Probabilistic) 모두를 활용하여 통합 프로파일을 구성할 것을 이야기합니다.


Single Customer View는 고객 개인별로 온오프라인 데이터가 모두 통합되어 고객을 360도로 이해할 수 있다는 것을 의미한다. SCV 체계를 만들어놓았다면 지속적으로 추가되는 고객의 온오프라인 활동을 통해 SCV가 업데이트되어 상시적으로 고객을 개인 단위로 이해할 수 있게 된다. 이렇게 되면 마케팅 등 업무 목적별로 활용해야 하는 타깃 고객을 개인 단위든 세그먼트(Segment) 단위든 쉽게 구현할 수 있다. (p.149)


user_profile.png User Profiles (Amplitude)




두 번째로 다뤄지는 문제는 고객 경험 분석의 한계입니다. 기존의 디지털 분석 도구는 주로 고객 행동의 마이크로 단위(예: 클릭 수, 체류 시간 등)를 측정하는 데 초점을 맞추고 있습니다. 그러나 브랜드와 고객 간의 전반적인 관계, 즉 고객 여정 전체를 이해하기 위해서는 더 큰 관점의 데이터 통합과 분석이 필요합니다.


이처럼 고객 여정 전체를 파악하기 위해서는 단순히 데이터를 수집하는 수준을 넘어서, 고객이 접하는 다양한 접점(Touchpoint)에 대한 체계적인 설계가 필요합니다. 고객의 온·오프라인 행동, 구매 이력, 고객 상담, 푸시 메시지 반응 등 여러 채널에서 생성되는 데이터를 통합적으로 결합하지 않으면, 고객의 경험 흐름을 유기적으로 이해하기 어렵습니다. 이를 위해 CDP는 단순한 데이터 저장소가 아니라, L0(원천 데이터), L1(가공된 분석용 데이터), L2(모델 기반의 파생 지표)와 같은 데이터 계층을 기반으로 구성되어야 하며, 각 데이터를 적절히 연결하여 활용할 수 있는 구조를 갖춰야 합니다.


스크린샷 2025-06-14 오전 11.10.12.png Amplitude


실시간 데이터 처리 역시 고객 경험 고도화를 위해 중요한 요소입니다. 고객 행동에 즉각적으로 대응하기 위해서는 실시간 데이터 수집과 분석이 가능해야 하며, CDP는 이를 위한 기술적 인프라를 제공해야 합니다. 실제 모든 데이터를 실시간으로 제공하는 것은 적지 않은 리소스가 필요하기 때문에, 요청받은 Use Case에 대한 실질적 필요성과 실시간 처리의 실효성을 충분히 논의하는 과정이 필요합니다.


이와 더불어, 고객 데이터를 다루는 모든 과정에서는 데이터 거버넌스가 필수적으로 고려되어야 합니다. 개인정보와 일반 데이터를 구분하여 저장하고, 암호화, 해시 처리, 범주화 등의 방식으로 민감한 정보를 보호해야 합니다. 특히 CDP는 L0, L1, L2 데이터가 포함된 전체 체계를 관리함에 있어, 정보보호 기준과 컴플라이언스 준수를 위한 정책 설계가 중요합니다.


결론적으로 고객 경험을 효과적으로 개선하기 위해서는 다양한 접점에 대한 데이터 설계, 계층화된 데이터 통합, 실시간 처리 능력, 그리고 엄격한 보안 기준을 포괄하는 CDP 체계가 필요합니다. CDP는 이러한 복합적인 요건을 충족시키는 통합 플랫폼으로, 고객 중심의 데이터 활용 전략을 실현하는 핵심 수단이 됩니다.



끝으로


책에서 말하는 CDP 구축의 핵심은 고객을 단편적으로 이해하는 것이 아니라, 고객 전체의 경험을 유기적으로 연결하여 바라보는 데 있습니다. 이를 통해 기업은 보다 정교한 개인화, 향상된 마케팅 효율성, 그리고 고객으로부터의 신뢰를 구축할 수 있습니다. 이 책은 그러한 변화의 출발점에서 당면할 수 있는 문제들을 구조적으로 생각해 볼 수 있었습니다.


여러 유관 부서와 논의하고, 관련 자료를 조사하면서 파편적으로 접해왔던 아이디어와 개념들이 이번 독서를 통해 보다 체계적으로 정리되는 것을 느낄 수 있었습니다. 앞으로 CDP라는 데이터 프로덕트를 구축해 나가는 과정에서 마주하게 될 다양한 이야기들을 지속적으로 나눠보려고 합니다.


글이 유익하셨다면 좋아요와 구독을 통해 응원 부탁드립니다. 읽어주셔서 감사합니다.
keyword
매거진의 이전글숙소에서 라이프스타일로, 에어비앤비의 슈퍼앱 전략