brunch

You can make anything
by writing

C.S.Lewis

by 아이스 Feb 13. 2023

Data Taxonomy 살펴보기 (1)

분석가와 마케터를 위한 종합 가이드

Amplitude는 사용자 행동에 대한 포괄적이고 통찰력 있는 인사이트를 제공하는 강력한 데이터 분석 플랫폼입니다. 이를 통해 조직은 유저의 Acquisition에서 Retention에 이르는 전체 사용자 여정을 추적, 이해 및 최적화할 수 있습니다. Amplitude는 웹/앱, 내/외부의 다양한 소스에서 데이터를 수집하고 활용할 수 있게 제시하여 팀이 데이터 기반 의사 결정을 내릴 수 있도록 도와줍니다.


Amplitude를 잘 사용하기 위해서는 분석 솔루션에서 추적하는 이벤트가 잘 설계해야 합니다. 데이터 분석을 통한 인사이트 도출 과정에서 어떤 데이터가 수집되었는지에 따라 인사이트의 퀄리티와 깊이가 달라질 수 있습니다. 


Data의 설계와 수집관점에서 알아야 할 중요한 개념이 바로 오늘 설명할 Taxonomy입니다. 







Amplitude의 Taxonomy


Amplitude의 Taxonomy는 데이터를 특정 그룹으로 구성하고 범주화하는 프로세스를 말하며, 이는 데이터 분석의 중요한 단계입니다. Taxonomy는 데이터 구조를 표준화하여 이해하기 쉽게 만들고 데이터 분석의 정확도를 높이는 데 도움이 됩니다. Amplitude에서 Taxonomy가 중요한 몇 가지 이유는 다음과 같습니다.  


    데이터 일관성 : 명확한 데이터 Taxonomy를 정의하면 여러 부서 및 시스템에서 데이터가 일관되게 기록되도록 할 수 있습니다. 이것은 데이터 불일치를 줄이는 데 도움이 되고 데이터 분석의 신뢰성을 향상시킵니다.


데이터 분석 : Taxonomy는 데이터를 특정 범주로 구성하는 데 도움이 되므로 보다 쉽게 분석하고 해석할 수 있습니다. 이것은 많은 양의 데이터를 처리할 때 특히 중요합니다. 


데이터 시각화 : Taxonomy를 사용하여 보다 구조화된 데이터 세트를 생성한 다음 효과적인 데이터 시각화를 생성하는 데 사용할 수 있습니다. 이는 통찰력을 전달하고 데이터 기반 의사 결정을 보다 효과적으로 내리는 데 도움이 될 수 있습니다.  


데이터 거버넌스 : 잘 정의된 데이터 분류 체계는 명확한 데이터 소유권 및 데이터 거버넌스 정책을 수립하는 데 도움이 될 수 있습니다. 이는 조직의 데이터 프라이버시 및 보안을 유지하는 데 필수적입니다.  


요약하면 Amplitude의 Taxonomy는 정확성, 신뢰성, 데이터 분석의 효율성과 데이터 일관성 및 거버넌스를 보장합니다.






Data Taxonomy란?


Data taxonomy는 추적하고자 하는 Event와 Property들을 어떻게 카테고리화하고 명명법을 적용할지를 정하는 방법입니다. 


이는 좀 더 구체적으로 분석적인 소통을 위해 정의하는 동료와 비즈니스 팀 간의 언어를 의미합니다.  


Data taxonomy = Language 



예를 들어 개발이라는 과정은 일상생활의 언어를 컴퓨터가 이해하는 컴퓨터 언어(개발 언어)로 치환하는 과정을 의미합니다. 이러한 과정에서 유사하지만 그 목적에 따라 많은 다른 언어의 방식으로 (Python, Swift, HTML, Jave) 변환됩니다. 


즉, Taxonomy란 우리가 구현하고자 하는 비즈니스 상황을 설명하는 언어를 → Data 분석 언어로 치환하는 과정을 의미합니다. 그러한 과정에서 비즈니스의 목적에 맞춰서 Amplitude, GA, Mixpanel, Braze 등의 서비스마다의 특성을 고려한 Taxonomy를 적용하는 것입니다.


그러면 비즈니스 상황을 Amplitude로 번역하는 간단한 예를 살펴보겠습니다. 


예를 들어 우리가 음악 스트리밍 서비스를 운영하고 있고, 이때 특정 지역의 사용자의 음악 사용 패턴을 아래와 같이 알고 싶다고 가정해보겠습니다. 

질문 : 우리 서비스에서 지난 30일 동안 미국에 거주하면서 Rock genre 음악을 들은 유저의 비율은?


이때, 질문에 활용된 문장에서 특정 부분마다 Ampltude의 Taxonomy type으로 치환될 수 있습니다. 



지난 30일 동안 ▶ Event time → Last 30 day

미국에 거주하는 ▶ User property →  Country(United states)

Rock genre ▶  Event property →  Genre(Rock)

음악을 들은 ▶  Event →  Played song 




즉, 위에서 본 예시와 같이 우리는 비즈니스의 궁금한 현황을 Amplitude로 분석하기 위해 Event, Event property, User property의 Type으로 표현하는 일련의 작업을 Taxonomy라고 합니다.   






Taxonomy 작업을 할 때 주의 할 점


1) 모든 이벤트를 측정하려고 하지 않기

More data ≠ More insights
More data = Opposite
More data = More data point = higher cost

Amplitude와 같은 솔루션의 Data 수집을 위한 Taxonomy 작업을 처음 할 때 하는 가장 많은 실수는 모든 이벤트를 측정하려고 한다는 점입니다. 


대부분의 경우 많은 이벤트 수집이 많은 인사이트 도출을 의미하지 않습니다. 오히려 많이 수집되는 이벤트는 복잡도를 올려서 분석의 속도를 저해하는 경우도 많고 많은 이벤트의 포인터에서 유의미한 이벤트를 찾는데 시간이 오래 걸릴 수도 있습니다. 

많은 이벤트 수집은 인사이트를 도출할 기회를 의미할 수 있지만 이러한 미래의 불확실한 사용에 의한 기회기용 보다 당장의 많은 이벤트 수집을 통한 높은 비용이 더 큰 문제가 될 수 있습니다. 데이터 포인트는 수집되는 양에 따라 많은 비용적 부담을 야기시킵니다. 


따라서 우리는 먼저 우리가 알고 싶어 하는 비즈니스의 KPI를 이해하고 측정하고자 하는 고객들의 주요 행동이 무엇인지 먼저 정의할 필요가 있습니다. 이후 정의된 KPI와 주요 행동들을 기반으로 필요한 이벤트를 정의하고 수집이 필요한 이벤트들의 우선순위를 선정해야 합니다.  



2) 이벤트를 어떻게 설계하는가? → Critical Path : Funnel을 생각하기

모든 제품에는 중요 경로(Critical path)가 존재합니다.


Critical path는 유저가 서비스에서 사용하는 주요 기능들의 경로를 의미하고 서비스의 주요 Funnel 과도 유사한 개념으로 볼 수 있습니다. 보통 Critical path는 구매 또는 가입과 같이 사용자로부터 기대하는 결과를 달성하는데 필수적인 일련의 단계 또는 이벤트를 나타냅니다. 

Critical path를 정의하면 고객 여정에서 가장 중요한 이벤트나 행동의 우선순위를 지정하고 최적화하는 데 사용되므로 마케팅 및 서비스 기획저는 전환 및 수익 창출에 가장 큰 영향을 미치는 활동에 집중할 수 있습니다.

따라서 Critical path를 고려하면 좀 더 수월하게 Taxonomy를 설계할 수 있습니다.  



보통의 경우 Critical path를 따라 User의 경로가 이어집니다. Critical path를 설계할 때는 예상되는 유저의 이동 경로의 마지막 이벤트로부터 역 방향의 경로로 오면서 설계를 하면 좀 더 효과적으로 설계가 가능합니다.


주문완료 Critical 설계 경로

- 주문완료 → 주문정보입력 → 상품 보기 → 상품 찾기


회원가입완료 Critical 설계 경로

- 회원가입완료 → 로그인/가입하기 클릭 → 회원 로그인 가입 화면




3) 마지막 스텝 이벤트를 기준으로 속성값을 설계하기


주문완료가 마지막 이벤트라면 주문완료에서 수집하고 싶은 이벤트를 기준으로 속성값을 채워나가면 좋습니다. 이후 Critical path의 중간 / 앞단의 이벤트에 공통으로 들어갈 수 있는 속성값들을 배치하하면서 Critical path를 역으로 거슬로 올라갑니다. 

앞단의 이벤트에서 이전 단계에서 수집이 불가능한 속성값들을 소거해 나가는 방식으로 최대한 공통되는 속성값을 남기면서 채워나갑니다. 

이는 추후 Funnel 분석 시 동일 속성끼리의 분석을 할 때 holding constant 기능을 활용하기 위함입니다.


주문완료 페이지 내 분석과 활용될 Property 선정


Critical 설계 경로를 따라 동일하게 Property를 설계



Taxonomy 설계 요약 

Taxonomy를 설계하기 위해서는 우선 비즈니스의 목표와 KPI를 설정하는 것이 우선입니다. 이를 통해 모든 이벤트 추적이 아닌 주요 이벤트 위주의 설계를 통해 비용과 시간을 절약할 수 있습니다. 

이후 해당 KPI를 기준으로 서비스의 Critical path를 그립니다. Critical path는 목표로 하는 전환의 최종 이벤트 지점을 기준으로 User path의 역방향으로 거슬러 오면서 설계를 합니다. 동일한 방향으로 Event Property를 채우면서 Event의 context 분석을 풍부하게 할 수 있습니다. 이후 Property 중 공통부분을 Critical path의 이벤트에 모두 채우고 개별 이벤트마다의 독립적인 Property를 채우면 전체적인 Taxonomy 설계가 마무리 됩니다. 

 

다음시간에는 Amplitude에서 Taxonomy를 구축하는 구체적인 방법과 구축이후의 유지 관리 까지 같이 살펴보도록 하겠습니다



참조

https://help.amplitude.com/hc/en-us/articles/115000465251

https://help.amplitude.com/hc/en-us/articles/5447814048795

https://help.amplitude.com/hc/en-us/articles/5447828227867

매거진의 이전글 Amplitude UI 살펴보기  
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari