brunch

You can make anything
by writing

C.S.Lewis

by Jinhee Park Jul 24. 2020

데이터 분석에 기본이 되는 지표

DAU, WAU, MAU 그리고 Rolling metrics

데이터를 볼 때 알아야 할 가장 기본적인 지표를 정리했다. 기본이라고 해서 매일 모든 지표를 추적할 필요는 없다. 제품의 유형 및 목적에 따라 사용 빈도가 다르기 때문이다. 사용자의 행동 패턴에 맞게 주력으로 보는 지표가 달라져야 한다. 예를 들어, 소셜 미디어 성격의 제품은 매일 접속해 사용해야 하므로 DAU가 중요하지만, 직장에서 사용하도록 설계된 제품은 주말 동안에는 사용자가 많지 않기 때문에 DAU의 추이를 보는 것이 큰 의미가 없을 수 있다.



DAU, WAU, MAU

데이터 분석에서 제품을 방문하거나 특정 행동을 취한 횟수를 세션이라고 하는데 세션은 이용할 때마다 중복해서 증가한다. 하지만 우리가 알아야 할 것은 단순 세션 수가 아닌 제품을 실제 이용하는 사람들의 수이다. 이 활성 사용자의 수를 알아내기 위해서 사용자에게 각각 user ID를 부여한다. 행동에 따른 세션이 발생했을 때 해당 세션을 일으킨 User ID의 수를 측정하는 것이다. user ID는 디바이스에 부여할 수도 있고, 로그인 계정에 부여할 수도 있다.


DAU, WAU, MAU는 각각 Daily, Weekly, Monthly Active User의 약자로 해당 기간에 제품을 방문하거나 상호 작용하는 활성 사용자를 말한다. 예시를 통해 DAU, WAU, MAU 지표에 대해 더 알아보자. 아래 이미지는 가상의 서비스의 한 달 세션 수를 나타낸 것이다.

[그림 1] 가상의 서비스의 한 달 세션 수


DAU

일간 활성 사용자. DAU는 하루 동안 제품을 이용한 순 사용자의 수를 말한다. DAU는 카카오톡이나 페이스북같이 매일 반복적으로 사용해야 하는 소셜 미디어 유형의 제품에서 중요하게 다뤄진다.


하루 동안 3개의 세션이 발생했다 하더라도 동일한 user ID로 발생한 것이라면 DAU는 1이다. 예를 들어 [그림 1]에서 둘째 주 목요일과 넷째 주 수요일은 동일하게 2개의 세션이 발생했다. 전자의 DAU는 2로 세션 수와 일치하지만, 후자는 사용자 A가 두 번 접속한 것이기 때문에 중복 세션을 제거하면 DAU는 1이 된다.



WAU

주간 활성 사용자. WAU는 한 주인 7일 동안 제품을 이용한 순 사용자의 수를 말한다. 툴에 따라 한 주를 일-월로 세기도 하고 월-일로 세기도 한다. 앰플리튜드는 월요일부터 일요일까지를 일주일로 본다. 매일 접속해 사용하는 서비스가 아니거나 요일에 영향을 받는 서비스는 DAU보다는 WAU로 보는 것이 좋다. 뉴스 서비스의 경우도 주로 직장인이 출퇴근 시간에 많이 이용하는 서비스이기 때문에 WAU 지표를 추적한다.


[그림 1]에서 둘째 주를 보면, 세션 수 기준으로는 3번이 발생했다. 하지만 사용자 A의 중복 방문을 제거하면 WAU는 2가 된다. 마찬가지로 넷째 주는 2번의 세션이 발생했지만 동일 user ID가 두 번 접속한 것이기 때문에 WAU는 1이다.



MAU

월간 활성 사용자. 한 달을 기준으로 제품을 이용한 순 사용자를 수를 말한다. 제품의 volume 성장과 밀접한 지표이다. 한 달 동안 세션 수가 다수로 찍혔을지라도 같은 user ID의 사용자가 여러 번 방문한 것이라면 MAU는 1이다. 예시 이미지에서는 세션 기록이 사용자 A와 사용자 B의 것밖에 없으므로 MAU는 2이다.




Rolling metrics

[그림 2] Rolling 4-day average

Rolling metrics는 보통 rolling 4-day average 같은 형태로 특정 기간에 대한 평균값으로 사용한다. Rolling 4-day average라고 하면, 4일에 대한 평균값을 추적하는 것이다. Rolling average는 다른 말로 이동 평균 moving average라고도 한다. 추세의 변동을 알 수 있도록 구간을 옮겨 가면서 구하는 평균을 말한다.


케이스에 따라 캘린더 기반의 지표보다 Rolling metrics를 사용하는 것이 더 나은 경우가 있다. 예를 들어, 특정 날짜에 제품을 사용한 사람의 수를 볼 때는 DAU를 보는 것이 좋다. 하지만 DAU는 일자 별로 유동성fluxion이 존재하기 때문에 전체적인 흐름이나 추이를 살피기 어렵다. 이럴 때 Rolling metrics를 사용하면 탐지하기 어려운 경향성을 찾는 데 도움을 줄 수 있다.


또 다른 경우는 DAU나 MAU를 비교할 때이다. 1월은 31일, 2월 28일로 달의 길이가 다르다. 이 경우 MAU를 비교하는 것보다 rolling 28-day average를 사용하는 것이 더 바람직하다고 볼 수 있다. 또한, DAU가 아닌 Rolling metrics를 비교하면 결과를 왜곡 할 수 있는 요일 효과를 피할 수 있다는 이점이 있다.


아래의 [그림3]은 [그림 2]의 일별 데이터를 꺾은 선 그래프로 그린 것이다.

[그림 3] 일자 별 꺾은 선 그래프


[그림 3]의 그래프를 보면 상승과 하락의 폭이 커 보인다. 하지만 이러한 일 단위의 변화는 제어할 수 없는 외부 요인이나 특정 이벤트에 의한 것일 가능성이 크다. 아래 [그림 4]에 같은 데이터를 4일 기준으로 평균을 내어 Rolling metrics로 나타내보았다.


[그림 4] Rolling 4-day average


일정 데이터에서 특징적으로 나타난 값들이 평균에 의해서 희석되는 효과가 나타나는 것을 확인할 수 있다. 평균값이 187,500으로 동일하게 진행되고 있으므로 전반적으로 안정적인 추세라고 볼 수 있다. 이처럼 Rolling metrics를 사용하면 노이즈를 제거하여 허위 신호를 식별할 위험을 줄일 수 있다.



다시 한번 강조하지만 모든 경우에 정답인 지표는 없다. 제품의 성공에 가장 중요한 측정 기준은 회사마다 다르다. 제품의 비전이나 목적, 경쟁 상대 등에 맞게 올바른 측정 항목을 선택해야 한다.



참고:


+ 갑작스러운 물음에도 그림까지 그려가며 친절하게 알려주신 민우 님께 감사의 말을 전합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari