brunch

You can make anything
by writing

C.S.Lewis

by Growth Hacker DEW Feb 26. 2018

[GA] 필터를 활용하여 커스텀 디멘젼 만들기

구글 어낼리틱스 야매스터디 #7

구글 애널리틱스로 여러가지 데이터를 쌓고 측정하다보면

기본적으로 구글 애널리틱스에서 제공하는 데이터말고 추가적인 데이터를 측정하고 싶을 때가 있다.

구글 애널리틱스에서는 디멘젼(dimension)과 메트릭(metric)을 통해 여러 유의미한 데이터를 추출하여 보여주는데

이를 이해하기 위해서는 우선 이 두 개념을 잘 알고 넘어가야 한다.


1. 디멘젼(dimension)이란 무엇인가?

쉽게 말하면 측정하고자 하는 대상의 속성이라고 할 수 있다. 당연히 구글 애널리틱스에서 측정하고자 하는 ‘대상’은 트래픽이고, 트래픽의 속성이라 할 수 있겠다.

마케터들이 가장 많이 쓰는 속성 중 하나인 UTM paramter(UTM 코드)도 속성 중 하나일 뿐이다. Campaign, Medium, Source, Keyword(utm code에서는 term 필드), Content 5가지를 말한다.


이전의 글에서 많이 언급됐듯이 랜딩시키고자 하는 URL의 뒤에 파라미터 형태로 붙여준다.


a.com?utm_campaign=xxx&utm_medium=xxx&utm_source=xxx&utm_term=xxx&utm_content=xxx


뭐 저런 형태가 될 수 있다고 하겠다. 저렇게 뒤에 구분자를 이용하여 파라미터를 붙여주면 구글 애널리틱스에서는

여러개의 디멘젼 중에 Campaign, Medium, Source, Keyword, Ad Content 이 5가지의 디멘젼에 대칭하여 데이터를 자동으로 보여준다.

이렇게 구글 애널리틱스가 저 URL에서 각 구분자에 해당하는 utm~=xxx 값을 5개의 디멘젼에서 보여주기로 ‘약속’되어 있기 때문에 ‘알아서’ 보여주는 것이다.

통상적으로 저렇게 URL에 태깅해준 값을 불러오거나, 브라우저 쿠키에 저장된 값을 불러와서 데이터화시킨다.


따라서 저러한 dimension을 Custom화하여 측정하고 싶은 디멘젼을 만들어내려면

구글 애널리틱스가 새로운 디멘젼을 데이터로 읽어들일 수 있도록 ‘정의’하여 세팅 해줘야 한다.



2. 메트릭(Metric)은 무엇인가?

앞선 디멘젼이 트래픽의 속성이라면 메트릭은 어떤 속성으로 정의된 트래픽에 대해서 카운팅하고자 하는 것을 말한다.

기본적으로 데이터는 숫자다. 헤아릴 수 있어야 한다. 그러려면 숫자화시켜야 하는데 그러기 위해 필요한 것이 메트릭이다.


이를 테면 이러한 것들이 대표적인 메트릭이다.


방문 수, 세션 수, 이탈률, 종료율, 새 세션 비율, 세션당 페이지뷰 수, 목표달성 수 등등등

보통 수, 비율, 시간 등의 셀 수 있는 값으로 나타난다.



그래서 이 두가지를 종합해서 커스텀 레포트를 만들면 다음과 같은 아름다운 플랫보드를 만들 수 있다.

앞의 값들이 디멘젼, 뒤의 숫자로 나타나는 값들이 메트릭이다.


디멘젼과 메트릭을 쉽게 풀어내자면 이러한 것이다.

김개똥이가 어떤 신발 회사에 알바를 하러 갔다. 알바생의 지상목표는 신발의 갯수를 정확하게 파악하는 것이다.

그런데 이게 신발의 갯수만 세면 땡인 알바가 아니었다. 신발을 구성하고 있는 것들을 정확하게 파악해야 신발이 배송됐을 때 고객들의 불만을 듣지 않을 수 있기 때문에

신발을 구성하는 품목까지 모두 정확하게 세야 했다. 단순하지만 굉장히 중요한 아르바이트였다.


회사에서는 김개똥이에게 다음과 같은 것들을 주문한다.

그 회사는 제조회사는 아니고 유통 회사였기 때문에 여러가지 브랜드 신발을 취급하고 있었다.


나이스, 아디오스, 아직스 3가지의 브랜드 운동화를 취급했고

배송에 실수 가 없도록, 각 브랜드별로 신발을 구성하고 있는 신발끈, 밑창, 바디의 숫자를 세서 포장전에 기록할 수 있도록 했다.



위의 예에서 측정하고자 하는 트래픽은 무엇인가? 바로 ‘신발’이다.

그렇다면 디멘젼은? 저 회사의 ‘신발’의 속성이라 할 수 있는 브랜드, 즉 나이스, 아디오스, 아직스가 디멘젼이다.

그렇다면 메트릭은? 신발끈, 밑창, 바디 등 신발을 구성하는 셀 수 있는 것들을 말한다고 볼 수 있을 것이다.




2. 기존 구글애널리틱스에서 정의해놓은 디멘젼이 아닌 추가적으로 나만의 디멘젼을 측정하고 싶다면?


자, 이제 구글 애널리틱스에서 정의하는 디멘젼말고 나만의 디멘젼을 측정해보자.

이를 위해서는 구글 애널리틱스에서 제공하는 기능 중 Custom Dimension과 Filter 기능을 활용하면 쉽게 진행할 수 있다.

여기에 추가적으로 정규표현식(Regular Expression)을 알면 좋은데, 잘 알지 못한다면 개발자분들께 부탁하도록 하자.


쉬운 적용을 위해 상황을 하나 가정 해보자.

김개똥이는 이번 프로모션에서 네이버에서 들어오는 트래픽을 분석할 때 검색 광고가 검색 결과 페이지에서

상단 몇 번째에 위치하느냐에 따른 회원가입 전환율을 분석하고 싶다.


네이버에서는 URL 치환변수라는 것을 통해 URL에 {rank}라는 치환변수를 넣어주면

실제 유저가 검색 광고에 등록된 키워드를 검색했을 때 나오는 검색결과 페이지에서

클릭 발생시 클릭한 검색광고가 상단으로부터 몇 번째에 위치하는지 숫자도로 자동 치환하여 보여준다.


예를 들어 숫자가 1이면, 검색결과에서 첫번째로 떴을 때 클릭했다는 뜻이다.

어째든 이 데이터를 뽑아내려면 랜딩시키고자 하는 URL뒤에 xxx={rank}형태로 파라미터를 붙여주어야 한다.

이를 위해 xxx={rank}에서 xxx 디멘젼을 새롭게 정의해보기로 한다.



1) Custom Dimension에서 새로운 디멘젼 속성을 만든다.

구글 애널리틱스에서 Admin > Custom Definition > Custom Dimension으로 가면 커스텀 디멘젼을 정의할 수 있는 메뉴가 있다.

여기에서 다음과 같이 하고 싶은 이름으로 커스텀 디멘젼을 정의한다.


양식은 이따구로 생겼다.


간단하다. 디멘젼의 이름을 정하고, 범위를 정해주고, 사용중에 체크만 해주면 5초면 만들 수 있다. 범위란 세션, 히트 등을 고를 수 있게 되어 있는데, 이 디멘젼을 딸리는 메트릭을 카운팅 할 때 무엇을 기준으로 할 것인가를 정하라는 뜻이다. 다시 말해 카운팅 하는 방식을 세션 기준으로 할 것인지 히트 기준으로 할것인지 등등을 정하는 것인데 난 보통 세션을 기준으로 모든 데이터를 파악하고, 구글 애널리틱스 또한 기본적으로 세션 단위로 데이터를 파악하므로 세션을 선택해서 셋팅하는 편이다.


위의 예제에서 네이버 검색광고의 검색순위 데이터를 알고 싶으므로

편의상 디멘젼의 이름을 N-rank라고 정의했다고 치자.


2) Fiter를 활용하여 Custom Dimension에 데이터를 어떻게 쌓을 것인지 구글 애널리틱스에게 알려준다.

위의 과정을 완료하면 이제 ‘N-rank’이름의 데이터를 쌓을 수 있는 통이 하나 생긴 것이다.

이제 이 통에 어떤 데이터를 쌓을 것인지 구글 애널리틱스에게 알려줘야 한다.


마찬가지로 Admin > Filter로 들어간다.

이제부터가 좀 머리가 아플 수 도 있는데 존나 쉽게 생각하도록하자.



필터로 가게 되면 필터 이름을 생성하라고 한다.

필터이름은 편의상 ‘네이버 검색 광고 랭킹’ 으로 한다. 아무거나 이해하기 쉬운 것으로 하자.


그리고 고급을 선택하게 되면 위와 같은 딱 봐도 이해하기 어려운 양식이 펼쳐진다.

쉽게 이야기하면 필드 A > 추출 A라고 되어 있는 부분은 커스텀 디멘젼에 어떤 데이터를 쌓을지 정의할 때 URL에서 어떤 부분을 가져올 것인가를 정의하는 곳이다.

우리는 네이버 광고에 대한 검색 순위에 대한 정보를 가져오고 싶어한다. 그래서 예를 들어 랜딩 시키고자 하는 URL 뒤에 ‘&rank={rank}형태로 붙여주기로 했다.


그러면 정보를 가져오고자 하는 위치는 요청 URI이므로 앞의 드롭다운 메뉴에서 ‘요청URI’를 선택해준다.

그리고 해당 URI에서 어떤 부분을 가져올 것인가를 정의하기 위해 정규표현식을 사용한다.

식별자인 rank=을 써준뒤 그 뒤의 값에서 어느 범위까지 값을 가져올 것인가를 프로그래밍 언어인 정규표현식으로 표현해준다.


위의 그림에 나온 것은 rank=에서 =부분의 값 전체를 가져오되 그 뒤에 다른 &가 붙으면 그 앞까지만 값을 가져오게 하겠다고 표현해준 것이다.

다시말해 rank=김개똥, rank=aaa, rank=bbb 등 어떤 값이 오든 rank=xxx에서 xxx에 해당하는 값을 가져오겠다는 뜻이다.

정규표현식에 대해서는 나도 잘 모른다 ㅇㅇ


그리고 밑에는 비워두고 맨 아래에보면 출력대상 > 생성자라는게 보인다.

이 곳은 그래서 저렇게 뽑은 정보를 어떤 디멘젼에 보여줄래? 라고 물어보는 것이다.

여기에서 앞서 만들어두었던 N-rank라는 디멘젼에 데이터를 쌓을 것이므로 N-rank를 선택하고, 앞에 정의한 A필드의 값을 가져올 것이므로

$A1을 입력한다. 이 말은 앞에 정규표현식을 통해 정의한 A필드의 값을 가져오겠다는 뜻이다.


이 필터 생성을 통해 결과적으로 N-rank디멘젼에 rank=xxx에서 xxx에 해당하는 값을 쌓을 수 있게 됐다.

데이터는 바로 나타나지 않고 3-4시간정도 후에 나타날 수 있다. 향후에 어떤 유저가 네이버 검색광고를 클릭하게 되면

해당 광고가 검색 결과 페이지에서 첫번째면 1, 두번째면 2 등등 숫자형태의 데이터가 쌓이게 된다.



3. 정규표현식, 구글 애널리틱스를 위해 공부해야하는가?

정규표현식은 진짜 개같이 생겼다. 물론 개발자분들은 쉽게 이해하겠지만 개발을 1도 모르는 마케터 입장에서는 참으로 개같이 생긴 문자열이라고 할 수 있다.

이거 하겠다고 정규표현식을 배우는 거슨 말리진 않겠지만 헛짓이지 않을까 쉽다. 물론 구글애널리틱스를 잘 활용하려면 정규표현식을 알아두면 좋긴하다.

그런데 이거 몇가지 기능 때문에 정규표현식을 배우느니 다른 것을 공부하는게 더 낫다. 차라리 그 시간에 HTML이나 CSS를 공부하는 게 낫지 않을까...


무튼 정규표현식에서 막힌다면 주변 개발자나, 회사 개발자분에게 요청하도록 하자. 이 정도 레벨의 정규표현식을 짜는 것은 짧게는 5분, 길게는 10분정도면 끝난다.

시크한 개발자라면 좀 인상 찌푸리면서 겨우 이딴 걸 부탁하나...싶을 수도 있는데 왠만하면 이 정도는 다 해주시지 않을까 하는 생각이다.

이런거 부탁하는게 존나 꿀리거나, 쪽팔리다면 음 간단한 수준으로 정규표현식을 공부하는 것도 방법이면 방법이겠다.



커스텀 레포트로 가서 디멘젼에 만든지 얼마 안된 따끈따근한 디멘젼을 선택하여

데이터가 쌓이는지 확인한다. 정규표현식을 이상하게 짰다면 데이터가 안 쌓였을 수도 있다.

혹시나 정규표현식이 제대로 된 놈인지 확인하고 싶다면 이를 테스트할 수 있도록 지원하는 웹사이트가 많으니

해당 웹사이트에 정규표현식을 써서 셋팅한 정규표현식이 측정하고자 하는 데이터를 포함하는지 확인해보도록 하자.


글에 대한 좋아요와 구독은 필자에게 졸라큰 힘을 부여합니다.


구글 애널리틱스 야매스터디 페이스북 페이지 좋아요 하러가기

https://www.facebook.com/gastudy/

구글 애널리틱스 야매스터디 플러스친구 친구추가하기

http://pf.kakao.com/_IxiJjC

구글 애널리틱스 야매스터디 정기 뉴스레터 구독신청

http://eepurl.com/dmaPSL


매거진의 이전글 [GA]소셜 로그인 회원가입시 트래킹이 잘 되지 않으면
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari