구글 애널리틱스 ‘필터’와 ‘세그먼트’의 차이 알아보기

구글 애널리틱스 야매 스터디 #12

Apr 14. 2018

최근 회사에서 마케팅 뿐만 아니라, 새로운 서비스에 대한 기획까지 맡게 되어서 정신 없이 바빴다.

그래서 매번 브런치 글 써야지 써야지 하다가 오랜만에 자판을 잡는다.

구글 애널리틱스에서 유입된 데이터를 보다보면 구글 애널리틱스가 제시하는 기준 말고, 마케터의 기준에 따라 데이터를 정렬시켜서 본다던지, 특정 데이터를 본다던지 등 자기 입맛에 맞게 데이터를 보는 기준을 바꾸고 싶을 때가 있다. 이러한 니즈를 해소해주기 위해서 구글 애널리틱스는 ‘필터’와 ‘세그먼트’ 기능을 제공한다.

1. 세그먼트(Segment)란 무엇인가?

세그먼트란, ‘조각’, ‘분할하다’라는 의미를 가지고 있다. 구글 애널리틱스에서는 여기저기서 모인 데이터의 집합을 조각내고 분할한다는 것을 의미한다. 쉽게 이야기해서 우리가 피자가게에 피자를 배달시켜서 배달된 피자를 먹기 좋게 ‘잘라서’ 먹듯이, 전체의 데이터를 16등분해서 16등분 중에 2조각만 본다던지, 3조각만 본다던지 등등 피자라는 전체는 다른 것으로 바뀌진 않지만 그 부분부분을 확대하거나 잘라내어서 본다는 것을 의미한다. 더 쉽게 이야기하면 엄청 거대한 지역을 탐험해야하는 탐험가라면 한 번에 거대한 지역을 탐험할 수 없으므로, 전체 지역을 나누어서 한 지역씩 탐험하는것처럼 방대한 데이터를 특정 기준에 의해 ‘변경’하는 것이 아니라 그 기준에 맞는 것들만 모아서 본다는 뜻.

여기서 중요한 것은 ‘변경하지 않는다는 것’이다. 돋보기로 특정 부분을 확대해서 보는 것과 같다. 그래서 구글애널리틱스에서는 세그먼트 기능을 이용하여 여러 개의 세그먼트를 아무리 만들어서 데이터를 본다고해도 원천 데이터가 훼손되지는 않는다. 부분을 모아서 보는 것일 뿐이니까. 예를 들면 이런거다.

한 남성의류 쇼핑몰에서 마케팅을 하는 담당자는 20대 남성중 A페이지를 방문한 남성들에 대한 ‘장바구니 담기’에 대한 전환율 알고 싶어졌다. 그래서 구글 애널리틱스에서 해당 데이터만을 집중적으로 보기 위해서 세그먼트 기능을 이용하여 연령은 20-29, 성별은 남성, 방문한 페이지 중 A페이지를 한번이라도 방문한적이 있는 데이터 집합을 보기 위해 해당 조건으로 세그먼트를 생성한다. 그 뒤에 해당 세그먼트를 적용하여 전체 사용자와 세그먼트로 정렬된 사용자의 장바구니 행위에 대한 전환율을 분석한다.

이런 식으로 세그먼트는 특정 기준에 부합하는 트래픽에 대한 것을 ‘집중적으로’ 분석하기 위해 쓰인다.

2. 필터(Filter)란 무엇인가?

필터 또한 세그먼트와 비슷한 기능이지만 아예 그 작동방식이 다르다. 필터란 일반적으로 알고 있듯이 ‘거른다’라는 의미를 가지고 있다. 정수기 필터가 오염된 물을 깨끗한 물로 걸러주듯이 구글 애널리틱스의 필터 기능은 유입되는 데이터를 필터 기준에 맞추어서 ‘변경’한다. 이는 이미 유입된 데이터들까지에도 영향을 미친다. 세그먼트는 원천 데이터에 영향을 주지 않지만, 필터는 원천 데이터를 바꾸어버리기 때문에 신중하게 써야한다. 그래서 구글 애널리틱스 계정 단위를 보면 View라는 기능이 존재하고, 여러가지 뷰를 생성하여 각자 다른 설정으로 데이터를 볼 수 있다.

필터를 써야하는 상황이라면 원천 데이터를 고이 간직하고 있는 뷰를 건드리지 말고, 새로운 뷰를 생성해서 해당 뷰에 필터를 적용시킬 것을 추천한다. 가장 순수한 데이터 유입이 되고 있는 데이터 셋은 남겨두어야 나중에 여러가지 필터를 적용시키고 데이터에 무수한 변화가 일어났을 때, 그 히스토리를 잘 파악할 수 있다.

필터 기능은 가령 이럴 때 쓰인다. 예를 들어 특정 IP에서 발생하는 트래픽을 차단하고 싶을 때이다. 특정 트래픽을 차단한다는 의미는 원래 들어와야 할 트래픽을 인위적으로 차단시키는 행위이므로 데이터에 대한 ‘변경’에 해당하는 사항이다. 즉, 필터 기능을 써야한다. 가장 많이 쓰는 것은 회사에 대한 내부트래픽을 차단하는 경우다. 마케팅 데이터는 고객들에 대한 행동을 분석하기 위함이지 내부 직원들에 대한 트래픽을 분석하기 위한 용도가 아니다. 안 그래도 내부직원들은 서비스에 들어가서 작업을 해야 할 경우가 많아 한 사람, 한 사람 홈페이지나 어플리케이션에 접속하는 경우가 빈번하므로 내부 트래픽을 제거해주지 않으면 크게 데이터 왜곡이 일어날 수 있다. 이러한 데이터들이 고객의 데이터와 섞여 있으면 제대로된 마케팅 의사결정을 할 수 없다.

그래서 일반적으로는 내부 트래픽을 차단한다. 대표적으로 쓰이는 IP주소를 알고 있으면 해당 IP주소를 차단할 수 있다.

이는 해당 IP로 접속을 못하게 한다는 것이 아니라, 해당 IP로 접속한 세션에 대해서는 구글 애널리틱스에서 카운팅하지 않는 다는 뜻이다.

3. 세그먼트와 필터의 가장 큰 차이점

세그먼트와 필터의 가장 큰 차이는 역시나 원천 데이터에 대한 ‘변경’이 있느냐 없느냐이다. 필터는 원천 데이터에 영향을 미치기 때문에 바로 적용되지 않고 최대 24시간이 걸리기도 하고 짧으면 몇 시간정도면 원천 데이터가 모두 생성한 필터에 의해 변경된다. 반면 세그먼트는 단순히 돋보기를 만들어서 보는 것일 뿐이므로 세그먼트를 만들게 되면 바로 세그먼트에 의해 정렬된 데이터를 볼 수 있다. 이 두가지 기능을 잘 활용하면 자신만의 기준으로 데이터를 쌓고, 볼 수 있다. 아마 구글 애널리틱스를 잘 쓰는 회사라면 적어도 세그먼트와 필터가 서너 개 이상은 있지 않을까 싶다.

keyword

매거진의 이전글온라인 광고시스템 계정구조 쉽게 이해하기_네이버검색광고데이비드 오길비가 말하는 광고 노하우 12가지매거진의 다음글