용어편 2.
원문 : 소셜마케팅코리아 블로그 - http://blog.socialmkt.co.kr/451
GA에 접속 시 처음 보게 되는 화면은 보통 아래와 같습니다.
상단의 ‘홈’, ‘보고서’, ‘맞춤설정’, ‘관리’ 각각의 메뉴가 하는 일은 대략 짐작할 수 있지만, 중단에 있는 ‘계정’, ‘속성’, ‘보기’ 이 3가지 항목의 경우 정확한 이해가 없다면 올바른 데이터 적재가 어려울 수 있습니다.
각 단어가 지닌 사전적인 의미보다 3가지 계층이 갖는 사용처와 구조에 대한 이해가 필요합니다.
흔히 일반적으로 생각하는 ‘계정 / 비밀번호’를 뜻하는 의미는 가지고 있지 않습니다. 단순히 구글 애널리틱스에서 데이터 적재를 위한 계층구조에서 최상위층 계층을 뜻합니다. 데이터 분석을 위해 최소로 필요한 단위이며, 가장 높은 단계의 계층으로써 하위 계층으로 ‘속성’과 ‘보기’를 포함한다. ‘계정’은 보편적으로 가장 큰 범주이기 때문에 보통 프로젝트를 구분할 때 사용하게 됩니다.
실제로 데이터의 ‘속성’을 기준으로 구분 짓는 계층으로, 모바일 데이터인지, PC 데이터인지와 같은 속성적인 구분을 하는 계층입니다.
추적코드가 발급되는 최소단위로, 프로젝트 내에서 구분 지어야 하는 페이지 (e.g PC/Mob..) 별로 데이터를 따로 적재하기 위해서 사용하게 됩니다. 다른 속성이라고 할지라도 같은 계정에 종속되어 있다면 추적코드 또한 UA-XXXXXXX-1, UA-XXXXXXX-2 이런 식으로 발급됩니다. 다시 말해 추적코드에서 마지막 한자리만 바꿔준다면 다른 속성으로의 트래픽 전송도 가능합니다.
‘속성’ 계층에 대한 이해는, 그 사용처보다도 추적코드가 발급되는 최소단위라고 이해하고 사용하는 것이 옳습니다. Google Analytics의 시작과 끝은 추적코드입니다.
일부 자료에서는 Profile이라고도 표현되는 ‘보기(View)’는 실제 보고서를 볼 수 있게끔 데이터가 최종적으로 적재되는 통과 같습니다. 3 계층 구조에서 가장 낮은 단계의 계층으로 나뉘는 구분은 기기의 구분이나 용도의 구분이 됩니다.
1개 ‘속성’에 25개의 ‘보기’를 생성할 수 있으며, 생성과 파기가 쉽지만 실제 데이터에 영향을 끼치는 행동이므로 주의해야 합니다. 최근 업데이트로 휴지통이 생겼지만, 휴지통에 담겨있는 동안 쌓였을 데이터는 적재되지 않고 유실되게 되니 사용에 신중을 기해야 합니다.
PC / Mobile 데이터 구분 : 대부분의 사이트들은 크게 ‘PC’와 ‘모바일(태블릿 포함)’로 사용자의 기기 구분이 나뉘어지게 되는데, 이 두 구분은 전자상거래 사이트와 정보성 사이트 모두 큰 기준으로 작용합니다. 그렇기 때문에 필터로 각기 다른 보기에 적재시키는 것이 좋습니다.물론 동시에 혼합되어 있는 보기도 필요합니다.
- Raw Data : 보기 내의 데이터 수집에 오류가 있었거나, 쓰레기 값들이 유입됐을 경우 데이터가 ‘오염 되었다’라고 합니다. 이 오염된 데이터는 복구 시킬 수 없기 때문에, 언제든 원(元) 데이터에 접근 할 수 있도록 아무런 필터가 설정되어 있지 않은 원데이터를 담아두는 보기가1개 필요합니다.
- 테스트 : 필터를 적용한다는 것은, 단순히 특정 데이터만 보여달라는 뜻이 아닌, 필요하지 않은 데이터는 컨테이너에 담지 않겠다라는 뜻입니다. 필요한 데이터만 추출해서 보기위해 일정 필터를 적용시켜서 보곤 하는데, 필터 수식이 틀렸을 경우 데이터가 오염되는 경우가 발생합니다. 그래서 원래 데이터를 적재하는 보기에 직접적으로 필터를 테스트 하는 경우는 없어야한다.
‘속성’과 ‘보기’와의 관계에서 많은 실수가 발생되고, 많은 데이터가 손실 혹은 오염됩니다. 보기에 있는 필터(Filter)가 포토샵의 레이어나 엑셀의 필터라고 생각해서 발생하는 실수입니다. Google Analytics의 보기에서 말하는 필터는 그와 다르게 실제로 원데이터 (Raw Data)에 영향을 끼칩니다. 그래서 보기를 지우게 되면, 적재되어 있던 트래픽 모두도 삭제되는 것입니다.
위의 설명에서처럼 모든 ‘보기’가 ‘속성’으로부터 동일한 데이터를 받지만, 그 모든 데이터를 적재하는것은 아닙니다. 각각의 보기는 다른 필터를 가지고 있고, 해당 필터에 의거해서 각기 다른 데이터를 적재하게 됩니다. 그렇기 때문에 모든 ‘보기’의 데이터를 합친다고 해서 온전한1개의 원 데이터가 나온다고 할 수 없습니다. ‘보기’는 필요없는 데이터를 제거하고 원하는 데이터를 원하는 형태로 적재시키는 컨테이너라고 이해하는것이 가장 정확합니다.
각각의 ‘계층’은 보편적인 사용처가 있습니다. 꼭 보편적인 상태로 사용해야 한다는 강제성을 가지거나 그렇게 사용하지 않을 경우 불이익을 받지는 않습니다. 하지만 Google에서 추천하는 각 계층의 사전적 의미이자 사용처이기 때문에 높은 효율을 보여줍니다. 하나의 ‘계정’에 두 개의 ‘속성’ 그리고 두 개의 ‘보기’를 설정 하는 것과, 두 개의 ‘계정’에 각각 하나의 ‘속성’과 ‘보기’를 갖는 것이 크게 다를 것은 없으나, 데이터를 보게 될 관리자의 순차적인 정리를 위한 개념정립이 필요합니다.
함께보면 좋은 글