brunch

You can make anything
by writing

C.S.Lewis

by 비즈스프링 Feb 21. 2020

데이터 차이가 너무 큰데요?
특히 중국이요!

이런 분들에게 특히 도움될 수 있습니다 :)

– 중국에서의 온라인 비즈니스를 계획하고 있다.
– 중국에서의 온라인 비즈니스를 하고 있다.
로거를 포함한 2개 이상의 트래킹 툴을 쓰고 있는데, 특히 중국 유입 데이터 차이가 크다.


같은 고민을 하고 있는 분들에게 도움을 드리고자, 로거 고객지원으로 접수된 실제 문의를 토대로 확인한 내용과 과정을 공유합니다.  


IT기술이 발전하면서 데이터가 높은 가치를 지니게 됨에 따라, 많은 기업들이 데이터의 중요성을 언급하고 있습니다. 데이터 분석을 위한 Tool들이 만들어졌고, 개인/기업/단체 상관없이 많은 분들께서 여러가지 데이터 분석Tool을 사용하고 있습니다. 하지만 하나 이상의 Tool을 사용해보신 분들이라면, 이러한 고민을 한번 쯤은 해보셨으리라 생각합니다.


Q. 2개의 분석Tool 데이터가 달라요.
A. 분석 Tool 간 데이터 수집 기준이 다릅니다. 


명확한 답변이 아니라 아쉽지만 사실입니다. 각 분석 Tool 마다 각 기준에 따라 데이터를 수집하고 분류하는데, 기준이 조금씩 다르다보니, 그에 따라 데이터가 분석Tool 간 차이가 발생합니다. 대표적으로 ① 비교 대상의 차이(유입수, 방문수, 클릭수, 방문자수 등) ② 설치 환경의 차이(설치 위치, 설치 환경, 세션 기준 등) ③ 직/간접 전환기준(e.g. Lookback window) 차이 등이 있습니다. 2개 이상의 분석Tool 을 사용하시거나 매체사에서 제공하는 전환과 분석Tool 의 데이터를 함께 확인하셨던 분들이라면, 수집 데이터의 차이에 대해 많이 고민해보셨을거라 생각합니다.



최근 한 로거 사용자 분이 문의하였습니다.



“분석Tool 간 수치 차이는 인지하고 있지만 중국에서의 유입이 타 분석Tool에서는 하루에 30~40건으로 잡히는데, 로거에서는 1,000건 이상씩 방문수가 잡힙니다. 정확한 데이터가 맞습니까?”


분석Tool 간 수집기준으로 인한 차이라고 보기엔 수집된 데이터 차이가 너무 컸던터라, 어떤 차이가 있는 것인지 확인해보았습니다.


먼저 로거의 국가/지역별 데이터를 구분하는 기준을 다시 한 번 확인했습니다. 로거는 “IP”를 기준으로 국가/지역을 구분하는데요, KISA(한국인터넷정보센터)의 분류를 기준으로 구분합니다. 문의하신 고객 사이트에 유입한 방문자 IP를 확인해보니, 중국으로 분류된 IP 대역대의 방문자들이 실제로 다수 유입하는 것을 확인했습니다. 주로 ‘111.206.~’ IP 대역대 방문자들이 많더군요. 즉, 로거는 수집된 데이터를 IP 기준에 맞게 국가와 지역을 구분하고 있었습니다. (참고자료 : KISA(한국인터넷정보센터) 에서 중국 IP 대역대)



그렇다면 왜 분석TOOL 간 데이터 수치 차이가 크게 발생했던 것일까요?


실제 중국에서의 접속 환경을 똑같이 구현하기에는 한계가 있어서 직접 테스트를 진행하지는 못했지만, 참고할 만한 연구 사례가 있는지 관련 자료를 찾아보았습니다.


중국의 사회적인 특성이 데이터 수집에 차이를 발생시킨다는 자료를 많이 보게되었습니다. 중국은 Google, Facebook, YouTube 등에 액세스 할 수 없도록 “The Great Firewall(만리방화벽)”이라는 세계에서 가장 큰 방화벽 시스템으로 방대한 콘텐츠를 통제하고 있는 것을 많은 분들께서 알고 계실 것입니다. 이 방화벽이 분석Tool을 연결하는데 시간을 지연시키고, 연결 시간을 초과시킬 수 있다고 합니다. 그리고 법적인 제한도 있다고 하는데요, 중국은 해외로 데이터를 전송해야 하는 경우, 지정된 기관에서 보안 평가를 수행해야 한다고 합니다.


(참고자료: 중국의 웹 분석: 데이터 손실 및 대기 시간 극복 방법)



관련 자료를 찾다보니, 글로벌 분석Tool인 Google 앱과 관련된 자료를 종종 확인할 수 있었습니다. 중국에서는 특히 Google Analytics(GA)와 Google Tag manager(GTM)의 일부 기능이 차단되거나, 작동 시간이 느려지는 경향이 있다고 합니다. 스크립트 응답속도가 느려져서 작동 시간이 지연되면 데이터 수집에 영향을 끼칠 수 있습니다.


( 참고차료 : Is Google Analytics and GTM blocked in China? , Google Analytics Help스크립트 로딩 속도 알아보기 )


결국 이번 이슈는 분석Tool 간의 수집기준 차이가 아닌, 중국의 사회적, 법적 특성에 따른 이슈로 볼 수 있겠습니다.
데이터 수집을 위해 셋팅한 환경은 분석 사이트마다 모두 다르겠지만 로거에게 문의한 고객사의 경우, 동일기간 내 중국 유입수가 로거에서는 1,000건, GA에서는 3~40건 정도로 큰 차이를 보였었습니다. 유사한 데이터 차이를 보이는 분들은 본 콘텐츠의 ‘참고자료’를 검토해보시기 바랍니다. 이 외에도 중국에서의 유입 데이터 차이에 영향을 끼칠 수 있는 연구자료나 사례를 발견하신 경우 댓글로 공유해주시거나 비즈스프링으로 연락부탁드립니다. 감사합니다.


매거진의 이전글 방문자들이 특정 페이지에 접속한 경로를 알고 싶어요.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari