brunch

You can make anything
by writing

C.S.Lewis

by 미스터리 Dec 07. 2022

UA vs GA4 중요한 데이터의 차이

 Google에서는 2023년 7월 1일부로 더 이상의 유니버설 애널리틱스의 신규 조회 처리를 진행하지 않는다고 밝혔습니다. Google 고객센터의 안내 확인하러 가기


 따라서 기존 애널리틱스인 유니버설 애널리틱스를 사용하고 있던 마케터분들과 기업들은 사이트 내의 사용자 분석을 위해 GA4의 구축을 시작해야 합니다.




 마케터들은 구글 애널리틱스를 통해 데이터를 확인하면서 이 데이터가 과연 실제 데이터와 얼마나 근사치를 보이는가에 대해서 지속적으로 확인하고 데이터를 다듬어 나가는 과정을 거치게 됩니다. 한 번 구축해두었다고 해서 데이터가 항상 신뢰할 수 있다고는 할 수 없기 때문이죠.


 저는 실제로 Google Analytics(기존 구글 애널리틱스 툴, 이하 UA)를 사용하던 이전 회사에서 Google Analytics4(이하 GA4)를 구축하면서 저는 UA와 GA4의 차이점이 무엇일까, 왜 구글은 GA4 서비스만을 진행하기 위한 준비를 하고 있는가에 대한 의문을 가졌습니다. 


 두 가지 구글에서 제공하는 애널리틱스 툴을 함께 사용하다 보면 왜 UA와 GA4의 데이터 통계에는 차이가 있는 것일까 하는 생각이 드실 겁니다. 그래서 오늘은 UA와 GA4의 데이터 집계 방식의 차이와 추가로 어떤 점이 데이터를 달라지게 할 수 있는지를 살펴보는 시간을 가져보겠습니다. 




1. UA, GA4 히트와 세션의 개념


 UA와 GA4의 데이터 집계 방식의 차이에 대해서 이해하기 위해서는 먼저 히트와 세션의 개념에 대해서 이해하고 넘어가는 것이 좋습니다.


 기본적으로 구글 애널리틱스에서는 히트(Hit)라는 가장 작은 데이터 단위를 수집합니다. 여기서 히트(Hit)라는 것은 방문자가 웹사이트에서 행하는 모든 개별적인 상호작용을 이야기하죠. 즉, 방문자가 각 사이트의 페이지들을 보고, 페이지 스크롤을 하고, 사이트 내에 활성화되어 있는 버튼 등을 클릭하고, 영상을 재생하는 이벤트 등 모든 사이트 내 취하는 행동들 각각을 히트라고 생각하시면 됩니다. GA4, UA 모두 히트로 구성되어있지만 히트의 단위가 다르다는 점을 참고하시면 되겠습니다.


 세션이란 동일한 사용자가 한 번 방문하여 발생시킨 히트 데이터 타입을 그룹화한 것이라고 할 수 있습니다. 여기서 알아둬야 할 것은 기존 구글 애널리틱스(UA)는 바로 이 세션 단위로 데이터를 집계하고 있다는 것입니다. 

UA 데이터 통계 보고서


 UA 보고서를 보더라도 데이터를 세션(Session) 기반으로 집계하여 보여주고 있다는 걸 볼 수 있습니다. 예를 들면 UA에서 확인되는 전환율은 (실제 전환 이벤트 수 / 사용자 수)가 아닌 (실제 전환 수 / 세션 수)가 되는 것이죠. 또한 주로 세션, 세션당 페이지수, 평균 세션 시간 등 세션 데이터를 기반으로 확인할 수 있는 것을 볼 수 있습니다.


 세션의 경우 30분 동안 활동이 없거나 어떠한 요건을 충족하는 경우에는 해당 사용자에게 부여했던 1개의 세션이 종료되는데, 이는 세션이 종료된 후 새로운 세션이 부여되기 때문에 1명의 사용자이더라도 2개 이상의 세션이 발생할 수 있다는 뜻입니다.


 특히 기존의 UA에서는 30분 이상 활동하지 않았을 때가 아니더라도 새로운 세션이 발생하는 요건이 있는데 이는 아래와 같습니다.  


일자가 넘어가는 시점

 기존 UA에서는 30분이 경과되지 않았더라도 시간이 00:00이 되어 다음 일자로 바뀌었다면 새로운 세션으로 인지하여 2번째 세션이 발생됩니다.


유입 캠페인 또는 채널이 변경되는 경우

 UA에서는 추가적으로 유입 캠페인 또는 채널이 변경되는 경우 새로운 세션이 발생될 수 있습니다. 예를 들어 다음카카오 비즈 보드 광고를 보고 사이트에 유입되었다가 사이트를 이탈한 뒤, 네이버 키워드 검색을 통해 다시 유입되었다면 30분이 지나지 않았더라도 새로운 세션이 발생하는 경우가 발생합니다.


다른 브라우저로 접속하는 경우

 브라우저에는 여러 종류가 있습니다. 크롬과 엣지, 익스플로러, 브라우저들의 시크릿 모드 등 브라우저 별로 고유한 쿠키 값을 부여하여 사용자를 식별하기 때문에 브라우저가 달라진다면 세션 또한 달라질 수 있습니다.


 이것이 시사하는 바는 세션으로 데이터를 집계하는 경우 세션은 사용자 수보다 많아질 수 있고, UA에서는 하나의 세션에서 발생하는 전환 이벤트는 세션이 끝나기 전까지는 여러 번 전환 이벤트가 발생하더라도 1번의 전환 이벤트가 발생한 것으로 집계됩니다. 




2. UA, GA4 데이터 집계의 차이

출처: Google 고객센터


UA의 히트 타입

 UA에서의 히트 타입은 페이지뷰, 이벤트, 소셜, 거래/전자상거래, 사용자 시간, 예외, 앱/화면 조회수 등의 타입으로 나누어 볼 수 있습니다. 


GA4의 히트 타입

 GA4에서의 히트 타입은 이벤트 타입만이 있다는 점이 차이점입니다. 그리고 이러한 이벤트 안에는 매개변수(파라미터)가 설정되어 해당 발생한 이벤트들의 값들을 구분하여 저장할 수 있습니다.




기존 구글 애널리틱스의 태그 생성 방식(Google Tag manager)


 GTM에서 UA의 태그를 생성해본 마케터분들이라면 인지하고 계실 수 있겠지만 UA에 히트 단위의 데이터를 발생시키기 위해서는 "추적 유형"에서 페이지뷰, 이벤트, 거래, 소셜 채널, 시간 등등 많은 히트 타입 중에 선택을 해줘야 하고 카테고리와 작업, 라벨도 설정해 주어야 했습니다.


 그렇다면 도대체 UA에서 이러한 히트의 집합인 세션을 기반으로 데이터를 수집하게 되면 어떻게 될까요? 바로, 실제 사용자의 행동보다 통계가 적게 잡힐 수 있다는 것입니다. 아래의 한 가지 예를 들어보겠습니다. 

 ex) 한 명의 사용자가 세션이 끝나기 전 2번의 구매를 했다면? 현재까지 내가 확인한 바로 1번의 전환으로 UA에서는 집계할 수 있다.

      

GA4 태그 생성 방식(Google Tag manager)


 하지만 GTM에서 GA4 태그를 생성해보면 이벤트 발생 시 이벤트의 이름, 매개변수(파라미터) 이름을 설정하고 해당 매개변수(파라미터)에 어떤 값을 넣을 것인지를 정해주면 끝입니다. 즉, 모든 데이터가 이벤트라는 히트 데이터 타입 한 가지로 매개변수에 값이 저장되기 때문에 UA와 같이 추적 유형을 설정해 주거나 카테고리, 작업, 라벨을 설정할 필요가 없는 것이죠. 




3. UA, GA4 데이터 집계의 차이에 대한 개인적 의견 


 3-1. 사용자 전환 이벤트의 차이_GA4가 사용자를 더 정확하게 분석할 수 있다. 

 현재 제가 가진 지표를 보면 UA에서 전환 수에서 GA4와의 차이가 약 1.2배~1.5배 정도 나는 것으로 확인됩니다. 이에 대해 의문이 들어 Google 고객센터에 문의해본 결과 UA에서는 세션을 기반으로 데이터를 집계하고, GA4는 발생하는 모든 이벤트를 기반으로 데이터를 집계하기 때문에 GA4의 데이터가 일반적으로 높을 수밖에 없다고 답변을 해하였습니다. 

 왜냐하면 GA4는 이벤트가 발생할 때마다 전환 이벤트로 데이터가 집계되지만 UA에서는 세션 단위로 집계하기 때문에 한 사용자에게서 세션이 끝나기 전 2번의 전환이 발생하더라도 1번의 전환으로 집계할 수 있다고 합니다.

 그렇기에 조금 더 사용자를 정확하게 분석할 수 있는 것은 UA보다는 GA4라고 생각됩니다. 또한 이것에서 시사하는 점은 UA와 GA4 모두 구축해둔 상태라면 기존의 UA 세션 데이터가 GA4 세션 데이터보다 적게 집계되고 있다면 어느 요소에서 문제가 발생했을 수 있으니 확인하는 것이 필요할 수 있습니다. (GA4 세션 데이터가 UA 세션 데이터보다 적거나 비슷한 게 정상입니다.)


3-2. GA4가 UA보다 자유도가 매우 높다. 

 GA4를 세팅하고 사용해보면서 느낀 점은 자유도가 굉장히 높다는 것입니다. 따라서 이벤트와 이벤트를 구성하는 매개 변수만 잘 구축한다면 내가 보고 싶은 보고서를 만들어 통해 어떤 데이터든 볼 수 있다고 할 수 있습니다. 다만 자유도가 높은만큼 구축하고 다루는 데에 어렵다는 뜻이 될 수 있습니다. 


3-3. 이외. 

 이외로는 기존 구글 애널리틱스 GA(UA)에서는 1,000만 히트 이하에서만 무료로 지속 사용이 가능했는데, GA4에서는 그러한 제한이 사라졌기 때문에 더 많은 데이터를 마음 놓고 집계할 수 있다는 점이 있겠습니다.

 또한 이외 무료로 연동할 수 있는 플랫폼(빅쿼리 등)이 많아졌기 때문에 앞으로 GA4로 넘어가는 시기가 빠르면 빠를수록 회사 입장에서는 조금 더 정확하게 사용자 분석을 할 수 있을 것이라고 생각합니다.

 물론 아직까지는 GA4가 안정화 단계를 거치고 있는 상황이라 간혹 데이터 집계의 오류가 발생하기도 하긴 합니다. 그래도 이러한 리스크를 감수하더라도 충분히 미리 준비하고 구축해둘 필요성이 있습니다.


 혹시 GA4 설치를 해보고 싶으신 분들은 아래의 링크로 이동하시어 GTM을 활용한 GA4 설치 방법을 확인해보시기 바랍니다.


GTM을 활용한 GA4 설치 방법 및 주의사항




GA4를 시작하기 두려워하는 마케터들에게


 앞으로는 제자리에 머무를 UA 보다는 지속적으로 업데이트되고 발전해 나갈 GA4에 시간과 노력을 조금 더 쏟아보는 것은 어떨까요?


 어려운 점이 있으시다면 메일 또는 댓글로 문의하세요. 제가 아는 선에서 도움이 될 수 있도록 하겠습니다. 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari