GA4 개념 이해 part 1. 세션, 사용자

기초적이지만 아주 중요한 Session과 User

by 미스터리

"총 사용자 수와, 새 사용자, 재방문자의 기준이 뭔가요?"

"기존 고객들의 구매 행동들을 파악하고 싶은데 or 구매 주기를 파악하고 싶은데 가능한가요?"

라고 질문 받았을때, 곤란하셨던 마케터분들이라면 한 번쯤 읽어도 좋을만한 글입니다.


여러분들은 위의 질문들에 명확하게 답변을 하셨나요?


마케터로서 처음 구글 애널리틱스4(Google Analytics4)를 접하시는 분들이라면, 각각의 개념에 대한 정의를 정확하고 명확하게 이해하고 계시는 것이 중요하죠.

그래서 오늘은 GA4를 활용하는 마케터분들이 들으면 좋을만한 개념들을 설명해드릴까 해요.


<세션(Session), user_pseudo_id, user_id에 대한 이해>

세션(Session)이라는 것은 생소한 개념이실 수 있을거예요. 하지만 GA4가 이벤트 중심으로 데이터를 수집하지만 세션은 이러한 이벤트들을 의미 있는 단위로 묶어주는 핵심적인 역할을 하기 때문에, 사용자들의 행동 데이터를 이해하기 위해 가장 기본적이면서도 중요한 개념이라고도 할 수 있어 꼭 이해하고 넘어가시는게 좋아요.


구글에서 이야기하는 세션의 기본적인 정의는 사용자가 포그라운드에서 앱을 열거나, 페이지 또는 화면을 보고 현재 활성화된 세션이 없을 때 시작되는 하나의 사용자 정보를 담는 이벤트라고 명시되어 있어요.


초기 셋팅으로는 사용자가 자사의 웹/앱에 접속하면 세션이 시작되고, 10초 이상 세션이 지속되거나 전환 이벤트 1회 이상 발생, 페이지/화면 조회가 2회 이상 발생한 세션은 GA4에서 추가적으로 "참여 세션"으로 구분해요. 그리고 세션이 시작된 후 30분까지 사용자가 아무런 행동을 하지 않거나 이탈하면 세션은 종료되죠.

여기서 한 가지 알아두어야 할 포인트는 세션의 시작은 session_start 이벤트를 발생시켜 수집하고, 이와 동시에 세션 ID(ga_session_id)와 세션 번호(ga_session_number)를 생성하여 사용자의 세션마다 부여한다는 점이에요.


해당 값들을 통해 우리는 세션을 구분할 수 있게 되는 것이죠.


여기서 문제!


동일 사용자라면 다음에 들어오더라도 세션 ID인 ga_session_id와 세션 번호 ga_session_number 값은 똑같을까요?


정답은 NO! 입니다.


그럼 GA4는 신규 방문자와 재방문자를 구분할까요?


신규와 재방문자 구분을 위해 GA4는 브라우저 쿠키와 기기 인스턴스 ID를 기반으로 하는 user_pseudo_id라는 익명의 id 값을 활용합니다.


그럼 user_pseudo_id 값을 통해서는 동일 사용자를 추적할 수 있는거죠!?


반은 맞는 말이지만 한 가지 기억하셔야 할 것이 있어요.


바로 user_pseudo_id 값은 위에서 말한 것처럼 쿠키 값과 기기의 인스턴스 ID값을 기반으로 하기 때문에,

쿠키 값이 달라지거나 다른 기기로 접속하면 다른 사용자로 인식하게 될거예요.

즉, 넓은 기간으로 데이터 조회 기간을 설정할 수록 동일 사용자지만 쿠키/캐시가 삭제되거나 다른 기기로 접속하는 사용자들이 발생할 가능성이 높아지고, 이로 인해 동일 사용자이지만 다른 사용자로 인식된 집계가 분명 존재하기에 신뢰도가 낮아질 가능성이 높다는 것이죠.


그럼 도대체 어떻게 동일 사용자들을 구분할 수 있을까요?


이 부분은 개인정보 보호법으로 인해서 어쩔 수 없는 GA4의 한계라고 생각해요.


하지만, 방법이 완전 없는 것은 아니긴합니다.

개인을 특정할 수 있는 실제 user_id 데이터 값을 저장하는 것은 법적으로 문제가 되지만, 해당 user_id 값을 암호화하여 활용한다면 사용은 가능합니다.

다만 이 과정에는 사용자가 웹에 로그인했을 때, 웹사이트의 서버나 프론트엔드에서 회원의 고유 ID를 가져와 해시 처리 한뒤, daterLayer.push()를 통해 암호화된 user_id 값을 뿌려주어야 가능한 부분이라고 할 수 있습니다.

이건 GTM으로 설정할 수 있는 부분이 아니기 때문에 개발팀의 협력이 필요한 부분이라고 할 수 있습니다. 개발팀과의 협력이 가능하신 분들이라면 시도해보시면 좋겠네요.




자 그럼 이제 우리는 누군가

"해당 데이터에서 총 사용자 수와, 새 사용자, 재방문자의 기준이 뭔가요?"

라고 질문했을 때, 답할 수 있게 되었습니다.


간단히 설명해보자면, GA4에서 사용자 기준은 기본적으로 익명의 기기 ID(user_pseudo_id) 값과, 로그인 기반의 회원 ID(user_id)으로 구분하는데,

현재 우리는 로그인 기반의 회원 ID(user_id) 값을 암호화 처리하여 데이터레이어 푸시를 뿌려줄 수 있는 조건이 형성되어있지 않기 때문에 익명의 기기 ID(user_pseudo_id) 값만으로 동일 사용자들을 구분하는 방식을 활용하고 있다.

익명의 기기 ID(user_pseudo_id) 값은 기기가 달라지거나, 사용자의 쿠키/캐시 값이 삭제되는 경우 새로운 사용자로 인식하는 형태이기 때문에 이를 기준으로 총 사용자 / 새 사용자 / 재 방문자를 구분한다고 말이죠.


그럼 이 질문은 어떨까요?

"기존 고객들의 구매 행동들을 파악하고 싶은데 or 구매 주기를 파악하고 싶은데 가능한가요?"


빅쿼리의 쿼리를 통해서 해당 데이터를 추출할 수는 있겠지만, 문제점이 있다. 현재 우리는 User_id 값을 활용하지 못하고 익명의 기기 ID(user_pseudo_id) 값을 통해 동일 사용자를 구분하고 있어서 사용자의 쿠키/캐시가 삭제되거나 다른 기기로 접속하게 되면 다른 사용자로 인식한다.

따라서 넓은 기간에 대한 데이터를 추출할수록 신뢰성이 낮은 데이터가 추출될 가능성이 높다고 말이죠!


오늘은 아주 기본적인 부분인 GA4에서 사용자를 구분하는 방식과 세션에 대한 이해해보는 시간을 가져보았습니다. 혹시라도 어려운 부분이 있으시다면 댓글로 질문을 남겨주세요 :)

매거진의 이전글정말 퍼포먼스 마케팅을 하고 있나요?