GA
구글애널리틱스를 활용하면서 필요한 데이터 단위를 이해하기 위해 GA는 어떻게 세션과 사용자를 구분해내는지 알아보려고 합니다. 이를 알기 위해서는 쿠키와 클라이언트 ID의 개념의 이해가 필요합니다.
쿠키 (Cookie)
기본적으로 쿠키는 웹사이트에서 사용자의 정보를 기억할 수 있도록 하드디스크에 저장되는 작은 텍스트 파일을 말합니다. 구체적으로 서버에 의해 클라이언트 측에 저장되는 향후 개별 인식을 위한 정보라고 이해하시면 됩니다. 쿠키는 사용자의 기본 설정 등을 기록 합니다.
웹사이트에 삽입하는 구글애널리틱스 추적 스크립트도 사용자에 대한 정보를 저장하고 식별하기 위해 _ga라는 이름의 쿠키를 사용자의 하드디스크에 저장하게 됩니다.
이러한 _ga 쿠키는 마지막 상호작용으로부터 기본적으로 2년간 저장이 됩니다. 사용자가 2년 안에 다시 사이트에 접속한다면 접속 시점으로부터 다시 2년동안 다시 저장이 됩니다.
구글 애널리틱스와 같이 쿠키를 통한 유저 식별 방식은 단점도 존재합니다. 사용자가 언제든 쿠키를 삭제할 수 있다는 점입니다. 사용자가 사이트에 방문하면 쿠키와 임의 고객 ID 이른바 클라이언트 ID를 부여 받아 구글애널리틱스로 전송하게 됩니다. 그런데 쿠키를 삭제하고 사이트로 다시 돌아오면 새로운 쿠키와 클라이언트 ID를 받게 됩니다. 그래서 처음 들어왔을 때와 쿠키를 삭제하고 다시 들어왔을때 클라이언트 ID가 달라 사용자는 신규 사용자로 구분이되어 데이터가 수집이 됩니다.
동일한 사용자임에도 브라우저마다 다른 CID가 부여되 GA에서는 서로 다른 사용자로 4명으로 인식합니다
또한 _ga 쿠키와 클라이언트 ID는 브라우저마다 각각 생성되며 PC와 모바일 그리고 기기에 따라 별도로 생성이 됩니다. 또한 카카오앱이나 네이버앱 등 모바일 앱도 별도의 브라우저로 고려되어 다른 클라이언트 ID를 부여 받는 것을 참고하셔야 합니다.
클라이언트 ID (cid)
쿠키는 그 내부에 유저마다 부여되는 임의의 클라이언트 ID를 저장합니다. 사용자가 사이트에 도착하면 구글애널리틱스 추적 코드가 실행이 되어 _ga 쿠키가 기존에 있는지 확인하고 기존 쿠키가 있다면 쿠키의 정보를 읽어옵니다. 새로운 사용자라면 새로운 쿠키와 클라이언트 ID가 무작위로 생성이 됩니다.
좀더 구체적으로 보도록 하겠습니다.
1. 첫 번째 GA1은 사용중인 쿠키의 버전을 나타냅니다.
2. 두 번째 2는 점으로 구분되는 도메인 구성요소의 수를 나타냅니다.
(예: www.hypemarc.com = 2 , hypemarc.com = 1)
3. 세 번째 123456781은 사용자를 식별하기 위해 무작위로 생성된 값입니다.
이부분을 cid(Client ID)라고 부릅니다.
4. 네 번째 1647413584은 사용자가 처음 사이트를 방문한 타임 스탬프입니다.
구글 애널리틱스에서는 세 번째 및 네 번째 필드값을 사용하여 사용자를 식별하는데 사용합니다. 페이지 뷰, 이벤트, 거래 등 사용자의 상호작용은 각각 이러한 cid를 포함해 구글애널리틱스로 전송됩니다. 때문에 cid별 사용자 기록을 정리할 수 있게 됩니다.
클라이언트 ID는 사용자 레벨의 분석 뿐만 아니라 CRM 데이터와의 연동에서 유용하게 쓸 수 있습니다. 클라이언트 ID를 _ga쿠키로부터 읽어서 이를 ga에 맞춤 측정기준으로 기록하면서 동시에 CRM에도 기록하게 됩니다. 이렇게 되면 GA데이터를 CRM에 접목할 때 혹은 반대로 CRM 데이터의 특정 데이터를 GA에 업로드할 때 클라이언트 ID를 기준으로 해당 데이터를 붙여 넣을 수 있게 됩니다.
이렇게 쿠키 & 클라이언트 ID에 대해 알아보았습니다. 이렇게 쿠키와 클라이언트 ID를 이해하여 GA의 데이터에 있어 좋은 마케팅 분석으로 이어 나가시면 되겠습니다.
구글애널리틱스 도입 및 고도화 작업이 필요하시면 하이프마크에 문의해주세요.
감사합니다