brunch

You can make anything
by writing

C.S.Lewis

by 데이터리안 Aug 21. 2024

GA4 데이터 보관 기간 늘리기

대부분의 보고서는 이 설정에 영향을 받지 않지만...


실무 GA4 필수 설정 시리즈 모아보기

내부 IP 차단하기

인구 통계 및 관심 분야 수집 설정하기

구글 서치 콘솔 연결하기

데이터 보관 기간 늘리기

개발자 트래픽 제외하기



웹사이트에 GA4 연결하기 시리즈를 통해 GA4를 웹사이트에 잘 연결했습니다. 기본적인 세팅은 끝났지만, 더 정확한 데이터 분석을 위해서 몇 가지 설정이 남아있습니다.


앞으로 이 GA4라는 도구를 이용해서 사용자들이 내 서비스를 어떻게 사용하는지 분석하고, 서비스 개선의 아이디어를 얻을겁니다. 그런데 이 데이터에 불순물이 조금 끼어있을 수 있습니다. 바로 우리 자신이 만든 데이터입니다. 심지어 서비스를 만드는 사람들은 내 서비스가 너무 예쁜 나머지 일반 사용자들보다 더 자주 서비스에 방문하고, 더 활발하게 행동합니다. 이런 데이터를 포함해서 분석을 하게 되면 어떤 일이 일어날까요? 규모가 크고 사용자가 많은 서비스라면 우리가 만드는 데이터쯤이야 희석되겠지만, 사업이 초기이고 사용자가 아직 적다면 이렇게 내부자들이 만든 데이터가 전체 데이터 트렌드를 왜곡하기도 합니다. 따라서 내부 트래픽을 전체 데이터에서 필터링해내는 작업이 필요합니다.


아래 단계를 차근차근 따라오면 어렵지 않습니다. 중간중간 모르는 용어가 나오더라도 크게 신경쓰지 않으셔도 됩니다. 모든 설정이 그렇듯, 앞 단계에서는 ‘이걸 왜 하는거야' 궁금했던 것이 뒤에 가서 ‘이래서 했구나'하고 풀리기도 하니까요.  




내부 트래픽 정의하기

먼저, 어떤 IP 들이 내부 IP 들인지 정의해주어야 합니다. 이 과정을 마치면, 특정 IP로부터 들어온 모든 이벤트에 traffic_type 매개변수가 추가됩니다. 매개변수가 가지는 값은 기본적으로 ‘internal’ 이고, 설정에서 변경할 수 있습니다. 우리는 이 매개변수와, 매개변수의 값을 보고 ‘이 이벤트는 내부 IP로부터 들어온 이벤트 이구나'를 알 수 있게 됩니다.


   

1. 관리 > 속성 > 데이터 스트림으로 이동해, 내부 IP로부터 들어오는 트래픽을 차단할 데이터 스트림을 선택합니다. 스크롤을 내려 '태그 설정 구성'을 클릭합니다.


2. 설정에서 '모두 표시'를 클릭하고 '내부 트래픽 정의'를 클릭합니다.




3. '만들기' 버튼을 누르고, 내부 트래픽 규칙을 만듭니다. 규칙 이름, IP 주소를 입력해주세요. 정의한 IP 주소로 들어온 모든 이벤트에 traffic_type 매개변수가 자동으로 추가되며, 지정한 매개변수 값을 가집니다. 수정하지 않았다면 매개변수의 값으로는 internal 값이 들어갑니다.



[자주 묻는 질문 3]


1. traffic_type 값은 꼭 internal 이어야 하나요?

‘internal’은 기본값입니다. 내부 트래픽이 발생한 위치를 나타내기 위해 다른 값(예: seoul_office)을 입력할 수 있습니다.


2. 내 IP는 어떻게 알 수 있나요?        

IP 주소를 입력하는 구간에 있는 '내 IP 주소 알아보기' 를 클릭하면, 현재 사용하고 있는 인터넷의 IP 주소를 알려줍니다.


3. IP 주소를 범위로 지정하고 싶습니다.        

검색 유형을 ‘IP 주소가 다음 범위 내에 있음(CIDR 표기법)’으로 선택하고, 값에는 CIDR 표기법으로 IP의 범위를 표현해야 합니다. CIDR 표기법에 대해서는 [GA4] 내부 트래픽 필터링 문서를 참고해주세요.




4. 내부 트래픽 규칙이 잘 만들어졌습니다. 앞으로 정의해준 IP에서 들어온 모든 이벤트에 traffic_type 파라미터가 추가됩니다. 새로 추가된 파라미터가 GA 보고서에 반영되기까지는 하루 정도의 시간이 걸립니다.





데이터 필터 만들기

traffic_type 파라미터에서 특정 값을 가진 데이터들을 걸러내는 데이터 필터를 만들어 보겠습니다.    


1. traffic_type의 값이 internal 인 데이터를 걸러내는 데이터 필터는 이미 만들어져 있습니다. 내부 트래픽 규칙을 만들 때에, traffic_type 의 값을 internal 이외로 지정했다면 '필터 만들기' 버튼을 클릭하고, 값을 internal 으로 그대로 두고 규칙을 만들었다면 필터 이름이 Internal Traffic 인 항목을 클릭해주세요.



2. 필터 세부정보가 아래와 같이 기입되어있는지 확인해주세요.  

필터 연산을 ‘제외'로 선택해야 해당 데이터를 제외합니다. 필터 연산을 ‘트래픽 포함 기준'으로 선택한다면, 해당하는 데이터만 포함하고 나머지 데이터들을 버리게 됩니다. 우리는 내부 IP 에 해당하는 이벤트만 제외해야 하기 때문에 ‘제외'를 선택합니다.


다음 매개변수 값이 있는 이벤트 필터링에서는 내부 트래픽 규칙을 만들 때에 설정해준 traffic_type 매개변수의 값을 입력합니다.



3. 필터의 상태는 다음 세 가지 중 하나입니다. 테스트를 선택합니다.


- 테스트: 필터를 테스트하는 단계로, 영구 변경사항을 적용하지는 않습니다. 일치하는 데이터는 다음 측정기준 이름 및 측정기준 값으로 식별할 수 있습니다. 이 측정기준을 이용해 이후 필터가 활성된다면 제외될 데이터들의 규모를 보고서에서 미리 확인해볼 수 있게 됩니다.

측정기준 이름: 테스트 데이터 필터 이름

측정기준 값: <데이터 필터 이름> (진행중인 예시의 경우 데이터 필터 이름은 ‘Internal Traffic’ 입니다.


- 활성: 애널리틱스에서 필터를 평가하고 영구 변경사항을 적용합니다. 필터가 ‘활성' 상태에 들어가서 데이터가 제외되기 시작하면 제외된 데이터는 복구할 수 없기 때문에 신중하게 선택해야 합니다. GA 공식 문서는 “필터링은 파괴적인 작업입니다”라고 안내합니다.


- 비활성: 애널리틱스에서 필터를 평가하지 않습니다.





필터 테스트 하기

GA 보고서에서 ‘데이터 필터 이름 테스트'라는 측정기준을 가지고 필터를 테스트할 수 있습니다. GA 보고서에 테스트 필터가 반영되기까지 시간이 필요하니, 하루 정도가 지나고 아래 과정을 진행해주세요.   


1. 보고서 > 실시간 으로 들어가 '비교 추가 +' 버튼을 클릭합니다.



2. ‘Internal Traffic’ 필터의 테스트 데이터를 볼 수 있도록 아래와 같이 설정해주세요.



3. 왼쪽은 모든 사용자의 데이터가, 오른쪽에는 필터가 적용된다면 제외될 데이터가 표시됩니다. 여러 IP로 웹사이트에 접속해보면서 필터가 정확하게 동작하는지 테스트 해주세요.



4. 관리 > 속성 > 데이터 설정 > 데이터 필터 > 해당 데이터 필터를 클릭하고 활성을 체크해주세요. '저장' 버튼을 누르고 필터를 활성화하면 앞으로 필터에 해당하는 데이터는 GA 보고서에서 제외됩니다.





참고 자료  

GA4 공식문서: 내부 트래픽 필터링

GA4 공식문서: 데이터 필터





데이터리안 콘텐츠와 데이터 분석 능력 업그레이드 해볼까요?


 데이터 분석가들이 직접 발행하는 뉴스레터 무료로 받아보기


 데이터 분석 실무자들이 모여있는 오픈 카톡방 참여하기

(링크 클릭 후 오카방 메인 화면에서 참여 코드 확인 필수!)


 SQL 데이터 분석 캠프 커리큘럼 보러가기


 GA4 데이터 분석 캠프 커리큘럼 보러가기


 데이터리안 블로그에서 더 다양한 데이터 분석 콘텐츠 구경하기


 데이터 분석 전문 세미나 다음 주제 보러가기

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari