brunch

You can make anything
by writing

C.S.Lewis

by 하이프마크 Oct 14. 2021

구글 애널리틱스 : 정규식 사용하기

GA



구글 애널리틱스를 사용할 때 종종 사용되는 수식이 있습니다. 바로 정규식입니다. 당장 세그먼트를 설정할 때도 쓰이는게 바로 이 정규식이죠. 


데이터를 수집하기 위해서는 이 정규식을 입력해야 하지만 사실 처음 구글 애널리틱스를 접하는 분들에게는 낯선 이름이기도 합니다. 따라서 이번에는 정규식을 어떻게 만드는지에 대해서 알아보도록 하겠습니다.


정규식은 정규 표현식으로 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어입니다.


보통 문자열을 사용하는 프로그래밍에 주로 사용되고는 합니다. 


당연히 구글 애널리틱스에서도 사용되는데요, 여기서 정규식은 보통 데이터를 필터링하는데 쓰입니다. 방대한 데이터 중 원하는 정보만 가져오기 위해서 정규식을 입력하는 형태라고 보시면 됩니다. 예를 들어 특정한 연령대의 캠페인 데이터만 가져오도록 하고 싶으면 그에 맞는 정규식을 만들어 사용하는 것입니다.


이렇게 정규식을 사용하기 위해서는 원하는 정보를 위해 정확한 식을 만들 줄 알아야 합니다. 


그렇다면 정규식의 구성요소에는 뭐가 있을까요? 


크게 와일드카드, 앵커, 그룹, 이스케이프 문자로 나눌 수 있습니다. 이를 구글에서 제공하는 정보 기준으로 알아보겠습니다.



와일드카드



앵커



그룹



이스케이프 문자



이렇게만 보면 막연하게 느껴지죠. 그렇다면 자주 쓰이는 문자의 역할을 자세히 알아보도록 하겠습니다.


먼저 ‘.’은 하나의 문자로 취급되는 데요. 임의의 문자를 뜻하는 것으로 hyp*marc로 쓴다면 hyp1marc가 될 수도 hypemarc도 hyppmarc가 될 수도 있습니다. 


따라서 ab.로 작성한다면 ab로 시작하는 문자열과 일치하는 것이고, a.b로 작성한다면 a로 시작해 b로 끝나는 문자열과 일치하는 것입니다. 


‘?’는 앞의 문자가 없거나 혹은 한 번 일치한다는 문자입니다. 예를 들어 a?b라면 ab거나 aab라고 할 수 있습니다.


‘+’는 앞의 문자와 한번 이상 일치할 때를 뜻합니다. 한번 일치할 수도 있고 여러번 일치할 수도 있지만 꼭 한번 이상은 일치해야합니다. 따라서 무조건 +앞에는 문자 하나가 있어야 합니다.


따라서 규칙에 따라 a+b를 만들었다면 ab, aab, aaab가 될 수 있습니다.


‘*’은 앞의 문자가 없거나 하나 이상임을 나타냅니다. 따라서 * 앞에도 무조건 문자가 하나 이상은 있어야 하는데요. 식으로 나타내면 다음과 같습니다.


a*b라면 b, ab, aab, aaaaab가 될 수 있습니다. *는 문자 제한이 없기 때문에 a가 무한히 있는 문자가 될 수도 있습니다.


‘|’ 는 조건을 뜻합니다. or이라는 뜻이죠. 예를 들어 a|b 라면 a 혹은 b라는 뜻의 정규식이 됩니다.


^은 바로 뒤의 문자를 기준으로 시작하는 단어들을 찾습니다. 


^ab 를 만든다면 abcd, ab12, ab12a1 등 ab로 시작하는 모든 단어들을 찾아줍니다. 보통 url을 찾는데 많이 사용되고는 합니다. ^/kids/로 작성한다면 www.example.com/kids/로 시작하는 모든 데이터를 가져오기 때문입니다.


‘$’는 앞의 문자로 끝나는 단어들을 찾아줍니다. ab$로 작성한다면 12ab, cdab, 17b3ab 등이 일치합니다.


이처럼 위와 같은 문자들로 정규식을 만들어 구글애널리틱스를 사용하면 되는데요, 정규식은 간단할 수록 좋기 때문에 만드실 때 최대한 간결하게 만드시는 것이 좋습니다.


GA에서 정규식을 사용하는 항목은 잠재고객, 콘텐츠 그룹, 목표, 보기 필터, 세그먼트, 채널 그룹 등입니다. 


정규식을 이용해 구글 애널리틱스의 기능을 마음껏 누려보세요.


검색 엔진 최적화(SEO) 및 데이터 분석이 필요하시면 하이프마크에 문의해주세요.


감사합니다.



매거진의 이전글 구글 애널리틱스 : 전자상거래 추적하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari