brunch

우리 광고비, 가짜 데이터에 새고 있다

프로드(Fraud)를 잡아내는 3가지 데이터 분석 기법

by 위키북스
우리 광고비, 가짜 데이터에 새고 있다? 프로드(Fraud)를 잡아내는 3가지 데이터 분석 기법
Screen_Shot_2025-10-08_at_6.52.35_AM.png?type=w966


열심히 집행한 광고 캠페인, 분명 데이터상으로는 성과가 좋은데 실제 매출에는 변화가 없었던 경험이 있으신가요? 디지털 마케팅 예산의 상당 부분이 우리가 알지 못하는 사이에 '가짜 데이터'로 인해 증발하고 있을지도 모릅니다. 디지털 광고 생태계는 광고주, 광고 매체, 퍼블리셔 등 수많은 이해관계자가 복잡하게 얽혀 있어 트래픽의 출처와 진위를 파악하기 어렵습니다. 이러한 틈을 타 악의적인 퍼블리셔들은 의도적으로 데이터를 조작해 광고주를 속이고 부당한 이익을 챙기는데, 이를 프로드(Fraud)라고 합니다.


프로드는 단순히 예산을 낭비시키는 것을 넘어, 데이터의 신뢰도를 떨어뜨려 잘못된 의사결정을 유도하고 캠페인 성과를 왜곡시키는 심각한 문제입니다. 그렇다면 눈에 보이지 않는 가짜 데이터를 어떻게 찾아낼 수 있을까요? 이번 글에서는 책 『디지털 마케팅, AI로 날개를 달다』의 4장 '프로드(Fraud), 가짜 데이터 가려내기' 내용을 바탕으로, 소중한 광고 예산을 지키기 위한 3가지 핵심 데이터 분석 기법을 구체적인 사례와 함께 소개해 드리겠습니다.





클릭-설치 시간(CTIT) 분석: 비정상적으로 빠르거나 늦으면 의심하라!

CTIT(Click To Install Time) 분석은 이름 그대로 광고를 클릭한 시점부터 앱이 설치되기까지 걸린 시간을 분석해 프로드를 탐지하는 가장 기본적인 방법입니다. 사용자가 광고를 클릭하고, 앱 스토어로 이동해 앱을 다운로드하고, 처음 실행하기까지는 물리적인 시간이 필요합니다. 이 과정이 비정상적으로 짧거나 길다면 프로드를 의심해 볼 수 있습니다.


CTIT 분석으로 잡아낼 수 있는 대표적인 프로드 유형은 다음과 같습니다.


주요 프로드 유형


인스톨 하이재킹 (Install Hijacking): 사용자가 정상적으로 앱을 설치하는 마지막 순간에, 기기에 잠입해 있던 악성 소프트웨어가 가짜 클릭 데이터를 발생시켜 광고 성과를 가로채는 방식입니다. 실제 클릭이 아닌, 설치 직후에 클릭이 발생한 것처럼 꾸미기 때문에 CTIT가 비정상적으로 짧게 나타나는 특징이 있습니다. (참고 이미지: 332페이지, 그림 4.31) 이 그림은 인스톨 하이재킹이 어떻게 정상적인 설치 과정에 개입하여 CTIT를 비정상적으로 단축시키는지 잘 보여줍니다.


클릭 플러딩 (Click Flooding): 실제 사용자의 행동과 무관하게 허위 클릭을 대량으로 생성하는 방식입니다. 이렇게 생성된 수많은 가짜 클릭 중 하나가 우연히 오가닉(자연) 설치 직전에 발생했다면, 그 설치는 해당 광고의 성과로 둔갑하게 됩니다. 허위 클릭과 실제 설치는 아무런 관련이 없으므로 CTIT가 매우 길게 나타나는 경우가 많습니다.



실전 분석 방법: 분포 그래프 확인하기


수백만 건의 데이터를 하나씩 볼 수는 없겠죠? 이때 데이터를 시각화한 CTIT 분포 그래프를 활용하면 패턴을 쉽게 파악할 수 있습니다.


정상적인 트래픽

아래 그래프처럼 대부분의 설치가 클릭 후 수십 초에서 몇 분 사이에 자연스러운 종 모양(bell curve) 분포를 보입니다. 아래 그래프는 정상 트래픽의 CTIT 분포는 사용자들이 광고 클릭 후 앱을 설치하기까지 자연스럽게 소요되는 시간을 보여주는 좋은 예시입니다.

Screen_Shot_2025-10-08_at_6.36.53_AM.png?type=w966



비정상적인 트래픽

아래와 같이 특정 구간에 데이터가 몰려 있거나 비정상적인 패턴을 보인다면 프로드를 의심해야 합니다. 이 그래프는 비정상적인 CTIT 분포의 대표적인 사례입니다. 0초에 가까운 구간(초록색)은 인스톨 하이재킹을, 매우 긴 시간 뒤에 나타나는 구간(보라색)은 클릭 플러딩을 시사합니다.


Screen_Shot_2025-10-08_at_6.40.00_AM.png?type=w966





버전 분석: 구식 버전에서의 수상한 움직임

버전 분석(Version Analysis)은 사용자의 앱 버전과 OS 버전 데이터를 통해 프로드를 식별하는 기법입니다. 프로드 행위자들은 보안이 취약한 오래된 버전을 악용하는 경우가 많기 때문입니다.



앱 버전 분석

현재 앱스토어에서 다운로드할 수 없는 아주 오래된 구버전에서 설치가 대량으로 발생한다면 비정상적인 활동일 가능성이 높습니다.


OS 버전 분석

대부분의 사용자는 최신 OS로 업데이트하지만, 프로드 행위자들은 보안이 취약한 구버전 OS를 타겟으로 삼습니다. 예를 들어, 대부분의 사용자가 Android 13, 14를 사용하는 상황에서 Android 4.0 같은 아주 오래된 OS 버전에서 설치가 급증한다면 프로드 트래픽일 확률이 매우 높습니다.

Screen_Shot_2025-10-08_at_6.43.09_AM.png?type=w966





사용자 행동 분석: 진짜 유저는 KPI만 달성하고 떠나지 않는다

설치 수를 늘리는 데 성공했더라도, 그 사용자들이 앱에서 아무런 활동을 하지 않는다면 의미가 없습니다. 사용자 행동 분석은 설치 이후의 데이터를 추적하여 트래픽의 질을 판단하는 가장 확실한 방법입니다.


미국 드라마 '실리콘 밸리'의 한 장면처럼, 누적 다운로드 수는 50만인데 실제 활성 사용자(DAU)는 1만 9천 명에 불과할 수 있습니다. 심지어 그 1만 9천 명마저도 '사진 1장 업로드'라는 KPI만 충족시키고 바로 이탈하는 가짜 사용자일 수 있습니다.



실전 분석 방법: 전환 퍼널과 리텐션 그래프


전환 퍼널(Conversion Funnel) 분석

사용자가 앱 설치 후 회원가입, 상품 조회, 구매 등 핵심 행동으로 이어지는 과정을 단계별로 분석하는 것입니다. 프로드 트래픽은 대부분 초기 단계(앱 실행)에만 머무르고 다음 단계로 넘어가지 않아 퍼널 그래프에서 급격한 이탈을 보입니다. 정상 사용자(노란색)와 비정상 사용자(빨간색)의 행동 패턴 차이를 퍼널 그래프로 명확하게 비교할 수 있습니다.

Screen_Shot_2025-10-08_at_6.45.04_AM.png?type=w966



리텐션(Retention) 분석

시간 경과에 따른 사용자 재방문율을 분석하는 것입니다. 프로드 트래픽은 설치 직후에만 반짝하고 재방문이 거의 없어 리텐션 그래프가 비정상적인 패턴을 보입니다.

정상적인 리텐션: 초기 이탈 후 점차 안정화되거나(평탄화 그래프), 심지어 시간이 지나 다시 돌아오는(스마일 그래프) 패턴을 보입니다.
Screen_Shot_2025-10-08_at_6.46.42_AM.png?type=w966


비정상적인 리텐션: 리텐션이 비정상적으로 급등했다가 0으로 수렴하거나, 주기적으로 파동 치는 등 기계적인 패턴을 보인다면 봇(Bot) 활동을 의심할 수 있습니다.
Screen_Shot_2025-10-08_at_6.48.24_AM.png?type=w966





결론: 현명한 데이터 분석으로 광고비를 지키세요

프로드는 계속해서 더 정교한 방식으로 진화하고 있으며, 완벽하게 막는 것은 현실적으로 어렵습니다. 하지만 오늘 소개한 CTIT 분석, 버전 분석, 행동 분석이라는 3가지 렌즈로 우리의 데이터를 꾸준히 들여다본다면, 비정상적인 트래픽을 상당수 걸러내고 광고 캠페인의 효율을 극대화할 수 있습니다.


단순히 클릭 수, 설치 수 같은 표면적인 지표에만 매몰되지 말고, 그 이면에 숨겨진 사용자의 실제 행동과 데이터의 질을 파고드는 습관을 통해 소중한 광고 예산을 지키고 진정한 비즈니스 성장을 이끌어 내시길 바랍니다.



https://wikibook.co.kr/marketing-ai/


이 책은 디지털 마케팅의 역사와 흐름을 짚는 것으로 시작해, 마케터라면 반드시 알아야 할 서드파티 툴, 측정 아이디, 캠페인 유형, KPI 해석법, 데이터 분석과 이슈 대응 방법까지 폭넓게 다룹니다. 딥링킹, SKAdNetwork, 프라이버시 정책, S2S, SDK, API, 프롬프트 엔지니어링 등 최신 기술과 용어도 실무 시나리오와 함께 정리해 현장에서 바로 활용할 수 있도록 구성했습니다.



keyword
작가의 이전글PDF 손익계산서도 AI로 5분 만에 분석 끝내기