분석을 좋아하는 글쟁이의 순수한 덕질!
브런치를 시작한지 꽤 오래 되었고 나름 브런치를 잘 운영하고 있다는 생각도 들지만 그것이 사실인지는 확인하기 어려운 측면이 있다. 그리고 역시나 무엇인가가 잘 운영되고 있는지를 파악하면 데이터 분석을 통한 검증이 필요하기 때문에 이를 위한 몇 가지 소소한 작업들을 통해 내 브런치는 어떻게 흘러가고 있고 어떤 요인들이 내 브런치의 트래픽에 가장 큰 영향을 미치고 있는지 분석을 해 보았다.
이건 물론 요즘 유행하는 R을 이용한 분석이나 Cohort와 같은 분석 기법이 들어간 것은 아니고 데이터 토쳐링이라고 부르는 기법과 같이 데이터를 이리 저리 굴려보면서 인사이트를 얻어내보려고 하였다.
그럼 한 번 그 과정과 결과를 살펴보자.
일단 시작은 일별 조회수에 대한 Raw 데이터를 만드는 것이다. 브런치는 당연히 일반 글쓰기 플랫폼이지 데이터 분석 플랫폼은 아니기 때문에 내 브런치를 통해 들어온 여러가지 트래픽에 대해 정리가 되어 있는 대시보드 형태의 분석을 보여주지 RAW데이터 형태를 제공하지는 않는다. 그래서 일단 일별 트래픽의 RAW 데이터를 만들어 보았다.
당연히도 브런치가 운영되는 시간이 길어질수록 점점 트래픽이 높아지는 것을 알 수가 있다. Linear하다고는 전혀 볼 수 없지만 꽤나 지속적인 흐름으로 트래픽이 늘어가고 있다.
트래픽이 점점 늘어난다는 사실과는 다르게 이런 트래픽의 분포가 얼마나 균형적으로 이루어지고 있는지를 보기 위하여 전체 일별 트래픽 데이터를 내림차순 정렬을 하고 이를 그래프화 하였다. 그 결과 아래 이미지와 같이 아주 기형적인 트래픽 쏠림 현상을 확인할 수 있었다. 전체 일별 트래픽의 표준편차를 보니 5,200이 넘었다. 일별 최대 트래픽이 6만 수준임을 고려하면 매우 큰 표준편차라고 할 수 있다.
거기에 더하여 파레토의 법칙이 얼마나 부합하는지 보기 위하여 각 구간별 트래픽 점유율을 보았다. 그 결과 상위 조회수 TOP4 (상위 1%)의 경우 총 콘텐츠 조회수가 195,819회로 전체 조회수의 24%에 달했다. 이후 TOP22 (상위 5%)에서는 371,330회로 45%, TOP44 (상위 10%)에서는 479,963회로 59%, TOP88 (상위 20%)에서는 605,529로 74%의 비중을 보였다.
결론적으로 소수의 콘텐츠에 집중되어 있는 트래픽의 결과로 최상위로 근접할 수록 8:2의 법칙을 넘어서는 결과가 나타났다. 참고로 대한민국 소득 상위 10%가 전체 부의 45%를 가지고 있다는 참고 데이터가 있으니 내 브런치의 트래픽 불균형은 대한민국의 소득 불균형보다 훨씬 심한 셈이다. 상위 20%로 넘어 오는 과정에서 트래픽의 비중에 80%에 미치지 못하는 이유는 아마도 10~20% 사이구간 조차도 이미 데이터 편중의 관점에서는 롱테일로 진입했기 때문으로 보인다.
요일별보기
데이터를 뜯어 보기 전에 나는 요일별로 트래픽의 차이는 큰 의미가 없을 것이라는 가설을 가지고 있었다. 왜냐하면 나는 요일에 구애받지 않고 매우 불규칙적으로 콘텐츠를 업로드 하는 편이기 때문에 요일에 따른 콘텐츠 업로드의 편차가 크지 않을 것으로 예상하였고, 거기에 더하여 실제로 새로운 글을 등록한다고 하여도 브런치 콘텐츠는 일명 '신장개업'의 효과가 별로 없다. 즉 새로 써진 따끈따끈한 글이라고 사람들에게 많이 읽히지는 않는다는 것이다.
그럼에도 의외로 요일별 트래픽 비중은 확연히 차이가 있었다. 한 주를 시작하고 난 월요일과 화요일에는 매우 높은 트래픽을 보이다가 금요일이 되면 트래픽이 곤두박질치는 모습을 볼 수 있다.
이런 숫자를 좀 더 객관적으로 보기 위하여 전체 브런치 운영 기간 중 가장 많은 트래픽 (일 6만 이상)이 발생하였던 2일의 수치를 빼고 나니 아래와 같이 수치가 좀 더 평준화되었다. (일 6만 이상의 트래픽 이틀의 경우 전체 누적 트래픽의 약 15%를 차지한다.)
물론 그럼에도 월수목은 금토에 비하여 높은 수준의 그리고 유의한 수준의 차이를 보이고 있다. 우회적으로 해석하자면 내 브런치를 보는 사람들은 주중에 글을 읽고 불금부터는 글을 덜 읽는 다고 해석할 수 있다.
날짜별
한편 같은 월 안에서도 월초나 월말에 따른 편차가 있을까 싶어서 이에 대한 데이터를 그래프화 시켜 보았다. 신기하게도 날짜 그래프에서 2개의 기둥이 생겼다. 이 역시 위와 같은 이유로 전체 브런치 운영 기간 중 가장 많은 트래픽이 발생하였던 두 개의 날짜 수치를 빼 보았다.
그런데 신기하게도 그 수치를 빼더라도 거의 유사한 곡선이 나타났다. 결과적으로 내가 좋은 콘텐츠를 올려서 사람들에게 인정을 받는 일은 약 보름의 차이를 두고 주기적으로 발생한다고 볼 수도 있는 것이다. 거기에 더하여 그런 수치를 제외하면 전체 트래픽은 월말로 갈수록 완만한 하락세를 보인다. 어쩌면 월말로 가면서 다른 여러가지 일로 콘텐츠 업로드가 더디거나 하는 것이 이유가 아닐까 싶다.
이번에는 트래픽의 유입경로, 즉 레퍼러별로 데이터를 보았다. 일단 전체 트래픽은 검색 9만회, SNS 47만 5천회, 브런치 17만 3천회, 기타 4만 4천회로 이루어져 있다. 참고로 페이스북이나 카카오톡 등을 통한 유입은 SNS이며, 기타에는 포털의 메인 등에 노출된 경우를 포함한다.
일단 Raw데이터를 보면서 찾아낸 하나의 패턴은 검색의 비중이 점점 유의미해진다는 것이다. 예를 들어 비교해보자면 전체 트래픽에 있어서는 브런치가 약 2배가량 검색보다 많지만 최근 10주간으로 그 범위를 좀히면 검색 4.1만회, 브런치 2.2만회로 검색이 압도적인 수치를 기록하고 있다.
검색
검색은 꾸준한 상승을 보이고 있다. 아쉬운 것은 대부분의 검색은 다음을 통해서 이루어진다는 것이다. 그리고 그 비중은 절대적이다. 일전에 '목표를 가지고 브런치 글써보기'라는 글을 쓰면서 네이버를 통해서도 일 100회 이상의 트래픽을 달성하고 싶다고 이야기 한바가 있지만 아직 달성은 요원하다. 네이버는 최대 60여회, 구글는 최대 70여회를 기록 중이다.
https://brunch.co.kr/@jaeseungmun/79
SNS
SNS는 거의 카카오톡채널에 대한 의존성이 높다. 그래서 트래픽이 튀어 오르는 구간은 거의 카카오톡채널 메인에 글이 올라간 구간이라고 생각하면 된다. 다만 그 튐이 점점 주기적이고 높이 튀어오른다는 특징이 있다.
브런치
브런치의 트래픽은 40주차를 지나면서 최고점에 이르렀으나 그 이후로 트래픽이 줄어든 편이다. 그런데 사실 브런치 메인에 글이 올라가고 했던 구간은 20주차가 아니었을까 싶다. 결국 브런치의 트래픽이 40주차에 튀게 된 것은 전체 브런치 유저의 숫자가 많이 늘었던 점, 브런치가 추천하는 작가 리스트에 내가 들어가 있었던 점 등이 어우러져서 이루어진 부분이 아닐까 싶다.
다행히 고무적인 점은 1주에서 20주차 초반까지 가장 높은 피치를 올렸던 트래픽 수준이 이제 브런치 메인에 딱히 글이 올라가지 않는 50주차 이후의 가장 낮은 트래픽 수준과 비슷하다는 점이다.
기타
전혀 종잡을 수 없는 트래픽을 보이는 것이 기타의 영역이다. 초반에는 다음 PC메인에 브런치의 글을 소개해주는 코너가 있어서 몇 차례 큰 트래픽을 보였으며 이후는 꾸준히 답보 상태다. 다만 위키백과사전과 같은 일부 사이트에서 내 글이 참조가 되는 경우가 있어서 조금 늘어나는 추세를 보이고 있는 듯 하다.
한편 이런 데이터 분석 작업을 하던 중 실제 브런치가 제공하는 일별 트래픽의 총합과 전체 트래픽이 일치하지 않는 현상을 볼 수 있었다.
그 수치의 차이를 추적하다 보니 16년도 7월에 일별 수집한 RAW 데이터 상으로 113,023회로 나온 노출수가 브런치 월별 통계상 113,877로 되어 있는 점을 확인하였다.
이를 더 자세히 확인해 보고자 브런치 주간 트래픽을 보았더니 7월2주차의 데이터가 구멍나 있는 것을 확인할 수 있었다. 이 부분에서 데이터가 월간으로는 수집되었으나 주별 및 일별에서는 누락이 발생한 듯 하다. 뭔가 버그가 아닐까 싶다.
한편 비어있는 수는 854회로 7월의 트래픽을 고려하면 적지 않은 수치라고 할 수 있다. (7월의 일평균 트래픽은 3,646회) 브런치 담당자들은 이 일을 알고 있었는지 모르겠다.
이제 독자의 관점이 아닌 저자의 관점으로 돌아와보자. 나는 얼마나 그 동안 가열차게 글을 쓰고 있었을까? 숫자를 꼼꼼히 따져본 결과 나는 월평균 9.7개의 글을 쓰고 있었다. 그 결과 내년 4월 중순에는 200개의 글을 돌파할 것으로 예상된다.
한편 일 평균 0.6이 넘는 생산력을 보이는 경우가 띄엄띄엄 발생하였는데 약 4달 이상의 간격을 보이며 생겨났다. 아마도 글을 쓰는 것도 에너지의 소비이기 때문에 스테미너를 지속적으로 유지하기가 어렵지 않았을까 싶다. 또한 이런 추세라면 이번달이나 다음달 정도에 콘텐츠가 폭발해야 한다는 달갑지 않은 결론도 얻을 수 있었다.
앞서 언급했듯이 나는 지난 4월 경 '목표를 가지고 브런치 글써보기'라는 글을 썼다. 그때 목표했던 것들을 올해가 가기 전에 이룬 것들이 일부 있다. 예를 들어 기타 커뮤니티 사이트 등에서 트래픽 유입과 댓글 증가인데 작지만 이루었다고 할 수 있다. 또한 공유가 100이 넘는 글을 쓰고 싶다는 생각을 했는데, 공유가 1,000이 넘는 글이 생겨나 버렸다.
한 편 그 이후에는 오랫동안 가장 많이 소비된 콘텐츠의 자리를 지키고 있었던 키즈워치에 대한 글의 트래픽을 넘어서는 글을 빨리 만들고 싶었는데 11월에 그 목적을 달성하였다.
이제 전체 누적 100만 트래픽과 200개의 글, 하루에 10만 트래픽 달성을 향해 한 번 달려 보겠다.