brunch

You can make anything
by writing

C.S.Lewis

by Jaeseung Mun Jun 29. 2017

브런치에서 얼마나 최신의 글과 다양한 글이 소비되는가?

브런치의 글 소비에 있어서 폭넓음을 살펴보자.

궁금증의 시작은 제목과 같다.



'브런치에서는 얼마나 최신의 글과 다양한 글이 소비되는가?'






물론 이 질문에 대한 예상 가설은 있다.

1. 브런치는 거의 최근에 발행된 글을 중심으로 소비가 이루어진다.

2. 거의 최근에 발행된 글이면서도 몇 개의 글에 편중된 소비자 이루어진다.




어쩌면 별것도 아닌 이 질문에 대답을 하기 위해서 난 다시 내 브런치의 Raw 데이터를 정리하기 시작했다. 작업의 순서는 무척 간단하다. (하지만 시간은 무척 오래 걸렸다.)



a. 내가 올렸던 228개의 글에 대한 등록일을 정리한다.

b. 가장 최근일은 6월 20일을 기준으로 10일마다의 TOP10의 인기글 리스트를 정리한다. (한달에 3일의 데이터를 표본수집하는 것이며 2월의 경우 28일까지 없기 때문에 2월의 경우 10일, 20일, 28일을 기준으로 한다.)   *전체 모수의 10% 표본이며 샘플표본수가 17이므로 통계적으로는 큰 문제가 없지 않을까 싶다.

c. 각 샘플일의 날짜와 해당 날짜에 소비된 TOP10 인기글의 등록일 차이를 빼서 TOP10콘텐츠의 '콘텐츠 최근성'을 수치화 한다. (특정 날짜 기준으로 얼마나 최근의 글들이 인기 있게 소비되었는지..)

d. 해당 데이터를 샘플일별, TOP순위별, 글 등록 기간 별 등등으로 분석한다.





Raw 데이터를 정리하는 시간은 정말 노잼이었다.


그럼 데이터 분석의 결과를 살펴보자.






결론1. 브런치에서는 최근 등록된 글이 압도적으로 많이 소비된다.



먼저 위의 결론에 이르기 전에 전체 글들은 최근 100일이내 등록된 글, 200일, 300일, 400일 그리고 등록된지 400일 이상된 글로 분류를 하였다. 2017년 6월 20일을 기준으로 본다면 처음 내가 브런치에 쓴 글이 2015년 9월 17일에 등록되었기 때문에 401일 ~ 642일이라는 약 240일이 넘는 압도적인 롱테일 구간을 가지고 있다. 하지만 아래 차트와 같이 실제로 17일의 샘플링 일자에 소비된 TOP10의 170의 글 가운데 절반 이상은 최근 100일 이내에 등록된 글이었다. 100일도 전에 써진 글이 TOP10으로 소비된 건은 101~300사이 구간에서는 각 100단위 마다 약 30개 남짓이었고 300일 이전 구간으로 넘어가면 13개 수준으로 떨어진다. 실제로 400일 이전에 등록된 글이 글을 쓰고 난 뒤 400일 후에 TOP10의 콘텐츠로 소비될 확률은 매우 낮다. 그 실제 수는 22건으로 카운트되고 있는데 이 구간이 실제로 240일이 넘는다는 것을 고려하면 100일 환산 기준으로는 10건 미만으로 떨어지는 모습이다.  확연한 계단 형태의 하강 곡선이다.





거기에 더하여 0일 이내에 발행된 글이 소비된 숫자는 전체 17주차의 170개의 상위 소비 콘텐츠 가운데 총 66개에 해당하여 100일 이내에 발행된 글의 숫자인 89개 가운데 약 74%에 육박한다. 역시나 25일 이내에 발행된 글의 숫자는 45개로 66개의 50일 이내의 발행 글 가운데 약 68%가 25일 이내에 발행된 글이었다. 10일 이내에 발행된 글 역시 27개나 되어 25일이내에 발행된 글 가운데 60%에 해당하였다. 최근 콘텐츠일수록 소비의 중심에 서 있고 사실상 오래전에 작성된 글인 롱테일은 그 비중이 매우 미약한 셈이다.



실제 170개의 TOP10글의 작성시점으로부터 소비시점까지의 간격을 수치화하고 이를 분산차트로 그려보면 그 차이는 더 확연하다. 위쪽이 듬성듬성하다는 것은 누가봐도 알 수 있고 어느정도 층이 만들어지는 듯한 모습도 보인다.








결론2. 최근으로 온다고 하더라도 소비되는 콘텐츠의 최신성은 크게 변하지는 않는다.



원래 애초의 가설은 최근으로 올수록 더욱 최신의 글을 집중적으로 소비하게 되어서 최신성을 대변하는 수치인 '소비일 - TOP10 콘텐츠 각각의 등록일'에 대한 평균값이 줄어들 것으로 예상하였으나 딱히 그런 모습은 아니었다. 랜덤으로 뽑힌 총 17일의 최신성 수치는 대략적으로 130정도에서 수렴하는듯 하게 보이는데 69.2Day라는 최저값과 259Day라는 최고값을 고려하더라도 최근으로 오더라도 최신성이 명확히 증가하는 모습은 아니다.








결론3. 최신성을 제외하더라도 일부글이 TOP10의 트래픽의 주를 이룬다. 



애초부터 그럴것이라고 생각하지만 역시 그랬다. 랜덤일 17일간 노출된 TOP10의 170개 글을 분석해 본 결과 그 가운데 겨우 넘는 20개의 글이 총 114번 TOP10에 올라갔다. 이는 67%에 달하는 수준이다. 전체 등록된 글이 228개라는 것을 고려한다면 겨우 10%도 안되는 글들이 TOP10의 67%를 점유한 셈이다.







결론4. 왜 이런 현상이 발생할까?



내 나름의 결론이지만 이런 식의 결과가 나온 이유는 다음과 같지 않을까 싶다.


A. 브런치의 트래픽은 롱테일이 거의 없기 때문이다.

B. 롱테일이 없는 이유는 브런치의 Big트래픽은 다음이나 기타 외부 매체를 통해서 벌어지며 롱테일의 경우는 키워드 검색을 통해서 이루어지는데 이를 통한 노출 비중이 지나치게 작기 때문이다.

C. 브런치의 글들은 '작가'의 시스템을 표방하지만 사람들이 따르는 것은 글이지 작가가 아니기 때문이다. 나라는 작가 1명을 기준으로 데이터가 분석되어서 이 부분은 언급하기 조심스럽지만 만약 내 브런치가 '작가'를 중심으로 움직였다면 일반 내 브런치를 구독하겠다고 누른 수 많은 구독자들이 전체글의 아주 극히 일부만 꾸준히 소비해주더라도 이런 결론이 나기 어렵다.

D. 사람들이 브런치에서 구독을 한다고 버튼을 누르는 행위가 매우 일시적으로 지속적 방문으로 이어지지 않는 행동이기 때문이다. 만약에 그렇지 않다면 4,000명이 넘는 구독자를 가지고 있는 내 브런치가 이렇게 롱테일 소비가 없다는 것이 이해하기 조금 힘들다.

E. 브런치는 트렌디한 매체이기 때문이다. 그렇다면 자연스레 브런치 메인에서 노출되는 글의 특징이나 브런치의 방향성이 자연스럽게 일치되면서 과거의 글들이 더욱 노출에서 배제될 확율이 있다.


물론 모든 것을 제외하더라도 가장 중요한 것은 작가가 사람들의 관심을 이끌어낼 수 있는 좋은 글을 쓰는 것이 우선이겠지만 작가 입장에서 글이 폭 넓게 소비되는 것은 언제나 중요한 일이다.






사실 이 모든 것은 추론일 뿐이다. 나는 그 추론을 검증하고 싶은 개인적인 욕구를 달성하였다. 하지만 그 검증방법이 객관화되었다거나 신뢰성이 높다는 것은 아니다.


하지만 이것이 단순한 추론이 아닌 다른 많은 브런치 작가들이 공감하는 부분이라면 브런치는 조금 더 브런치에 올라오는 다양한 글들이 더 폭넓게 읽혀질 수 있는 방법을 한 번 쯤 찾아볼 필요가 있지 않을까 싶다. 브런치의 담당자들이 아마도 이 부분을 더 잘알고 있겠지만 말이다.


결국 그 한마디를 쓰고 싶어서 이 노가다 작업을 한 셈이다.



브런치 콘텐츠 노출의 좀 더 폭 넓은 다양화가 필요하다.



그런 단계를 통하여 브런치라는 매체가 한 걸음 더 나아가길 바란다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari