brunch

You can make anything
by writing

C.S.Lewis

by SEB Aug 04. 2017

인스타그램 #해시태그는 많이쓸수록 좋을까?

팩트와 카더라에 대해 파헤쳐보자 - 인스타그램 마케팅 시리즈 2

사실 하나.

"해시태그 검색 결과"의  Top Post (인기게시물) 와 Most Recent (최근사진) 컨텐츠는 모든 사용자에게 동일하게 보인다. 내 친구 폰으로 보는 게시물 리스트와 내 폰으로 보는 리스트가 동일하다는 뜻이다.

위의 사실만 놓고보면 당연하게도 해시태그를 많이 쓸수록 포스트 노출이 더 많이 되고 라이크를 더 많이 받을 수 있을것 같다. 해시태그를 한개만 쓰면 한개의 해시태그 검색 결과에만 노출이 되지만 10개를 쓰면 10개의 검색 결과에 노출이 되기 때문이다.


아마도 2014년까지는 위의 내용이 사실이었던것 같다.

2014년 9월 - Max Woolf 분석자료 (1) (모수: 120,346개 포스트)


해시태그 사용 개수와 평균 좋아요 수가 거의 비례하여 증가한다.


하지만 이렇다보니 유저들이 좋아요을 더 많이 받으려고 해시태그 스패밍을 하기 시작한다. 올리는 모든 포스트에 컨텐츠와 관련이 있든 없든 그냥 최대한 많은 수의 해시태그를 써서 올리는것이다.



이에대한 인스타그램의 대책은 다분히 1차원적이었는데, 최대로 사용가능한 해시태그 개수를 30개로 제한 (중복된 태그의 경우 1개로 카운팅) 시키고, 너무 많은 해시태그를 쓴다든지 똑같은 해시태그를 모든 포스트에 붙여넣는 경우에는 오류가 뜨면서 글이나 코멘트가 포스팅 되지 않는다.


하지만

제일 최근에 나온 다른 리서치를 보면..

2016년 5월 - Trackmaven 분석 자료 (3) (모수: 41,071개 포스트)


그래프가 달라졌다!

위의 자료를 보면 해시태그 4-5개까지는 완만한 증가를 보이지만 그 이후로는 거의 비슷하거나 약간의 감소를 보인다. 그렇다면 이제는 인스타그램이 해시태그 게시물 노출의 알고리즘을 바꿔서 해시태그 사용 개수에 따른 weighting을 달리 한다는 뜻일까?


TrackMaven의 분석자료에서 내린 결론은

해시태그 4-5개를 쓰는게 가장 반응이 좋으며, 그 이상의 해시태그를 사용하면 평균 인터렉션은 오히려 줄어든다


인데.. 뭔가 이상하다. 왜 하필 4-5개일까?

2014년 Max Woolf 의 분석자료와는 확연한 차이가 존재하는데, 과연 어떤 데이터가 맞는걸까?

둘다 맞는 데이터라고 하면 인스타그램에서 해시태그에 사용에 따른 포스트 노출 알고리즘을 바꿨다고 설명하는게 가장 그럴듯하다.


가설 (그냥 내 짐작):

해시태그 개수가 많아질수록 한개의 해시태그에 대한 중요도 (weight)가 낮아져서 해시태그 몇개를 쓰든 글의 노출 빈도는 동일하다.
해시태그 1개를 썼을때 한개 해시태그의 weight이 1이라면, 30개를 썼을때는 한개당 1/30로 낮아져서 검색결과에서 덜 노출되도록 조정되어 해시태그 사용 개수와 상관없이 총 노출량은 항상 1로 동일해진다.
검색엔진들도 이러한 매칭 방식을 사용하는데, 검색어와 똑같이 3개의 단어가 매칭된 웹페이지라도 총 단어개수 100개중에 3개가 매칭되는것이 1000개중에 3개가 매칭되는것보다 연관도를 더 높게 평가한다.

여기서 "노출 빈도"란 해시태그 서핑시 보이는 Top post와 Most Recent에 내 게시물이 올라가는 확률이다. 내가 방금 올린 게시물이 Most Recent에 가끔 안보이는 경우가 있는데, 인스타그램이 단순 시간순 정렬이 아닌 해시태그 매칭률 (+ 포스트 반응률)에 따른 weighting을 하고 있다는 증거이다.

위의 가설이 맞다고 하면 그래프는 해시태그를 아예 사용하지 않은 0에서는 현저히 낮게 나오고, 나머지구간에서는 일정하게 유지되어야 하는데, 위의 그래프는 딱히 그렇다고 볼수는 없다. 해시태그 사용 0개에서 가장 낮게 나오긴 했지만, 왜 4-5개정도에서는 증가하다가 다시 줄어드는걸까?


위의 두 분석자료들은 가장 중요한 한가지 통제변인을 간과하고 있다.


내 글에 달리는 좋아요 개수는 팔로워가 몇명이냐에 따라 제일 크게 좌우됨에도 불구하고 해시태그 사용 행태별 팔로워 수를 고려하지 않았기때문이다. 예를들어 해시태그를 안쓰는 유저들의 경우에는 대부분이 포스트를 소수의 지인들이랑 공유하는 경우가 많은데, 해시태그를 사용 하지않는 유저들의 평균 팔로워수와 해시태그를 10개 이상씩 쓰는 유저들의 평균 팔로워수가 다르다면 평균 좋아요 수도 당연히 차이가 날 것이기 때문이다.


팔로워수와 평균 좋아요 수가 비례한다고 가정했을때, 해시태그 사용 개수와 좋아요를 받는 개수의 상관관계를 더 정확하게 설명하려면 해시태그 사용 개수 vs "팔로워 대비 좋아요 수" 의 그래프를 보아야 한다.



그래서 한번 직접 해보기로 했다.


인스타슈가에는 현재까지 약 1,200만개의 포스트 분석 데이터가 쌓여있는데 (물론 공개 포스트들을 분석한 데이터이다. 우리 고객이 1200만명이면 더 좋겠지만..), 포스트별로 해시태그 개수와 좋아요 수등 계정 활성도를 분석하기 위한 데이터들이다. 그런데 가장 중요한 분석 시점에서의 계정 팔로워수가 기록이 안되어있었다 ㅠ 뭐 이제 하면 되지! 서버 15대에서 일주일 정도 데이터를 추출하니 의미있는 모수를 만들 수 있었다.

 

(1주일뒤..)


오랜만에 복잡한 SQL 쿼리도 써보고, 구글 sheet 피벗 테이블까지 공부해가면서 완성한 그래프를 공개한다.

(모수는 약 2천개의 계정에서 추출한 2만여개의 포스트이다.)


일단 내가 수집한 데이터를 토대로 위의 두개 그래프와 동일한 기준으로 축을 설정해서 뽑아보면 두번째 Track Maven 분석자료와 거의 비슷한 양상으로, 미미하지만 해시태그를 많이 쓸 수록 더 많은 라이크를 받는것 처럼 보인다.

트렌드라인을 보면 해시태그 개수 대비 라이크수가 완만한 상승세를 보인다.

하지만, 앞에서도 설명했듯이 평균 좋아요 개수가 팔로워가 몇명이냐에 따라 좌우되버리는, 즉 "해시태그 사용 행태별 평균 팔로워수"의 변인을 통제한 그래프여야 정확한 분석이 가능하다. 따라서 본인은 축을 "평균 라이크수"가 아닌 "팔로워 대비 평균 라이크수"로 잡아서 해시태그 개수별로 해당 데이터가 유의미하게 변동하는가를 살펴보았고,


1주일동안 열심히 데이터를 수집한 이유가 바로 이 그래프를 그리기 위해서들였는데...


결론부터 말하자면

해시태그 사용 개수와 포스트 좋아요 수는 무관하다

트렌드라인이 오히려 살짝 하향선을 그리고 있다.


해시태그 1개를 사용하든 30개를 사용하든 거의 동일하게 5%정도의 팔로워들이 라이크를 누른다.


한가지 이상한점은 해시태그를 아예 안쓴 경우에 평균보다 약 60% 이상 많은 라이크를 받았는데, 해시태그를 아예 안쓴 경우의 모수도 충분히 컸기 때문에 데이터 오류로는 보이지 않는다. 여기에 대한 가설로는..

사람들이 해시태그를 싫어해서 해시태그가 없는 글에 더 좋은 반응을 보인다.

해시태그를 안쓰는 경우에는 내 글을 공개적으로 홍보할 의사가 없는 유저들이기에 더 큰 비율의 팔로워들이 지인등 내 글에 적극적으로 반응하는 활성 팔로워들이다.

인스타그램의 포스트 노출 알고리즘이 태그 검색시 노출되는 양만큼 팔로워들한테 보여지는 노출 양을 줄여 총량을 일정하게 유지하는 방식이라고 한다면, 해시태그가 없는 경우에는 내 팔로워들한테 노출되는 비율이 100%가 되고 결과적으로 더 많은 반응을 유도할 수 있다.

등등이 있겠지만.. 실험적으로 증명할 수 있는 방법은 없을것 같고, 그냥 내 생각에는 마지막 가설이 가장 그럴듯해보인다.


마지막으로, 너무 당연해서 굳이 안해봐도 될것 같기에 넘어간 가정 하나를 굳이 한번 더 확인해보자면..

역시나, 팔로워수와 게시글 평균 좋아요 수는 비례한다

팔로워가 늘어날수록 게시글당 평균적으로 더 많은 좋아요를 받는다.


게시물당 평균적으로 받는 좋아요 개수는 내 팔로워 수의 5% 정도로 일정하다 (위의 "팔로워당 라이크 수 vs 해시태그 사용 개수" 그래프에서 보여준 수치와도 일치한다). 팔로워가 1000명이면 게시물당 평균 50개정도의 라이크가 달리지만, 1만명이면 평균적으로 500개의 좋아요가 달린다는 뜻이다 (포스팅의 퀄리티에 따라 변수가 크기때문에 "평균"이라는 단어를 사용했지만 정확히는 팔로워 250명 단위의 bucket으로 나눈 뒤 중간값 (median)을 계산했다).



결론

1. 사진 올릴때 해시태그 뭐 쓸지 열심히 고민하지 말자, 부질없다.

2. 간지나게 아예 해시태그를 안쓰는게 반응이 더 좋을 수 있다.

3. 좋아요를 많이 받고 싶으면 닥치고 팔로워를 늘리자.



References

1) http://minimaxir.com/2014/03/hashtag-tag/

2) https://trackmaven.com/blog/everything-marketers-need-know-instagram-sponsored-content/

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari