brunch

You can make anything
by writing

C.S.Lewis

by Young Jun 23. 2019

인스타 좋아요 많이 받는 법

회귀분석의 활용


Introduction


  인스타에서 좋아요를 많이 받으려면 성격이 활달해서 친구가 많으면 된다. 외모가 출중하거나 좋은 카메라가 있으면 당연히 유리하다. 요즘엔 확실한 취미가 있어서 깊이 파고드는 사람 (a.k.a. 덕후)들이 웹상에서 인기가 많은 것 같다. 난 이 중 아무데도 포함이 안 돼서 이런 글 쓰기가 살짝 민망하다.


  그런데 보통 사회과학자들이 궁금해 하는 것은 “다른 모든 조건이 동일할 때 (ceteris paribus)” 한 요소가 현상에 어떤 영향을 미치는가 이다. 팔로워 수가 같고, 외모 수준이 비슷하고, 사진 퀄리티에 차이가 없을 때 어떤 포스팅이 좋아요를 많이 받을까? 비슷한 사람들을 여러명 모아서 분석해보면 더 정확하겠지만 그 정도까지 하긴 귀찮고 그냥 내 계정만 한정해서 보려한다.


 아내는 자꾸 쓸데없는거 하지 말라고 하는데 나도 핑계는 있다. 방학이다. 그리고 이거 다음 학기에 수업자료로 쓸거다 (아마도).



Hypothesis


  연구의 첫번째 단계는 관찰을 통해 검증 가능한 가설을 세우는 것.


  분석을 위해 내가 작년 8월부터 올린 포스팅 59개를 대상으로 올린 날짜, 시간, 좋아요 수, 사진 갯수, 등장인물, 해쉬태그 수 등등의 데이터를 수집했다. 시간 좀 걸렸다. 아내 눈초리가 따가웠다.


  내가 받는 좋아요 수는 평균 45개 정도인데 시간대, 포스팅 빈도, 사진의 등장 인물 등에 따라 달라진다. 특정 태그 (ex. babystagram)를 달면 좋아요가 많이 달리기도 한다.


  어떤 변수들이 좋아요 수에 영향을 미치는지 대략 관찰한 사실을 나열하자면,


1. 한국시간 기준 오전 (6am-정오)에 올린 글이 좋아요가 제일 많고 오후 (noon-정오)에 올린 글이 제일 적음 (fig.1 참조). 사람들이 오전엔 인스타하면서 놀고 오후엔 일하나?


아침에 올린 포스팅에 좋아요 수가 48개로 가장 많고 오후에 올린 포스팅엔 38개로 가장 적음


2. 포스팅을 연달아 할수록 좋아요 수가 떨어짐 (fig.2 참조). 사람들의 친절엔 로딩타임이 필요.


지난 3일간 올린 포스팅의 수에 따라 좋아요 수가 달라짐. 매일 연달아 올릴 경우 좋아요 수가 떨어지는 것이 보임.


3. 애기 사진엔 좋아요가 적게 달리는 편 (애기 유 43.8, 무 47.4). 반면에 아내나 내가 있으면 좋아요 수가 급 늘어남 (아내 유 54.8, 무 41.0, 나 유 53.5, 무 42.6). 거기다 아내가 나오는 사진엔 댓글도 더 많음.

       

4. 특정 해쉬태그에 따라 좋아요 수가 많아지기도 하는데, 최근에 #babystagram 을 붙였더니 좋아요 수가 늘었음 (애기 나온 사진 기준 babystagram 유 50.7 무 42.0). 모르는 사람들이 해쉬태그를 따라 들어와서 게시물에 좋아요를 남기는 듯.



Test


  다음 단계는 실험을 통한 가설 검증이다. 관찰만 가지고 결론에 도달하면 안되는데, 이는 내가 관심있는 변수가 “다른 조건이 동일할 때”도 좋아요 수에 영향을 미치는지 확인할 수 없기 때문이다. 예를 들어 오후에 좋아요가 적은게 시간 문제가 아니라 내가 그 때 잠이 덜 깨서 (남아공은 아침) 이상한 사진을 올렸기 때문일 수 있다. 또 아내가 인기가 많은게 아니라 어떤 특별한 일 (생일, 여행, 남아공 출국 etc.)에 대한 포스팅이 반응이 좋았는데 하필 거기에 아내가 있었을 수도 있다. 사람들이 도준이를 싫어하는게 아니라 내가 애기 사진을 너무 자주 올리는게 문제일 수도 있다 (ㅋㅋㅋ).


  그래서 이럴땐 한가지 외에 다른 모든 조건을 동일하게 맞춘 대조군 (control group)을 두고 내가 관심있는 실험군 (treatment group)과 비교해 봐야한다. 그런데 자연과학과 달리 사회과학에선 완전히 동일한 대조군을 만드는 것이 불가능하기 때문에 나 같이 양적연구를 하는 사람들은 주로 회귀분석 (regression analysis)을 사용해서 가설을 검증하기도 한다.


  기본적인 아이디어는 다른 변수들(ex. 사진에 대한 주관적 평가, 특별한 일 등)을 다 고려했을 때에도 내가 관심있는 변수 (ex. 시간, 빈도, 등장인물, 해쉬태그)가 결과에 유의미한 영향을 미치는지 보는 것이다. 복잡한 건 나한테도 어려우니 가장 간단한 OLS regression을 통해 분석해 보면 결과가 다음과 같이 나온다.



회귀분석 결과 표. 어려워 보이지만 별거 아님. 괄호 안 무시하고 변수 옆의 숫자가 (+)면 긍정적인 영향, (-) 면 부정적 영향. 옆에 *이 많이 붙을수록 중요한 것


우선 제일 중요한 첫번째 결과 (1)부터.


1. 예상과 다르게 시간대는 별 영향을 안 미친다. *이 하나도 없음.


2. 애기 사진을 올리면 다른 사진에 비해 좋아요가 평균 4.78개 적게 나오는데, *이 없다. 통계적으로 큰 의미 없다는 뜻.


3. 반면 아내가 나오면 평균 11.8개 더 좋아요를 받는다. 심지어 별 세개.


4. 내 영향은 미미하다. ㅋㅋ


5. 풍경 사진에 좋아요가 많이 달리는 편 (Landscape 11.62***).


6. #babystagram 은 꽤 효과적이다. 달면 좋아요 9개 더 받는다. 꼭 특정 문구가 아니어도 해쉬태그를 많이 달면 조금이나마 좋아요를 많이 받게 된다 (# tags 0.83).


7. 지난 3일간 올린 포스팅의 숫자가 좋아요 갯수에 영향을 준다. 예를 들어 3일 연속 올리면 마지막 사진은 첫 사진에 비해 평균 15개 정도 좋아요를 덜 받는다.


8. 다른 걸 다 통제하고 난 후에는 사진에 대한 내 주관적 평가 (subjective evaluation 2.27)나 특별한 일 (special event -3.82)이 좋아요 수에 큰 영향을 안 미친다.



  여기에 두가지 실험을 더 해봤다.


  내가 다른 사람 글에 눌러준 좋아요 갯수가 내 게시물에 영향을 미치지 않을까? 그래서 두번째 regression에 “전날 내가 누른 좋아요 수”를 넣고 다시 돌려봤더니 답은 “아니다”로 나온다 ((2)의 마지막줄 0.11). 내 팔로워들은 내가 베푼 호의와 상관없이 소신껏 좋아요를 누른다.


  마지막으로 이상치(outlier)를 제외해 보았다. 어느날 갑자기 별거 아닌 포스팅에 좋아요가 90개 달렸었는데 (거기에 babystagram이 있었음), 요놈 때문에 결과가 바뀌면 안되니까 한번 빼고 다시 확인해 봤다. 결과 (3)을 보면, babystagram이 안 중요해지고 subjective evaluation이 소폭 중요해졌다. 다시 말해서 babystagram 때문에 좋아요 수가 올라가는 것은 예외적인 상황이고 보통때는 내가 좋아서 올린 사진이 좋아요를 많이 받는다는 뜻이다. 근데 outlier를 제거해도 아내 영향력은 여전히 중요한 것으로 나온다.



Conclusion


 중요한 결론 및 적용 세가지.


1. 애기 사진은 좋아요를 적게 받는 편인데, 애기 자체가 문제라기 보다 너무 자주 올려서 그렇다. 자중해야겠다.


2. 나는 아내 덕을 많이 본다. 페북에서도 아내 얘기가 인기가 많은데 인스타도 그렇다. 아내에게 잘 해야겠다.


3. 해쉬태그를 통해 좋아요 수를 늘려보려는 노력은 아주 낮은 확률로 성공한다. 물론 #like4likeback, #professionalliker 같은건 아직 안해봐서 내가 틀렸을 수도 있다.




주의. 내 계정에 한정해서 분석한거라 다른 사람은 결과가 다르게 나올 수도 있음.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari