brunch

You can make anything
by writing

C.S.Lewis

by 김학용 Apr 10. 2017

여론 조사 or 여론 조작

통계적 오류를 활용한 의도적인 여론 왜곡이 진행중인 것 같네요. 

여론조사 결과에서 안철수 후보의 약진이 두드러지자 이에 대해 통계적으로 문제가 많다는 지적이 있습니다. 대부분이 낮은 응답률 및 적은 모수의 규모, 유무선 샘플 비중의 비합리성, 비적격 샘플수 등을 언급합니다. 이런 요인들도 통계적 오류를 이끄는데 큰 영향을 주지만, 더 큰 요인은 응답자들의 대표성입니다. 


현재 여론조사 결과는 거의 모두가 전체 응답률만 제공하는데요, 이를 통해서는 응답자들의 연령 분포를 전혀 알 수 없다는 것입니다. 즉, 전체 응답자에서 일부 연령대가 차지하는 비중이 커질 수 있다는 것입니다. 당연히 이는 조사 결과를 왜곡시키는 결과를 나을 것이구요..

 

따라서, 보다 정확한 여론 조사를 하기 위해서는 연령대별 유권자수와 이들의 예상 투표율, 그리고 여론조사에서 연령대별 지지비율을 모두 반영해야 할 것입니다. 

 

리얼미터가 10일 발표한 연령대별 지지율과 이번 유권자의 연령대별 비중, 그리고 20대 총선의 연령대별 투표율을 반영한 후 정규화시켜보면 문재인은 44.24%, 안철수는 35.98%, 기타는 19.78%가 나옵니다. 이는 리얼미터가 발표한 문재인 42.6%, 안철수 37.2%, 기타 20.2%보다도 문-안의 실제 격차는 2.6%p 정도 더 크다는 것을 알려줍니다. 아마 다른 조사기관의 자료를 이런식으로 분석하면, 변화폭이 훨씬 더 크리라 봅니다.


연령대별 유권자수 및 투표율을 반영하면 비교적 객관적인 리얼미터 결과조차도 2.6%p의 추가 격차가 발생합니다. 50-60대 비중이 큰 여론조사에서는 그 차이가 더 클 것입니다.


작가의 이전글 4차 산업혁명, 용어가 중요한 것이 아니다!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari