brunch

매거진 개표 논란

You can make anything
by writing

C.S.Lewis

by 박성호 Apr 18. 2017

K값의 꼼수 - 프롤로그

수학을 못하니 이해를 못하겠다고 지레 포기하지들 마시고 찬찬히 읽어 보고 이해해 보도록 노력해 주시기 바랍니다. 세상 사는 게 그리 쉬운 건 아닙니다.


*********************************


더 플랜에서 얘기하는 K 값의 의미는 이러하다.

전체 투표 중에는 박표와 문표가 섞여 있다. 개표 분류기는 그 표들을 분류해서 거의 대부분은 후보별로 분류를 해 내고, 일부는 미분류표로 분류를 한다.

분류된 표 중에 박근혜 표가 P1, 문재인 표가 M1,

미분류된 표를 사람이 확인해서 다시 분류하면 거기서도 박근혜표 문재인표가 나오고 진짜 무효표도 나온다. 무효표는 다 빼고 거기서 나온 박근혜표는 P2 문재인 표는 M2.

더 플랜에서 주장하는 K 값은 P2/M2와 P1/M1의 비율. 즉 미분류표 중 박근혜/문재인 비율을 분류표 중 박근혜/문재인 비율로 나눈 값이다. 


K값의 정의 : K = (P2/M2) / (P1/M1)


이건 대충 생각해도 분자 분모가 서로 같아야 되는 거 아니냐는 생각이 든다.

두 비율이 서로 같다면 그걸 나눈 값은 당연히 1이 되어야 한다.  

그런데 이걸 실제로 일일이 투표소 투표함 별로 구해 보니까 정상분포를 그리긴 하는데 중간값이 1.5가 나온다는 것이다. 더 플랜의 주장은 그렇다.

1.5라는 것은,

분류된 표 중에서 박근혜/문재인표의 비율보다,

미분류표 중에서 박근혜/문재인표 비율이 훨씬 높다는 것을 의미한다.


즉 미분류 표 중에 박근혜표 비율이 전체 투표 중 박근혜 득표율보다 높다는 의미다.


이거 수상하네.. 미분류로 3%나 넘게 많이 빼는 것도 수상하고..

그래서 의심을 해 본 거다. 누가? 더 플랜을 만든 사람들이. 딴지일보 총수 김어준이 말이다.

혹시 이게 투표자 연령 때문일까?

그래서 더플랜 팀은 유권자의 평균 연령이 제일 높은 투표구와 제일 낮은 투표구를 찾아서 다시 K값을 구해본다. 그런데 오히려 평균 연령이 젊은 쪽에서 K값이 더 크게 나오기도 한다. 연령 문제가 아니네..

이건 이상하다. 인위적인 조작이 들어간 거 아니겠는가?

도대체 이 K 값이 의미하는 것이 뭔지 함께 고민해 보자.

이게 더플랜의 결론이다. 그럴싸하신가?

그런데.. 얘기는 이제 시작이다.


=============


약간의 산수를 해 보자.

최초 K의 정의를 다시 정리해 보면.. 


K = (P2/M2) / (P1/M1) 이 된다.


이 수식은 중학교 수준의 분수계산법을 적용해서 바꿔 보면,


K = (P2/P1) / (M2/M1) 이 된다.


이 새로운 수식, K 값과 정확하게 같은 값을 가지는 새로운 수식을 말로 풀어 설명해 보면.

박근혜의 득표 중 분류된 표와 미분류된 표의 비율 (P2/P1) 과
문재인의 득표 중 분류된 표와 미분류된 표의 비율 (M2/M1) 과의 비율이다.

이것도 같은 K 값이다. 수학적으로 일치하는 값.

그런데 다시 보자.

박근혜 표 중에서 미분류된 표의 비율과
문재인 표 중에서 미분류된 표의 비율이 같아야 K=1이 된다.

그게 같아야 할 이유가 있어 보이시는가?

박근혜를 찍은 사람들과 문재인을 찍은 사람들은 확실히 구분되는 서로 다른 집단이다. 아마도 연령대도 다르고 성별 비율도 좀 다를 것이다. 교육 수준, 재산 보유량, 사회적 지위, 상당 부분에서 차이가 나는 사회적 집단이다.

그렇게 서로 다른 두 집단에서 미분류표가 발생하는 비율이 도대체 왜 같아야 한다고 생각하는 걸까?

같으면 오히려 이상한 거 아닌가?

K값의 정의를 수학적으로 단순히 변수의 위치만 바꿔서 새로 풀어 봤는데, 의미는 훨씬 더 명확해졌다.  


K값이 1이 넘는다는 말의 의미는 그저 박근혜 지지자들이 문재인 지지자들에 비해 미분류표를 많이 발생시킨다는 것이다. 이유는 알 수 없다. 박근혜 지지자들이 상대적으로 노인이 많아서 일 수도 있고, 박근혜 지지자들이 성질이 급해서일 수도 있고, 부주의한 사람이 많을 수도 있고, 건강 상태가 나빠 손이 떨리는 비율이 많아서 그랬을 수도 있다. 뭐가 되었든 간에 박근혜 지지자들이 미분류표를 더 많이 만들었다는 얘기가 된다. 그것도 절대적으로 많은 게 아니라 문재인 지지자들에 비해 많다는 것뿐이다.

이명박과 정동영 지지자들이라면 또 다른 얘기가 된다. 노무현과 이회창의 선거라면 또 다른 값이 나올 것이다.

이게 바로 더플랜팀이 과거 대선의 결과를 샘플 조사했을 때 K 값이 달라진 이유다.

또 지지자 그룹 간의 문제이기 때문에 투표구 내의 전체 유권자들의 연령분포의 차이를 비교해봤자 별로 유의미한 분석이 되지 않는다. 이걸 그냥 전체 유권자 연령 분포로만 검증을 하니 문제를 캐치하지 못한 것이다. 정확하게 하려면 박근혜 지지자 그룹 내부의 연령별 분포 비율을 놓고 비교해야 하는데 이 수치는 정확하게 구할 수가 없는 수치다. 비밀투표의 원칙 때문이다.

그래서 더플랜 팀이 그냥 투표구 별로 연령별 분석을 하는 걸로는 이 K값의 미스터리를 풀지 못한 것뿐이다.

K값..

뭐 대단한 발견처럼 난리를 쳤지만 진짜 별거 없는 수치에 불과하다. 그게 1이 되어야 할 이유도 없고, 어떤 큰 의미를 가지고 있지도 않다. 그저, 문재인 지지자 그룹에 비해 박근혜 지지자 그룹이 미분류표를 얼마나 더 만들어 내는가 하는 수치일 뿐이다.

문제는 오히려 다른 곳에 있다.

이런 별거 아닌 수치 하나를 가지고 더플랜 제작팀, 줄여서 김어준 딴지 총수는 도대체 무슨 주장을 하고 있는 것이냐는 점이다.

실제로 K값은 하등 중요한 문제가 아니다. 오히려 이 K값이라는 일종의 맥거핀을 이용해서 어떤 일을 하려고 하는 건가 하는 부분이다.

이 부분은 좀 더 여유를 가지고 천천히 정리해서 올리도록 하겠다.




 
참고 :

K값의 의미를 시각적으로 잘 그려낸 글이 먼저 있었다.

http://m.todayhumor.co.kr/view.php?table=bestofbest&no=321609&page=4

이 글을 보면 K값은 정말로 반드시 1이 되어야 할 것만 같은 기분이 든다. 소금과 설탕이라니. ㅎㅎㅎ

그러나, 이게 얼마나 허황된 얘기인지를 먼저 눈치챈 분이 있었다.

http://m.todayhumor.co.kr/view.php?table=science&no=63151&page=1

이 글을 보면 K가 1이 되어야 한다는 주장이 얼마나 무의미한지를 잘 설명해 두었다. 이번엔 소금과 설탕 대신 바나나와 사과가 등장한다.


이 글은 두 번째 글을 좀 더 쉽게 설명한 것에 불과하다. 그리고 K값의 무의미함은 이 정도로 충분히 설명이 된다고 본다.

K값이 "박근혜 지지자 중 노년층의 비율"과 연관성이 있지 않을까 하는 지점을 수학적으로 분석해 본 김용선님의 글도 있다. 당연히 관련이 있다.


https://www.facebook.com/IamJuin/posts/10107845215132800?hc_location=ufi


==========================


* 이 글은 다시 촉발된 개표 시스템 논쟁에 필요한 글로, 글 하나로 마무리 될 문제가 아니기에 별도로 매거진을 하나 만들었습니다. 이 글은 그 모음의 일부입니다. 


https://brunch.co.kr/magazine/vote

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari