'더 플랜' 리뷰, 2012년 박근혜 당선의 비밀이 밝혀졌다.
쓸데없이 거듭 말하지만 나는 정치적인 사람이 아니다.
손석희의 말을 빌리자면 상식적인 사람이고, 김어준의 말을 빌리자면 이상한 걸 보고 이상하다고 말하는 사람이다.
김어준이 기획한 프로젝트 "부"의 삼부작 중 하나인 [더 플랜]이 김어준의 파파이스(한겨레TV)를 통해 개봉했다.
선관위가 공식적으로 남긴 문서에 기록된 내용"만" 가지고 통계학적으로 분석, 실증적 증거를 찾아냈다.
선관위가 [더 플랜]을 본다면 이런 반박자료를 내지 않을까?
기계는 정확하고, 조작되었다는 증거는 없다.
검찰이 선관위 중앙 서버를 압수수색한 사실도 없으니, 틀린 말은 아니다.
[더 플랜]이 관통하는 핵심 코드로 바로 들어가겠다.
각 투표소에서 배달된 투표함이 모인 개표소(전국 251개)를 컨테이너라고 가정하자.
빨간 볼과 파란 볼은 당신이 찍은 투표용지를 의미한다.
두 명의 후보만 있는 걸로 "투표 상황"을 제한했다.
기호 1번 박근혜와 2번 문재인.
투표용지에 인쇄된 실제 후보자 수는 훨씬 많지만, 이해를 하자는 차원에서.
유권자가 찍은 표가 개표소에 모여 분류를 하는데
컨테이너에 모인 볼이 빠져나가는 구멍을 100으로 봤을 때,
96은 분류표, 4는 미분류표로 가정한다.
여기서 잠깐, 분류표란
이런 뜻이고, 미분류표란
이런 뜻인데 미분류표는 전체 투표수 중 얼마나 차지할까?
당신은 투표지 분류기의 신뢰도가 꽤 높다고 느낄 수도 있다.
96.4%는 분류해낸 셈이니까.(이러한 믿음 자체에도 함정이 있지만)
이렇게 생각해보자.
당신이 은행에 가서 ATM으로 현찰을 뽑는다.
100만 원을 인출하는데 97만 3천 원이 나와.
당신의 반응은?
한 마디로 그 ATM은 쓸 수 없다.
갖다 버려야 한다.
흥분한 고객이 때려 부수기 전에.
투표지 분류기를 사용하는 나라의 세계 평균은 1%라고 한다.
기표를 잘못한 표가 미분류표로 분류되는 걸 감안하면 사실상 0%대다.
따라서 개표소를 컨테이너로 상정한 이 실험에서는 "잘못 기표한 투표용지"도 뺀다.
이 실험에서 다루는 미분류표는 정상적으로 기표했지만 미분류표로 분류된 투표용지다.
뭐가 이리 복잡해!
개표가 시작되면 투표지 분류기에 의해 표들이 분류된다.
커다란 구멍으로 떨어지는 표는 분류표, 작은 구멍으로 떨어지는 표는 미분류표.
1번 후보와 2번 후보의 득표율이 같다면
분류표는 50 대 50.
미분류표도 50 대 50.
커다란 구멍으로 떨어지나 좁은 구멍으로 떨어지나,
한 통에서 나오는 거라면,
통계학적으로,
분류표의 비율과 미분류표의 비율은 같아야 정상이다.
그 비율을 나타낸 나눗셈이 바로 저것.
캐나다 오타와의
현화신 교수님이 이틀 만에 세 번의 나눗셈으로 찾아낸
모델 K의 값.
박근혜를 더 많이 지지한 지역.
분류표가 70 대 30이라면 미분류표도 70 대 30.
세 번의 나눗셈으로 비율을 구하면
1.
"1"은 통계학적으로 "정상"이란 뜻.
빨간 볼과 파란 볼이 정상적으로, 자연스럽게 잘 섞였다는 의미.
반대로 문재인 지지가 많은 지역.
역시 40 대 60과 40 대 60을 세 번 나누면
K 값은 1.
2012년에 실제로 치러진 개표소 251개의 값은 어땠을까?
박빙 지역의 분류표는 50 대 50.
미분류표도 50 대 50?
60 대 40.
이것은 김어준의 파파이스 팀이 찾아낸 "이상한" 현상.
왜 미분류는 항상 박근혜 표가 많지?
어쨌든 세 번의 나눗셈을 하면
나오는 값은 1.5
지난 대선 당시 전국에 집계된 251개 개표소의 분류표 비율 대비 미분류표 비율 값은 1.5
비등한 지역.
미분류표 비율은 60 대 40.
세 번 나누면
1.5
박근혜 우세 지역.
분류표 비율 70 대 30.
미분류표 비율은
78 대 22.
세 번 나누면
1.5
문재인 우세 지역.
분류표 비율 40 대 60.
미분류표 비율은
50 대 50.
나누면
1.5
박근혜 당선의 지렛대가 된 1.5의 법칙.
경기도 김포시
1.48
강원도 원주시
1.52
서울시 성동구
1.49
부산시 금정구
1.51
전남 신안군
1.50
전국을 강타한
1.5배의 힘.
당신이 인출한 액수는 100만 원인데
ATM이 97만 원만 준다면, 그래도 당신은 통계학적으로 그 정도 오류는 괜찮다며 가만있을 것인가?
251개 개표소를 분석한 결과 1.5 값이 가장 많았고, 적게는 0.97, 많게는 2.2까지 나왔다고 한다.
양쪽으로 1.5에서 많이 벗어나면서 낮아진 값은, 아무래도 인구가 적은 개표소 값 같다고.
K값 1.5 정규 분포 그래프.
이 데이터는 무얼 의미할까?
왜 투표지 분류기는 정상적으로 찍은 표를 "미분류표"로 보내야 했을까?
혹시 1.5가 한국적 특성을 나타내는 정상 값은 아닐까?
선관위에 자료를 요청했다.
노무현 대통령과 이명박을 뽑은 선거의 투표 현황을 달라고.
임기를 마치면 없애버린다나.
하마터면 입증을 못할 뻔했는데 다행히 세 개 지역 투표 현황을 가지고 있었다.
16대 대선 관악은 1.04,
17대 대선 노원은 1.02,
17대 대선 수지는 1.04.
1에 수렴되는 값.
18대 대선에선 관악이 1.35, 노원이 1.44, 수지가 1.37.
통계학적으로 있을 수 없는 일.
우연히라도 이런 일이 있으려면 번개를 두 번 맞아야 한다고.
로또 1등 당첨 확률.
박근혜는 개표 당시 251개 개표소에서 로또 1등에 계속 당첨되고 있었던 셈.
전국을 뒤덮은 K.
무작위 랜덤에 의한 통계적 진실을 조롱한 K.
18대 대선 결과를 바꿔놓은 K.
"이거는 디자인이고 플랜이에요."
K 값을 이해한 사람이라면 자연히 갖게 되는 의문.
미분류표로 보내도 어차피 수작업에 의해 분류표 숫자로 더해지는 건 마찬가지 아닌가요?
굳이 더해질 값인데 프로그램을 조종하면서까지 그런 작업을 할 필요가 있나요?
현화신 교수님의 가설은 이거다.
(중앙의) 통제에 의해 분류표로 갈 표를 미분류표로 빼돌린다.
정상적 상황이라면 분류표와 같은 비율이 되어야 할 미분류표가 항상 박근혜 쪽이 많도록 설계되었기 때문에, 분류표에서 빼돌린 숫자만큼 다른 표로 채워 넣는다면 K 값만큼 박근혜가 이득이다.
교수님은 무효표로 채워 넣었을 거라고 추정했고, 김어준은 이런 식이면 혼표(상대방 표)도 가능하다고 내다봤다.
보통 사람들은 이렇게 생각한다.
투표지 분류기가 "스캔" 과정을 통해 도장이 찍힌 좌표를 보고 분류를 하는 거라고.
이건 아날로그 방식이다.
마치 인간의 눈을 대신해 기계가 "스캔"을 해서 분류하는 것처럼 보이니까.
아주 틀린 말은 아니다.
선관위가 선전하는 대로 "정상" 프로그램을 가동한다면 미분류표가 1%에 머무는 정상 개표가 가능할 테니.
지난 16대 대선과 17대 대선처럼.
하지만 권력을 기반으로 범죄를 저지르기로 결심한 자가 투표지 분류기를 제어하는 프로그램에 손을 댄다면?
이명박 정권 때 선관위 디도스 공격은 실제로 있었던 일이다.
프로그램은 "값"에 의해 그 출력물이 변한다.
우리는 투표지 분류기가 "아날로그"적으로 투표용지를 분류한다고 믿지만, 그것을 제어하는 컴퓨터 장치가 있고, 거기에 깔린 프로그램이 따로 작동한다는 걸 아는 순간 그것의 의미는 완전히 바뀐다.
"아날로그" 장치를 제어하는 "디지털"이 숨어있었던 것이다.
당신의 스마트폰은 아날로그적이지만, 그래서 필요하다면 던질 수도 있고 흉기 대신 휘두를 수 있지만 당신의 핸드폰으로 당신을 도청하는 기술은 몰래 깔려있는 프로그램, 디지털이다.
[더 플랜]에서는 선관위를 감시하기로 작정한 "시민의 눈" 회원들을 초대해 직접 시연해 보였다.
다 필요 없고 마지막 시연만 밝히겠다.
투표지 분류기와 그것을 제어한 컴퓨터를 똑같이 갖다 놓고 재연했다.
투표용지 100장을 준비해 100장 다 문재인을 찍는다.
투표지 분류기에 투입했더니 100장 다 박근혜한테 간다.
그렇게 분류하도록 설계된 프로그램을 깔자 그렇게 된 것이다.
그 값을 설계한 해커는, 노트북에 적용시킨 그것이 아주 단순한 프로그램이라고 했다.
즉 투표지 분류기는 스캔 장비를 동원한 공학적 "분류"를 해온 게 아니라 프로그램의 지시로 "분류"를 해온 것이다.
오차 범위를 0으로 하면 16대나 17대 대선처럼 K값이 0으로 수렴하는 분류를 하지만, 오차 범위를 인위적으로 조작해 박근혜한테 유리하도록 세팅하면 그렇게 분류한다는 것이다.
기계가 아닌 프로그램이 분류해왔던 것이다!
시민의 눈 관계자들은 눈시울을 붉혔고, 김어준은 허탈해했다.
이렇게 쉬울 줄 몰랐다면서.
이 시스템으로 시간 역전 현상도 설명 가능해진다.
투표지 분류기는 개표 전에 방송된 값으로 투표용지를 분류한 것이다.
마지막으로 남는 의문.
아무리 그래도 수검표 과정이 있지 않습니까?
맞다.
100장씩 띠지로 묶인 걸 사람이 확인하는 작업 절차가 있다.
하지만 그걸 한 장씩 일일이 확인하는 사람은 없다는 게 중론이다.
투표지 분류기가 오차 없이 해냈을 거라는 믿음에 대충 보고 빨리빨리 넘기는 분위기라고.
그때쯤 되면 밤 10시를 넘겨 빨리 끝내고 집에 가서 쉬자는 분위기도 있다는 것이다.
실제로 박근혜 미분류표가 많이 나오도록 설계된 프로그램이 개표 당시 노트북에 깔렸다는 증거를 잡은 것은 아니다.
하지만 그와 같은 디지털적 조작이 없었다고, 증거물을 압수해서 디지털 포렌식으로 정교하게 검증하는 과정을 거친 것도 아니다.
다만 이 모든 통계학적 비정상을 입증하는 논문 [A Master Plan 1.5]가 발표되었을 뿐.
이로써 나는 김어준에게 또 하나의 빚을 졌다.
다큐멘터리의 완성도만 놓고 보자면 그렇게 훌륭한 편은 아니라고 본다.
최순실이 탄핵을 일으키는 바람에 서두르지만 않았어도 훨씬 근사한 작품이
하지만 이것은 시민이 광장에 나와 촛불을 든 사건만큼 유의미한 발견이라고 본다.
적폐 청산을 위한 마중물?
어쩌면 우리는 이제 겨우 한 발 나아갔는지도.