brunch

You can make anything
by writing

C.S.Lewis

by Amang Kim Nov 26. 2016

12. 과연 수(數)는 객관적인가? (상)

박근혜, 촛불, 트럼프, 로또, 뽑기, 교통사고 그리고, 수학

대한민국은 요즘 최씨 및 박근혜 대통령 때문에 난리가 났다. 여러가지 이유로 글쓰기를 차일필 미루다가, 이제야 다시 글을 쓰게 되었다. 최근 촛불집회로 대한민국 사회가 시끄러운데, 제목들이 보면 다들 이런식이다:


   . 전국 200만 촛불 집회…청와대 에워싼다

   . 靑 "민심 엄중히 받들겠다"…'200만 촛불집회' 비상근무

   . 5차 대규모 촛불집회…전국서 200만 명 모인다.


대부분의 글들이 숫자(혹은 수)에 집착(?)하는듯 한 제목들이다. 또한, 이러한 재미있는 기사들도 보인다.


   [ZDNet] 촛불집회의 비밀, IT기술로 풀었다

   [동아일보] 입자물리, 유체역학까지 동원… 과학자의 집회인원 계산법


기자들이 기사를 쓸 때 수를 사용하고, 그 수를 도출 해나가는 과정에 대한 내용을 기사화하는 이유는 아마도, 수(數)가 주는 객관적인 느낌 때문일 것이다. 그렇다, 객관적이 아니라, "객관적인 느낌" 때문이다. 이즘에서 드는 한가지 질문,

과연, 수(數)는 객관적인가?


여기서 다루고자 하는 것은 관련된 숫자를 도출해내는 방법론이나, 해당 숫자가 정말인지에 대한 진실성을 말하는 것이 아니다. 물론, 이 부분에 대해서는 논란의 여지가 너무나 많지만, 오늘 이야기에서 빼도록 하겠다. 기본 전제는 수자체는 사실이라고 가정하며, 도출 방법 또한 타당하다는 전제 하에서 출발 한다.


일상적인 질문들 몇가지


여러분은 대부분 복권을 사본적이 있을 것이다. 왜 샀느냐고 물어보면 대부분 "성공한 인생"을 위해서라고 대답을 할 것이다. 물론, "성공한 인생"에는 여러가지가 있지만, 단순히 "돈의 가치"만으로 판단을 했을때, s전자같은 대기업 임원이 되는 것 또한 어떤 면에서 "인생성공"이라 할수 있을 것이다. 여기에 두사람이 있다.

   . 사람A: 20대 후반, 현재 무직, 대기업에 입사, 20년뒤에 대기업 임원을 꿈꾼다.

   . 사람B: 20대 후반, 20년 동안 꾸준히 복권 구입 1등을 꿈꾼다. (단, 20년동안 복권살 돈은 있다고 가정) 

   (질문1) 여러분들은 이 둘중에 누가 성공할 가능성이 높다고 보는가?

인생역전?! 복권... (출처 인터넷 어딘가)

두번째, 글을 읽는 여러분이 내 또래 (내 나이는 밝히지 않겠다)라면, 설탕과자 뽑기라는 것을 해보았을 것이다. 1~100까지 숫자판에 원하는 숫자를 10~20개 정도 고르고, 뽑기로 해당 숫자가 나오면, 설탕으로 만든 칼이라든가를 준다. 

추억(?) 불량 식품 뽑기 (출처: 인터넷 어딘가)

여기, 뽑기를 하는 두 어린이와 한명의 어른이 있다. 이 어린이는 숫자판에서 10개의 숫자를 고른다.

   . 어린이A: 1-10까지 쭈욱 붙여서

   . 어린이 B: 자기가 좋아하는 숫자로 10개 선택

   . 어른A: (정규분포를 고려하여) 45번부터 54번까지 10개 선택

     (질문2) 이 들중에 선택한 숫자를 뽑을 가능성이 가장 높은 사람은?


세번째, 처음 이야기를 했던, 촛불시위를 예를 들어보겠다. 우선 다음 기사를 보시라:

   [매일경제] 3.5%의 법칙…국민 3.5% 시위 계속땐 못버텨

   [서울경제][5차 촛불집회]175만명 모이면 정권 바뀐다는 '3.5% 법칙' 통할까

   (질문3) 이번 시위에서 175만명(3.5%)이 모이고, 박대통령이 하야한다면, 위의 이론이 맞는 것인가?

촛불 집회 현장 (출처: 인터넷 어딘가)

여러분은 약간의  먼거리를 이동하고자 한다. 당신은 보다 안전한 교통수단을 선택하고자 한다. 당신이라면, 

(질문4) 비행기를 선택할 것인가? 보다 안전한 기차를 선택할 것인가? 다음을 진행하기전에, 여러분들은 각 질문에 대한 대답을 미리 해보기 바란다.

.

.

.

.

.


질문들에 대한 답변과 그 뒷 이야기


첫번째 질문의 답은 "사람A가 성공할 가능성이 높다" 이다. 이유는 간단하다. 어떤 사람이 대기업에 취업을 하고(AND) 임원이 될수 있는 확률은 아무리 낮아도 십만 분의 일(1/100,000)을 넘을수 없다. 왜냐하면, 대기업 입사 경쟁률은 몇십 분의 일 즉, 백분의 일(1/100)보다 작을수 없고, 대기업 입사후 임원이 될 가능성 또한 몇백분의 일 즉, 이또한 천분의 일보다 작을수 없다. 사람A의 성공가능성은 두 확률의 AND결합이기에, 1/100,000보다는 절대로 작을수 없다. 이를 조금 쉽게(?) 쓰자면, 아래처럼 표현이 가능하다.

위의 긴 문장들을 수학적으로 나타내면....

반면, 복권의 1등 가능성은 최소한 몇백만분의 일기 이기때문에, 당선 확률은 1/1,000,000보다는 무조건 작다. 즉, 다시말해,

1등을 꿈꾸며 복권을 사는것 보다는,
 지금 무직이라도 대기업 임원을 꿈꾸는게 낫다.

혹자는, 복권을 한번사는게 아니라, 20년동안 꾸준히 산다면 당선확률이 더 높지 않느냐고 말할 것이다. 하지만, 

20년을 꾸준히 사던, 1번을 사던, 복권 1등에 당첨될 확률은 동일하다.

왜 그런지 궁금한 분들은 고등학교 수학의 조건부 확률(혹은 독립확률)을 참고 하시라.


두번째 질문의 답은 "3명 다 가능성은 동일 하다" 이다. 왜냐하면, 말그대로 뽑기는 뽑기이고, 한번을 뽑을때 선택했던 숫자를 뽑을 가능성은 어떻게 선택을 하던 1/10(즉, 100가운데에서 10개 숫자를 선택)로 동일하다. 어떠한 이유를 갖다붙이더라도 말이라. 어른A는 나름 논리를 가지고 숫자를 뽑았다고 생각하는가? 

하지만, 이 어른A의 논리는 틀렸다. 그것도 완전히!!

얼마전에, 트럼프 당선직후, 내가 페이스북에  특정기사에 대해서 개드립치지 말라고 이야기한적이 있다.

   [이데일리] 세종대 우종필 교수팀, 빅데이터 분석결과 '美 트럼프 당선 예측'

얼마전 페북에 올렸던 글 (출처: 페이스북)

이런 이야기를 한 이유는, 위의 기사의 논리가 바로 이 뽑기의 "어른A와 마찬가지"이기 때문이다. 완전히 틀렸다는 의미는, 어른A가 숫자를 맞췄던지 틀렸던지 상관없이 그 논리가 틀렸다는 말이다. 즉, 설령 어른A가 뽑은 숫자를 맞춰다고 해서, 어른A의 논리 맞는게 아니라는거라. 설령, 세종대 교수팀의 접근법이 맞다고 가정을 하더라도, 이 기사와 같은 접근 방법 즉, 트럼프당선을 맞췄으니, 접근법이 맞다는식의 접근 방법은 완전히 개드립이라는거다. 이에 대한 이유는 세번째 질문에 대한 답변을 하면서, 첨언하겠다.


세번째 질문의 답은 "해당 이론을 증명할 수는 없다"이다.  즉, 위의 질문은 조건부 명제에 관한 내용이다. 즉의 세번째 질문을 다음과 같은 명제로 정리가 가능하다.

   . p: 3.5%의 이론은 사실(p1)이고(AND), 175만(3.5%)명 넘음(p2)

   . q: 대통령하야(혹은 사퇴)

위의 명제에서 세번째 질문이 주장하는 것은 바로, q가 사실(True)이니, p가 사실 이라는 것을 말하는데, 문제는 

조건부 명제에서 q가 사실(True)이라고 해서,
p가 무조건 사실(True)임을 보장할수 없다.

는 것이다. 즉, 조건부 명제에서는 q가 사실(True)인 경우, p의 사실여부에 관계없이 전체 명제가 참(True)이 되어 버리기 때문이다 (링크참조). 두번째 질문에 대한 답에서도 언급 했듯이, 결과가 맞으니 논리(혹은 도출과정)이 맞다는 식의 논리는 어른A가 뽑기에서 숫자를 맞춰다고 해서, 정규분포를 이용해서 숫자를 선정해서 맞췄노라 하는 개드립과 크게 다르지 않다는 것이다. 다시 한번 말하지만, 실제 그 도출 과정자체가 맞느냐는 전혀 관계가 없다. 타당성 증명에 대한 "논리" 틀렸다는 거다.


네번째 질문의 답은 "크게 상관없다"가  답이다. 인터넷을 통해 대략적으로 조사를 해보면, 실제로 비행기 사고 확률이 기차 사고확률보다 3배 이상이 높고 한다. 그리고, 내가 제시한 답은 이 통계치가 사실이라는 전제하에 출발을 한다 (단, 해당 데이터는 reference에 따라 다소 차이가 있을 수 있으니, 이점은 감안하여 이해하길 바람). 대략 비행기 사고확률은 약 2백만분의 1, 기차 사고확률은 약7백만분의 1이다. 거꾸로 말하면, 사고가 나지 않을 확률은 비행기는 99.999....%이고,  가차 사고가 나지 않을 확률 또한 99.999.....% 물론, 소수5자리부터는 숫자가 차이가 난다. 

하지만, 소수 세자리까지는 숫자가 동일하다. 

이게 무슨 말이냐 하면, 두 교통수단 모두, 십만번 가운데서도 1번의 사고가 나기가 힘들다는 것을 의미한다. 즉, 나에게 이러한 사고가 한번 일어날려면, 십만번을 타 봐야 알수가 있다는거다. 즉, 어쩌다 한번 타는 비행기, 어쩌다 한번 타는 기차(만번이하)라면, 위의 수치가 (적어도 자신에게는) 아무런 의미가 없다는 것이다. 즉, 교통수단이 얼마나 안전한가로 선택을 하는 것이 아니라, 다른 요소(즉, 가격이라던가, 소요시간이라든가)를 가지고 선택을 하는 것이 보다 타당할 것이다.


여기서, 추가질문을 하겠다. 당신은 최근에 한달 사이에 몇건의 비행기 사고를 뉴스를 접해 들었다고 하자. 

비행기 사고..무섭다.... (출처: 인터넷 어딘가)

이런 상황이라고 했을때, 당신은 어떻게 할 것인가? 위의 사실(비행기 사고뉴스)이 당신의 선택에 영향을 줄것인가? 이에 대한 답을 하기전에 이 글을 잘 읽어보고 생각 해보시라 (이 질문에 대한 답변은 다음 글을 쓰면서 이어 가도록 하겠다).


쉬는시간


원래 쓰려던 글의 절반 정도를 쓴것 같다. 하지만, 글을 쓰다보니 너무 길어져서 이 즈음에서 잠시 쉬어 갈까 싶다. 그래서, 제목에도 "(상)"이라고 붙였다. 글제목 "과연 수는 객관적인가?"에 대한 답변은 다음 글에서나 시작이 가능할것 같다. 이번 글 반응이 좋으면 나머지 반을 빨리 써내려 갈것이고, 반응이 않좋으면, 그냥 접을지도 모르겠다... ㅋㅋ

왔다간거 압니다. (출처: 인터넷 어딘가)







 



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari