brunch

You can make anything
by writing

C.S.Lewis

by 책읽는 데레사 May 27. 2019

통계가 숨 막히는 그대에게

벌거벗은  통계학을 읽고

앎의 즐거움이라면 전에 알지 못했던 것을 알게 되어 즐거움을 느낌을 가리킨다. 덧붙이자면 나에게 지적 희열은 내가 몰랐다는 사실 자체를 알게 된 것도 포함하고 그 수단은 팔 할 이상이 독서이니 내 일상은  즐거움을 느낄 범위가 넓다는 장점이 있겠다.  그 연장선에서 "벌거벗은 통계학"이란 책도 내용의 난도야 어쨌든 즐겁게 읽은 책이다.


http://m.yes24.com/Goods/Detail/11257680

-미국 제조업은 얼마나 건전한가?

라는 경제 문제를 생각해보자.

영국의 <이코토미스트>에서 제시한 (2011.3.10) 미국 제조업에 관한 그래프를 보면 일자리 수는 10년간 약 600만개가 사라졌지만, 생산량은 꾸준히 증가한다. 이러한 맥락은 무시하고 '미국은 여전히 제조업 상품을 전 세계로 가장 많이 수출하는 국가'라고 하는 정치가A, '제조업 일자리가 크게 줄어 미국의 제조업 건전성이 위험하다'라고 하는 정치가B가 있다면 어느 쪽에 투표를 해야 할까? '일자리는 크게 줄었지만 생산성은 글로벌 경쟁력 관점으로 보아 바람직하니 양방향을 고려한 정책이 필요하다'고 하는 정치가C에게 투표함이 합리적일 것이다. 정치가A,B가 정치가 C를 압도하는 현실은 정치가의 탓일지 유권자의 탓일까.

이렇듯 통계의 의미를 적확하게 읽어내는 작업이 필요한 영역은 정치뿐 아니라 우리의 일상에 전면적으로 배치되어 있다.  대한민국에서 의무교육을 마치고 대학을 나온 일반적인 사람이라면 수학 교과서에서 배웠던 '통계'가 낯설지 않다. 하물며 초등 2학년인 나의 아들도 매일 미세먼지 지수와 비올 확률을 확인하며 일상을 가늠할 정도이니 말이다. 하지만 안다고 생각하는 것과 내가 아는 것은 언제나 차이가 있기 마련이다. 특히 통계처럼 일상적인 것은 둘 사이의 간극이 더 처참하다. 그래서 그런지 이 책에서 가장 흥미롭게 읽은 부분이 바로 3장 <숫자의 함정, 사실을 왜곡하는 아주 교묘한 거짓말들>이다.  "미국 제조업의 건전성"에 이어 다른 흥미로운 부분도 살펴보자.

-세계화는 지구 상의 불평등을 악화시키는가?

1980년~2000년 GDP 기준 부유한 나라는 그렇지 않은 나라에 비해 더 빠르게 성장을 했기에 세계화는 타도 대상이 될 수 있지만, 인구 비중으로 본다면 국가가 아닌 사람들을 고려할 때 지구촌 소득 불평등은 급격히 감소하고 있다. (이코노미스트) 

통계적 부정행위는 수학 기술이 부족하기 때문이 아니라 오히려 복잡한 계산이 사악한 동기를 숨길 수 있다는 것에 방점을 찍어야 한다. 그 동기를 파악하기 위해 통계를 공부해야 하는 것이다.


-교통사고 발생률을 높인 9.11테러

9.11공격 이후 수천 명의 미국인이 비행기 여행을 두려워하여 비행기 대신 자동차로 이동하는 바람에 2,000명 이상이 (불필요하게)  교통사고로 사망했을 수 있다고 추정한 논문이 있다.

-99.9999퍼센트의 정확성을 보이는 진단 검사

예컨대 10만 명에 한 명꼴로 감염 되는 질병이 있고 99.9999퍼센트의 정확성을 보이는 진단검사를 약 1억 7,500만 명(미국의 전체 성인 인구)에게 시행한다고 가정해보자. 100퍼센트에 가까운 정확성을 보이지만 총 1만 9,250명이 질병이 있다는 통지를 받고 이 중 9퍼센트만이 실제로 아프다는 결과가 나온다.

-J.P.Mprgan의 VaR

2008 대침체 발생 후 앨런 그린스펀의 설명이 아래와 같다.

"2007년 여름, 지식 체계 전체가 무너졌습니다. 리스크 관리 모델에 입력된 데이터는 운 좋은 시절의 지난 20년 자료들이었기 때문입니다." 즉, 리스크 관리모델인 VaR에 내재된  프로파일은 과거 시장의 움직임에 기초하기에 미래를 예측하기엔 타당성이 없었던 것이다.

"가장 큰 리스크는 당신이 한 번도 본 적이 없고 그렇기 때문에 측정할 수 없다. 지금까지 이것은 당신 생애에 일어난다고 생각조차 하지 못할 정도로 일반적인 확률을 벗어나 있는 것처럼 보이지만, 당신이 아는 것보다 훨씬 더 자주 발생한다."

블랙스완의 저자 나심 탈레브가 한 통렬한 비판이다.

-도박사의 오류

예컨대 동전을 100번 던져서 연달아 100번 앞면이 나왔을 때 다음번 던질 동전이 뒷면이 나올 확률은 여전히 1/2 임에도 불구하고 일반적으로 '이번에는 뒷면이 꼭 나올 것을 기대'한다. 비로 독립적인 사건에 대한 이해가 부족한 것이다.

-기억 편향

1993년 하버드 연구자는 식습관과 암의 관계를 설명하기 위해 유방암 진단을 받은 여성 집단과 그렇지 않은 집단으로 이루어진 데이터를 수집했다. 암 진단을 받은 여성은 자신이 실제 섭취한 것보다 훨씬  고지방 식사를 했다고 (무의식적으로) 회상했다. 즉 결과가 원인을 편향적으로 견인한 것이다.

-귀무가설의 긍정 오류와 부정 오류

긍정 오류: 귀무가설의 기각을 얻기 위한 기준 수준을 낮추어 (유의 수준이 낮음) 일어나는 오류. 예컨대 범죄자를 많이 잡아 가두기 위해 유의 수준을 낮추어 죄 없는 사람들도 많이 감옥에 가게 되는 오류.  

부정 오류: 귀무가설의 기각을 얻기 위한 기준 수준을 높여 (유의 수준이 높음) 일어나는 오류. 억울한 사람이 생기지 않도록 범죄자의 기준을 높게 잡지만 실제로 죄를 지은 사람이 검거되지 않을 경우의 수도 높아지는 오류.

어떤 오류가 더 나은가에 대한 판단은 상황에 따라 달라진다. 암 검사의 경우 암이 아닌 것으로 밝혀지는 긍정 오류가 암 진단을 놓치는 부정 오류보다 낫다고 볼 수 있다. 하지만 최근 보건 정책 전문가들은 긍정 오류와 관련된 과잉 진료와 비용을 이유로 긍정 오류에 대한 이의를 제기하기 시작했다.



통계는 학창 시절 교과서로만 훑어보고 잊고 살기에 우리 생활에 생각 이상으로 많은 부분을 공유하고 있다. 내가 모르고 살았다는 사실을 인지하게 된 자체에 안도감이 느껴지지 않는가?


사족이지만, 몬티홀 문제를 보며 손실회피 성향이 지독하게 심한  나의 성향도 파악할 수 있었다. 몬티홀 문제가 어떤 것인지 궁금한 사람은 을 읽어보도록 하자. 하하

작가의 이전글 다이어트라 쓰고 마음 챙김이라 읽다
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari