brunch

매거진 오늘의 책

You can make anything
by writing

C.S.Lewis

by 서콴 Sep 23. 2018

평균의 종말? 진짜?

통계 특성에 맞는 대푯값을 고민해야!

 <평균의 종말> 저자 토드 로즈(Todd Rose)는 ADHD 장애를 가지고 있었고, 자퇴생이었다. 성인이 되어서는 자식들을 부양하기 위해 공장에서 일을 했다. 뒤늦게 대학교에 입학하며 하버드 교육대학교 교수가 된 케이스다. 그는 가감없이 기존 교육계를 겨냥한다. 무분별한 '평균주의'가 다른 잠재력을 가지고 있는 학생을 '문제아'나 낙제생으로 단정하고, 개개인들의 잠재력을 죽이고 있다고 고발한다. 나아가 획일적인 평균주의는 어떻게 만들어졌으며, 어떻게 벗어날 수 있는지 제시하고 있다.

어쩌면 우리의 이야기


 우리나라 사람들에게 <평균의 종말>은 친숙한 주제이다. 우리는 '평균주의'라고 말하지 않았을 뿐이지, 평균주의 교육을 관통해왔다. 과거 수능 성적표에 찍힌 표준점수, 백분위, 등급을 지표로 대학교 입학 당락을 갈랐다. 좋은 대학에 입학하려면 학창 시절 내내 우수한 성적을 유지해야 했고, 자신이 속한 집단 평균보다는 늘 높은 점수를 받아야 했다. 


 그러나 최근에는 평균주의에서 벗어나 학생 개개인의 다양성을 평가하려고 있다. 입학사정관제나 논술 시험이라든가, 옳은 평가 방법인지는 모르겠지만 어쨌든 획일적인 평가 시스템에서 벗어나려고 하고 있다. <평균의 종말> 또한 교육계는 획일적인 '평균주의'를 버리고, 개개인의 특성을 고려하려 하고, 사회는 '평균주의' 치하에서 버려진 잠재성들을 발견하고, 발전시키자고 말한다.


 저자는 평균주의에서 벗어나 개인의 잠재력을 올바르게 평가하기 위해서는 세 가지의 개개인성 원칙을 제시한다. 첫째, 들쭉날쭉의 원칙이다. 둘째, 맥락의 원칙, 셋째 경로의 원칙이다.

21세기북스 네이버 포스트 참조



'평균주의'의 기원과 종말


 평균주의는 산업시대의 산물이다. 산업시대에는 인구조사, 토지조사 등 사회 정비를 위해 조사하고, 측정해 나갔다. 책에서는 19세기에 활동한 케틀레, 골턴, 테일러 등이 시작한 평균주의부터 훑고 넘어간다. 대표적인 인물이 벨기에 통계학자 케틀레이다. 그는 많은 사람들의 육체적, 정신적 특징을 수집했고, 이 평균적 특징들을 조합해 ‘평균인’이라는 가상 존재를 내세우기도 했다.


 케틀레의 평균인 개념은 20세기까지 이어진다. 1940년대 말 미국 전투기 조정석에 가장 적당한 신체 사이즈를 찾고 있었다. 이른바 평균 조종사 신체 사이즈를 찾고 있었던 것이다. 그러나 많은 조종사가 사고로 목숨을 잃고 도달한 결과는 '평균적인 조종사' 같은 건 있지 않았다.


 미 공군은 평균 사이즈가 아니라 지금의 자동차 좌석처럼 개인의 특성에 따라 조정 가능한 좌석으로 결정했다. 세상에는 평균인은 없다. 사람들은 놀랍도록 다르기 때문이다. 어깨 비율, 목 길이, 고관절 너비, 다리 비율 등등 어느 한 조건으로 나열하기 힘들 정도로 다양하다.


  '평균주의자'인 아돌프 케틀레, 골턴은 산업시대를 살았고, 인간의 노동력을 수치화해 효율적인 방법으로 평가하고 개선시키는 일을 했다. 그 당시에는 평균이 아주 효율적인 방법이었을 것이다. 왜냐하면 사람 한 명과 사람 한 명이 같이 일을 하며 두 사람 분의 일을 했으니깐 말이다. 말 그대로 '1+1=2'가 성립한다. 단순 숫자가 현실에도 그대로 이어졌다.


 그러나 지금은 한 사람이 한 사람 이상의 가치를 해낸다. 한 명이 머신 러닝도 하고, 설계도 하고, 드론도 날리고, 창의적인 아이디로 사회를 변화시킨다. 한 사람 분의 가치가 커졌기 때문에 더 이상 평균이 통하지 않게 되었다.


 평균은 잘못이 없다. 평균이 어떤 대상에 쓰이는 것이 중요하다. 책에서 언급한 것처럼 다우지수를 평가하는 직관적인 평균 기법은 아직도 유효하다. 그러나 이제 사람과 관련된 노동, 교육 분야에서는 평균이라는 게 글쎄? 그렇게 쓸모 있는지 모르겠다.


대칭분포와 비대칭 분포에서 대푯값들의 위치. 평균(mean)과 중앙값(median), 최빈값(mode)

모든 대푯값에는 오류가 있다


  평균인은 존재하지 않지만 그렇다고 평균이 사회 전반에 완전히 불필요하다고 여기지는 않는다. 다만 평균이 숫자의 다양한 정보를 한 가지 형태로 함몰시키는 것을 어떻게 보완해야할지 고민해야 한다.


 흔히 '통계를 확인한다'는 말은 곧 집단의 특성을 대표하는 숫자를 확인하는 것을 의미한다. '용인시 주민 평균소득은 얼마이다, 중위소득은 얼마이다'처럼 말이다. 그렇다면 대푯값을 알맞게 선정하거나 평균, 중앙값, 최빈값 등을 데이터 특성에 따라 활용해야 한다.


 나아가 표본들의 분포 모양을 확인해야 한다. 분포 모양에 따라 대푯값들이 변하기 때문이다. 왼쪽 그림처럼 우리가 수학 시간에 배운 대칭 분포는 현실에서는 존재하지 않는다. 오른쪽으로 치우치기도 하고, 왼쪽으로 치우치기도 하고, 위로 솟아오르기도 한다. 이러한 형태를 살펴볼 때 데이터에 대한 정확한 이해가 깊어진다.


 이미 세상에 존재하는 대표값은 이미 많은 오류를 저질렀다. 표본을 완벽하게 대표하는 대푯값은 존재하지 않는다는 것이다. 알고자 하는 의지만이 좀 더 진실에 다가갈 수 있지 않을까! 마지막으로 대푯값들이 범한 오류를 들며 글을 마친다.


평균의 오류


 2012년 새누리당(현 자유 한국당) 의원들의 평균 재산은 178억이었다. 평균만 보았을 때 100억대 자산가로 오해받기 십상이다. 그러나 데이터를 뜯어보니 2조 원대 정몽준 의원이 전체 평균을 대폭 올린 것이다! 정몽준 의원은 무려 7선이나 했으니 국회의원들 재산을 말할 때마다 '정몽준 의원을 뺀'이란 수식어를 붙여서 기사로 나갔다. (2012년'정몽준 의원을 뺀' 새누리당 의원들의 평균 재산은 42억이었다.. 그래도 부럽다.. ) 다른 의원들 재산을 다 더해도 정몽준 의원 재산 반을 못 따라가니 평균 금액을 엄청나게 왜곡시키는 결과를 낳았다.


중앙값의 오류


 중앙값은 가장 중간에 위치한 값이다. 평균의 오류를 보완하기 위해 중앙값을 쓰기도 하지만 중앙값도 한쪽에 몰려있을 때는 데이터를 대표하기 힘들다. 저명한 고생물학자인 스티븐 제이 굴드는 '중앙값은 메시지가 아니다(The Median Isn't the Message)'라는 글을 기고했다. 자신이 복막에 악성 중피종이라는 암에 걸렸을 때 이야기였다.


 스티븐이 희귀 암에 걸렸을 때 의사에게 참고문헌을 추천해달라고 했지만 의사는 추천해주지 않았다. 나중에 스티븐이 도서관에서 읽은 책은 악성 중피종을 이렇게 설명하고 있다. '치료가 불가능하고 평균 생존기간이 8개월(incurable, with a median mortality of only eight months after discovery)'이라고 말이다. 보통 사람들은 '나는 8개월 뒤에 죽겠구나!'라고 생각했을 것이다. 그러나 스티븐은 20년을 더 살았다. 악성종피종 생존기간은 오른쪽으로 치우치고, 얇지만 긴 꼬리를 가지고 있었다. 명석한 스티븐은 그걸 알았고, 자신이 긴 꼬리가 될 것이라고 굳게 생각했다. (원문: http://www.stephenjaygould.org/library/gould_median-isn't-the-message.html)


*이 글은 트레바리 통계 클럽 '넘버스'에서 <평균의 종말>을 읽고, 쓰고, 대화한 후 작성된 글입니다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari