100, 84, 80, 80, 96, 76, 80, 84, 64. 80, 92, 84, 100, 84, 80, 80, 72, 80, 100, 100, 84, 80, 96. 우리 반 학생 23명의 수학 3단원 시험 점수이다. 시험이 끝나면 학생들은 꼭 우리 반 평균은 몇 점인지 묻는다. 아마 평균 점수보다 높아야 시험을 잘 봤다고 생각하는 것 같다. 그런데, 진짜 그럴까?
이번 시험의 평균은 85.04점이다. 똑같은 23개의 수를 높은 점수 순으로 다시 적어 보았다. 100, 100, 100, 100, 96, 96, 92, 84, 84, 84, 84, 84, 80, 80, 80, 80, 80, 80, 80, 80, 76, 72, 64. 평균보다 점수가 높은 학생은 7명이다. 그럼 우리 반에서 시험을 잘 본 사람은 7명밖에 안 되는 걸까?
혹시 다른 나라에서도 평균을 이용해서 자신의 위치를 확인할까? 경험해 본 바에 의하면 꼭 그렇지는 않았다. (이직을 고민하며 지원했던) 미국의 모든 로스쿨에서는 전년도에 합격한 학생들의 LSAT(로스쿨 입학시험) 점수의 중간값(Median)을 알려주었다. 평균이 아니라 전체 합격자 중 딱 중간 점수로 합격을 한 사람의 점수는 얼마나 되는 지를 알려주어, 지원을 고민하는 학생들이 참고하도록 안내한 것이다.
시험 점수만이 아니다. 부동산 가격이나, 임금도 마찬가지였다. Streeteasy.com이라는 웹사이트에서는 뉴욕시의 부동산 매물들을 모두 검토해볼 수 있다. 그런데, 이 사이트에서도 어떤 지역을 선택하면, 그 지역의 부동산 가격의 중간값(Median)을 알려준다. 예를 들어, 뉴욕시에서 가장 전통적인 부촌 중 하나인 어퍼 이스트 사이드 (현재 최고 매물의 가격이 700억을 훌쩍 넘는다.) 지역 부동산의 중간 가격은 약 13억 원($1,100,000)이다. 그리고, 이 지역에 사는 사람들의 월급의 중간값은 1억 5천만 원($131,000) 정도라는 정보도 함께 제공된다. 사람들은 이처럼 중간값에 대한 정보를 바탕으로 해당 부동산이 지역의 시세에 부합하는 물건인지, 자신의 월급 정도면 이 지역에서 생활하기에 적합한지를 판단한다.
그럼 미국에서는 평균을 이용해서 비교를 하는 경우는 없을까? 그렇지도 않다. 야구의 주요 지표인 타율(average)과 방어율(earned run average)은 모두 평균을 구해서 비교한다. 어떤 타자의 2021년도의 타율과 2020년도의 타율을 비교하거나, 다른 투수의 통산 방어율과 최근 5경기에서의 방어율을 비교하는 경우가 바로 평균을 사용한 비교이다.
그러면, 평균은 언제 쓰고, 중간값은 또 언제 쓰는가? 야구에서 볼 수 있듯이 평균은 보통 한 명의 기록을 비교할 때 사용한다. 그리고 중간값은 시험 점수와 부동산 가격 등에서 볼 수 있는 것처럼 여러 사람들 또는 여러 개의 물건들 사이의 수치를 비교하는 경우에 사용하고 있다.
다시 우리 반 학생들의 점수를 살펴보자. 반 평균인 85.04점보다 높은 7명만 시험을 잘 보았다고 해석하는 것이 좋을까? 여러 명의 점수를 비교하는 것이니까, 84점(중간값, 23명의 점수 중 12번째) 이상을 받은 12명이 시험을 잘 보았다고 해석하는 것이 더 적합하지 않을까?
평균은 최댓값이나 최솟값에 의해서 출렁임이 커지는 값이다. 그리고 평균을 구하기 위해서는 모든 변량을 더하고 다시 나누는 계산까지 필요하다. 반면에 중간값은 숫자들을 점수 순으로 나열하고, 그중에서 한가운데에 있는 숫자를 고르기만 하면 된다. 우리는 언제까지 평균 때문에 스트레스를 받으면서 살아야 할까? 평균과 중간값을 때에 따라 적절하게 사용하면, 학생 때는 평균 점수, 성인이 되어서는 평균 월급과 평균 집값 때문에 스트레스를 받는 일은 조금 줄어들지 않을까?