평균적인 스펙

"이번 생에 결혼은 틀린 것 같아요..." 하는 분들을 위해

by 김동수

#평균 #스펙 #커트라인 #당신도 할 수 있습니다!


인터넷 뉴스를 이것저것 보다 보면 재미있는 통계 자료를 정리하여 이야기하는 기사들을 자주 보게 된다. 그중 하나는 매년 나오는 결혼정보회사의 지난 1년간 결혼이 성사된 커플의 평균적인 스펙 이야기다. 딱히 자극적인 이야기가 따로 없어도 그냥 그 스펙을 보면서 사람들은 이러쿵저러쿵 잘도 이야기를 떠들어 댈 수 있으니, 나름 인기 있는 기사로 여기저기 커뮤니티에 퍼 날라져 돌아다닌다. 그 게시물에 달린 댓글을 보다 보면, 한 가지 흥미로운 반응을 공통적으로 발견할 수 있다. 바로, 본인은 저 평균에도 못 미친다며 "에효... 난 언제 결혼하나..." 혹은 "이번 생에 결혼은 틀린 것 같아요..." 하는 슬픈 자화상이다. 그런 분들에게 (위로가 될지는 모르겠으나) 위로를 조금 해준다면, 대부분의 사람들은 저 평균에 못 미친다! 정말로!


"평균적인 스펙"이라는 말은 21세기 들어서 참 많이 사용되는 말 중 하나다. 위에서 이야기한 결혼 시장뿐만 아니라, "저희 회사에 작년에 들어온 신입사원들의 평균적인 스펙은..."와 같이 취업 시장에서도 많이 쓰이며, "전 평범남이에요" 혹은 "전 훈남이 아닌 흔남(흔하게 보이는 남자)이에요"처럼 외모와 같은 정량적이지 않은 부분에까지 사용되고 있다. 이러한 용례들을 보면, 단어 그 자체로는 가치중립적인 말이지만 실제로는 이 정도는 되어야 한다는 커트라인의 의미로 활용되고 있다고 보인다. 물론 단어 그 자체를 실제와 다른 의미로 사용하는 것은 잘못된 일은 아니다. 원래 말이라는 것이 그런 것이니. 하지만, "평균적인 스펙"은 조금 다르다.


이해를 위해 간단한 예를 들어보자. 지난 1년간 결혼이 성사된 커플 중 남자의 평균 스펙이 연봉 8000만 원과 자산 2억 원이라고 하자. 이 평균 스펙은 어떻게 계산된 것일까? 지난 1년간 결혼을 한 남자의 연봉과 자산을 조사하여 각각 평균을 계산한 것이다. 문제는 이렇게 계산된 평균을 가지고, '아 결혼을 한 남자의 은 자산이 2억이 넘고 동시에 연봉이 8000만 원이 넘는구나...' 혹은 '연봉 8000만 원과 동시에 자산 2억 원은 있어야 결혼을 하는구나...' 하고 우리가 해석하고 있다는 점이다. 이 해석에서 잘못된 점은 2가지인데, 첫째는 평균(mean)을 중앙값(median) 혹은 최빈값(mode)처럼 해석하는 것과, 둘째는 독립적으로 계산된 항목들을 임의로 하나로 묶어서 해석하는 것이다.


첫 번째 문제는 "평균의 함정(tyranny of averages)"로 이미 널리 알려진, 극단적으로 높거나/낮은 아웃라이어들에 의해 발생하는 왜곡이다. 간단히 예를 들어 이야기하면, 지난 1년간 결혼을 한 남자가 100명이라 하자. 이 중 99명의 자산이 1천만 원 밖에 되지 않는다 하더라도, 남은 1명의 자산이 200억 원이라면 이 100명의 자산의 평균은 2억 원이 조금 넘는다. 80/20의 파레토(Pareto) 법칙을 굳이 이야기하지 않더라도, 연봉이나 자산과 같은 스펙의 주요 항목들은 극단적으로 높은 수준을 갖는 사람들이 거의 항상 포함되어 있고, 이들을 포함하여 계산한 평균은 우리가 사용하는 "일반적인 수준"이라는 의미의 평균과는 매우 다른 정보를 전달한다.


두 번째 문제는 첫 번째 문제에 비해 덜 알려져 있지만, 대부분의 사람들이 일상적으로 흔히 하게 되는 오류이다. 역시 간단히 예를 들어 이야기하면, 100명 중 어떤 50명의 연봉이 8000만 원이 넘고, 또 다른 어떤 50명의 자산이 2억 원이 넘는다고 하자. 이 정보를 가지고 "아 상위 50명은 연봉 8000만 원과 자산 2억 원을 갖추고 있구나"라고 판단하는 것은 맞지 않다. 그렇게 판단할 수 있는 유일한 경우는, 연봉과 자산의 상관관계(correlation)가 1인 경우인, 8000만 원 이상의 연봉을 받는 50명과 2억 원이 넘는 자산을 갖고 있는 50명이 동일한 경우이다. 즉, 독립적으로 계산된 항목들을 주어지지 않은 정보(1의 상관관계)를 함께 껴넣어 왜곡하고 있는 것이다.


만약 연봉과 자산이 완전히 독립적(independent)이라고 하면, 한 항목의 수준이 다른 항목의 분포에 영향을 미치지 않는다. 쉽게 예를 들어서 설명하면, 연봉과 자산이 완전히 독립적이라면, 저 100명 중 상위 연봉 50명의 반은 자산이 2억 원이 넘을 것이고 반은 2억 원이 안될 것이다. 또한, 하위 연봉 50명의 반은 자산이 2억 원이 넘을 것이고 반은 2억 원이 안될 것이다. 즉, 실제로 연봉이 8000만 원이 넘고 동시에 자산이 2억 원이 넘는 사람은 100명 중 25명뿐이다.


결혼정보회사에서 공개하는 "평균적인 스펙"의 항목은 비단 연봉과 자산뿐만이 아니다. 키와 외모, 직업, 나이, 성격 등 정말 다양한 항목들이 존재한다. 만약 5가지의 항목이 있고, 이 항목들이 모두 서로 완전히 독립적이라면, 5가지 항목 모두 중간은 넘는 경우는 0.5x0.5x0.5x0.5x0.5=0.03125 즉, 3%가 조금 넘을 뿐이다. 나머지 약 97%의 사람들은 5가지 항목 중 적어도 하나는 중간에 미치지 못한다. 게다가 이는 "평균의 함정"을 고려하지 않았을 때의 이야기이다. 평균 연봉이 8000만 원이고 평균 자산이 2억 원이라면, "평균의 함정"을 고려한 실제 중앙값은 이보다 확연하게 낮은 값일 것이다. 즉, 100명 중 실제로 연봉이 8000만 원이 넘는 사람은 50명보다도 더 적을 것이며, 자산이 2억 원이 넘는 사람 역시 50명보다도 더 적을 것이다. 그리고 연봉이 8000만 원이 넘고 동시에 자산이 2억 원이 넘는 사람은 25명보다도 더 적을 것이며, 5가지 항목 모두 "평균적인 스펙"의 평균을 넘는 경우는 3%보다도 더 적은 아주 극소수의 사람들일 것이다.


물론 이러한 해석에는 어폐가 있다. 현실에서 우리는 연봉과 자산은 꽤 높은 상관성을 가지고 있다는 것을 이미 안다. 높은 연봉을 가지고 있다면, 그만큼 자산을 더 많이 모아 왔을 것이다. 따라서 항목들이 모두 서로 완전히 독립적이라는 가정 역시 잘못된 가정이다. 그렇다면, 위의 예에서, 실제 연봉이 8000만 원이 넘고 동시에 자산이 2억 원이 넘을 확률은 보다 더 높아질 수 있다. 하지만 그렇다고 하더라도, 50%에는 절대 미치지 못한다. 더군다나 다른 항목들인 키와 외모, 그리고 성격과 같은 부분은 연봉이나 자산과는 상대적으로 덜 연관이 있을 것이다. 이러한 것들을 감안했을 때, "평균적인 스펙"에서 이야기하는 항목들을 모두 동시에 만족하는 사람은 여전히 50%보다 "훨씬" 적은 비율을 차지하며, 지난 1년간 결혼한 사람들의 대부분은 적어도 어느 한 가지 항목에서는 "평균적인 스펙"에 미치지 못한다.


모든 부분에서 중간은 한다는 것은 달리 말하면 어느 하나에서도 약점이 없다는 뜻이다. 어느 하나에서도 약점이 없다는 것, 이 얼마나 달성하기 어려운 일인가! 실제로 결혼 시장 혹은 취업 시장에서 실무를 담당하는 사람들은 "평균적인 스펙"이 상당히 높은 수준이라는 것을 이미 다 알고 있다. 위의 통계적 논의를 전혀 모른다고 하더라도, 실제 데이터를 눈으로 직접 보고 있는 사람들이기 때문이다. 그럼에도 불구하고 "평균적인 스펙"이라는 말이 흔하게 쓰이고 있고 알게 모르게 커트라인의 의미로 사용되고 있다는 것은 우리 사회 전체가 치열한 경쟁으로 인해 실제보다 너무 눈이 높아져 있다는 걸 의미할지도 모르는 일이다. 그렇다면, 소중한 가족 그리고 친구들에게라도 조금은 더 따뜻하게 말해보는 것은 어떨까.


"많이 바라지도 않아! 중간만 하는 사람을 데려와! 그게 뭐 어려운 일이니!" 네. 매우 어려운 일입니다.