brunch
매거진 딴생각

사랑을 숫자로 표현하다?

숫자에 가려진 진실

by 딴생각


2015년 서울시 교통사고 사망자 수 : 372명


위의 통계에서 사망자 수가 많다고 느껴지는가 많지 않다고 느껴지는가.

그것은 보는 사람의 관점에 따라 다르게 느껴질 것이다.

숫자 자체는 어떤 의미를 내포하지 않는다.

다만, 그 숫자가 어떻게 표현되느냐에 따라 새로운 의미를 가질 수도 있다.

예를 들자면 이렇게,


'서울시의 교통사고 사망자는 하루 1명 이상 발생합니다. 오늘 그 1명이 당신일 수도 있습니다.'


372명을 365일로 나누면 대략 하루 한 명꼴이다.

그 한 명이 당신일 수도 있다는 표현은 읽는 사람으로 하여금 경각심을 불러일으킬 수 있다.


이번에는 반대의 입장으로 생각해 보자.

교통사고 사망자 수가 심각하지 않은 수준으로 느껴지게끔 표현하려면 어떻게 해야 좋을까?

아마 이렇게 표현할 수 있을 것이다.


'한 해 서울시의 교통사고 사망자 수는 서울시민 중 0.004% 밖에 되지 않습니다.'


서울시 인구는 천만 명이 넘는다.

372명이라는 숫자를 천만 명 중의 비율로 표현하면 0.004%라고 하는 아주 초라한 숫자를 만들 수 있다.

이렇게 표현한다면 교통사고 사망자 수는 매우 미비한 것처럼 느껴지게 될 것이다.


이처럼 같은 숫자라도 표현에 따라 전혀 다른 의미를 가질 수 있다.

왜 이렇게 되는 걸까?

그것은 숫자의 문제는 아니다. 숫자를 위시한 의도의 문제다.

어떤 입장에 따라 숫자는 의도된 뉘앙스를 가질 수도 있기 때문이다.

따라서 숫자 혹은 통계를 볼 때는 그것이 포함된 맥락에 주의해야 한다.


예를 들어, 다음 통계를 보자.

얼마 전 KBS 뉴스(검경, 음주운전 처벌단속 강화)에서 나온 우리나라 교통사고 사망자 수는 인구 10만 명당 11.3명으로 OECD 회원국 중 1위라고 한다.

숫자가 거짓이 아닌 이상 틀린 말은 아니다. 하지만 이 숫자의 이면을 보게 되면 뭔가 이상한 점을 발견할 수 있다.


우선 OECD 회원국 중 한국, 일본, 미국만 비교해 보자.

각 나라에서 차량이 주행하는 연간 평균 거리는 서로 다르다.

일본은 약 1만 km이고, 미국은 약 1.6만 km이지만, 우리나라는 약 2.5만 km로 상대적으로 매우 길다.

차를 타고 이동하는 거리가 더 긴데 인구 10만 명당 사망자를 비교하게 되면 누가 불리해 질까?

정확하게 비교하자면 주행 거리당 사고 건수를 따져야 올바른 비교가 될 것이다.


또 다른 통계를 보자.

국가 간 통계 비교에서 자주 언급되는 것 중에 하나가 취업률일 것이다.

아래 그림의 빨간색 부분처럼 우리나라 취업률은 OECD 국가 중 꼴찌라는 표현을 많이 쓴다.

하지만 이것도 의심해 볼만 하다. 과연 그러한 결과의 근거가 합당할까?


취업률 꼴찌.jpg


우선, 모든 국가의 취업자 기준이 동일한 지 의심해 봐야 한다.

예를 들어, 무보수로 가족사업에 종사하는 경우를 따져보자.

이런 경우 우리나라는 주당 18시간 이상 일을 해야 취업자로 간주한다.

그러나 일본은 1시간 이상 일하면 취업자로 인정되고 미국은 15시간 이상 일하면 취업자로 인정된다.

이와 같이 국가 간 기준이 다른데 아무런 보정 없이 취업률을 비교한다면 이 또한 누가 불리해 질까?


이처럼 통계는 현실을 제대로 반영하지 못할 수도 있다.

아니, 정확하게 말하자면 통계에 표현된 숫자는 사실이겠지만 그 숫자로 표현된 맥락은 틀릴 수도 있다는 얘기다.

이러한 통계의 문제점은 아주 오래전부터 존재해 왔다.

영국 빅토리아 시대의 정치가인 벤저민 디즈레일리도 이런 말을 했다.


세상에는 세 종류의 거짓말이 있다. 그냥 거짓말, 새빨간 거짓말, 그리고 통계다.
- 벤저민 디즈레일리 -



평균의 함정


통계에 있어 잘못된 해석을 하는 사례 중에 가장 빈번한 것이 평균일 것이다.

지난 2015년 10월 25일, 한국경영자총협회는 현실적이지 못한 평균을 발표하는 바람에 곤욕을 치러야 했다.

그들이 발표한 4년제 대졸 신입사원의 첫 월급 평균은 무려 290만 9천 원이었다.

이 숫자가 발표되자 당시 여론은 믿을 수 없다는 반응이었다.


“도대체 어느 나라 통계냐?”

“우리나라라고 하기엔 현실성이 없다!”

"내가 받은 첫 월급과 괴리감이 너무 크다!"


왜 이런 일이 발생했을까? 그것은 평균을 추출했던 표본집단이 문제였다.

설문에 참여한 414개 업체를 대상으로 평균을 추출했는데, 그 업체들은 전부 100인 이상 규모의 기업이었다고 한다.

문제는 우리나라의 기업생태계를 보면 100인은 고사하고 49인 이하 규모의 소기업이 전체 기업 중에 99.3%를 차지하고 있다는 게 현실이다.

결국, 이 조사방식은 우리나라에서 상위권 1%에 해당하는 대기업을 대상으로 연봉을 조사한 셈이었다.


이런 현실에서 '대졸 신입사원 첫 월급 290만 9천 원'이라는 기사를 봤을 때, 대한민국 신입사원의 99% 이상은 엄청난 상실감을 느껴야 했을 것이다.


이처럼 통계 결과와 실제 체감하는 현실 사이에 괴리감이 발생하는 경우는 의외로 많다.

특히 아무렇지 않게 사용하는 평균에는 함정이 있을 수 있다.

평균을 무너뜨리는 이상한 값이 존재할 수 있는데, 그것을 가리켜 ‘아웃라이어’라고 한다.


벌거벗은 통계학.JPEG


‘벌거벗은 통계학’의 저자 찰스 윌런은 평균값에 있어 아웃라이어가 미치는 영향을 아래처럼 간단하게 설명해 준다.


“미국 시애틀의 중산층이 주로 찾는 술집에 10명이 앉아 술을 마신다고 하자.

그들의 연봉은 35,000달러이다. 그런데 그 술집에 빌 게이츠(아웃라이어)가 들어와서 그들과 함께 술을 마시게 되었다. 그의 연봉은 대략 10억 달러가 넘는다. 순간, 그 술집 손님 11명의 평균 연봉은 91,000,000 달러로 치솟게 된다.”


과연 이 연봉이 제대로 된 평균일까?

보다 현실적인 평균을 내려면 매우 예외적인 값 ‘아웃라이어(빌 게이츠)’는 제거하는 게 옳을 것이다.


이번엔 조금 독특한 예를 들어보자.

만약, 어떤 사람이 머리는 불 속에 있고, 발은 얼음 위에 있다고 하자.

이 사람의 평균 체온은 과연 몇 도 일까?

머리와 발은 마치 아웃라이어와 같은 상황이라고 봐야 하지 않을까?

어쨌거나 그의 평균 체온은 36.5가 맞다. 그가 평균적인 보통 사람이라면 말이다.


사람의 체온.JPEG



통계가 유발한 잘못된 동기


통계는 사실 관계를 밝히거나 의사결정을 위해 필요한 수단이다.

그리고 통계를 발표했을 때 우리가 얻고자 하는 것은 발표자의 의도대로 사람들이 움직이는 것이다.

하지만 그 의도가 좋은 것이든 나쁜 것이든 간에 현실은 전혀 다른 결과를 초래할 수도 있다.


숫자는 어떻게 세상을 지배하는가.jpg


로렌조 피오라몬티의 저서 '숫자는 어떻게 세상을 지배하는가'에는 통계가 의도치 않은 동기를 유발했던 두 가지 사건을 보여준다.


첫째, 미국에서는 한 통계 발표가 의사들을 삐뚤어지게 만들었다.

수술을 받고 목숨을 건진 환자들의 수치와 목숨을 잃은 환자들의 수치를 비교한 것이었다.

결국 이 통계는 알고자 했던 진실과는 매우 다른 방향으로 의사들을 동기유발했다.

즉, 의사들이 점점 어려운 수술을 맡기 싫어하게 되었다.

실패할 확률이 높을 경우 환자를 돌려보내거나 아예 예약을 받지 않기도 했다.

이러한 이유로 목숨을 잃은 환자는 결국 누구의 책임인가?


둘째, 영국에서는 학교를 평가하여 순위를 매기는 바람에 곤욕을 치러야 했다.

원래는 표준화된 시험 성적에 따라 학교 간 경쟁을 촉진하려고 했으나 문제는 학교들이 시험 결과에만 집착하게 되었다는 사실이다.

결국 이 제도 때문에 학교들은 순위에 악영향을 끼친다는 이유로 하위권 학생들을 배제하기 시작했다.

그렇게 학교로부터 버림받은 학생들은 누구의 책임인가?


진실을 알기 위해 측정했던 숫자가 오히려 진실을 기만하는 현상은 너무나도 많다.

숫자가 보여주는 적나라한 사실성에 우리는 눈이 멀지만, 결국 숫자는 진실의 단편일 수밖에 없다.

이것은 코끼리를 더듬는 여러 명의 장님과도 같다.


어떤 장님은 코끼리의 코를 만지며 코끼리가 뱀처럼 가늘다고 말한다.

어떤 장님은 코끼리의 다리를 만지며 코끼리가 나무처럼 묵직하다고 말한다.

어떤 장님은 코끼리의 귀를 만지며 코끼리가 접시처럼 넓적하다고 말한다.

각각의 장님들이 만진 것은 분명한 코끼리다. 하지만 코끼리의 진실을 말한 장님은 아무도 없다.


우주의 진실을 측정하고자 했던 알버트 아인슈타인도 이런 말을 했다.


중요한 모든 것을 계산할 수 있는 것은 아니다. 또한, 계산할 수 있는 모든 것이 중요한 것도 아니다.
- 알버트 아인슈타인 -



사랑을 측정한다면?


분명, 훌륭한 인재로 키우기 위해서였을 것이다.

그래서 학생들에게 시험 성적을 강요했더니 학생들이 시험에 나오는 것만 공부하려 든다면 학교는 원하는 목적을 달성한 것일까?


직원들을 제대로 평가하기 위해 생산성과 관련된 모든 지표를 만들어서 적용했다.

그랬더니 직원들이 전부 생산성 지표의 노예가 되었다면 회사는 원하는 목적을 달성한 것일까?


빅데이터가 발전하면서 우리는 예전보다 훨씬 많은 것들을 측정할 수 있게 되었다.

그 말을 돌려서 표현하자면, 우리는 훨씬 많은 것들을 오해할 수 있게 되기도 했다.

최근 빅데이터는 인간의 행복도 측정할 수 있다고 한다.

이제는 사랑도 측정할 수 있지 않을까?


우리는 커플이 함께 보내는 시간을 측정하고, 그들이 나누는 대화를 분석하여 수치화하고, 외출하는 횟수를 헤아리고, 그들이 가진 재산을 파악하고, 데이트 비용의 증감을 분석하고, 섹스를 갖는 횟수를 통계 낼 수 있다.

그러나 그 모든 숫자의 합이 사랑은 아니다.


그것이 사랑이라고 착각하는 순간,

우리는 시험에 나오는 것만 공부하는 학생이나 다를 바 없다.

동시에 생산성 지표의 노예와 다를 게 없다.


때로는 누군가를 마주 보며, 진심을 담아 쓴 도화지를 한 장 한 장 넘기는 것이 사랑일 수도 있는 것이다.


러브 액츄얼리.jpg 영화, '러브 액츄얼리 Love Actually'에서 그 유명했던 프로포즈 장면.


숫자는 우리에게 진실을 말해 주지 않는다.

단편적인 사실만을 보여줄 뿐이다. 마치 사랑을 통계 내는 것처럼.

그것을 이용해 어떤 의도를 가진 자가 당신에게 매우 아름다운 숫자를 보여줄 수도 있다.


숫자를 보는 안목은 숫자 자체에 있지 않다.

혜안을 가진 자는 숫자에 가려진 뒤를 본다.

진실은 항상 숫자 너머에 있으니까.


keyword