중학교 수학 수업 - 겨울 (5)
통계는 중학교 1학년에 이어서 중학교 3학년에서 다시 배웁니다.
중학교 1학년, 대푯값, 줄기와 잎 그림, 도수분포표, 상대도수를 배우면서 '자료의 수집과 정리'에 집중하고,
중학교 3학년, 평균에 기반하여 산포도인 분산과 표준편차, 상자그림, 산점도를 배우면서
'자료의 분포'를 이해하고, '두 자료 사이의 상관관계'에 집중합니다.
통계가 얼마나 강력한 도구인지 우리는 늘 목격하지요.
글로벌 패션 브랜드인 '자라(ZARA)'는, 통계를 경영의 핵심 엔진으로 사용하면서,
'재고 없는 패션'이라는 거의 불가능에 가까운 도전을 성공적으로 시도하고 있다고 합니다.
'글로벌 OTT 서비스'인 '넷플릭스'는 통계적 예측 모델을 가장 잘 활용하고 있는데,
통계에 기반하여 사용자가 좋아할 만한 콘텐츠를 썸네일로 보여주어,
재생 버튼을 더 많이 누르게 하고 있다고 합니다.
'유튜브'가 통계를 활용하는 것은, 두 말할 나위도 없지요.
학생들이 말하길, 자기의 취향을, 자기보다 '유튜브'가 더 잘 알고 있다고 하네요.
시간을 거꾸로 돌려서, 18세기와 19세기의 통계는 천문학과 사회학이라는 다른 두 분야에서 유래했습니다.
두 분야의 공통점은 불완전한 관찰 데이터에서 유용한 정보를 추출해야 한다는 것이었지요.
18세기 천문학자들의 가장 큰 고민은, '관측 오차' 였습니다.
똑같은 별을 보는데, 어제 잰 수치와 오늘 잰 수치가 미세하게 달랐던 것이죠.
그렇다면 '가장 신뢰할 수 있는 수치는 무엇인가?'라는 천문학자의 고민을 해결한 건,
관측한 여러 자료들의 분포, 즉 평균을 중심으로 한 정규분포를 살펴보는 통계적 행위 였습니다.
19세기 사회학은, 천문학에서 쓰던 '오차 이론'을 인간 사회에 적용하면서 완전히 새로운 국면을 맞이했는데, 그러한 발전을 가능케 한 사람이, 벨기에 사회학자 아돌프 케틀레(1796~1874) 입니다.
그는 수학과 천문학을 전공하다가 통계학을 접하고서는 본격적으로 국가 통계 데이터를 수집하면서
개인이 자유 의지로 행동하는 것 같지만,
매년 결혼율, 자살률, 범죄율이 놀라울 정도로 일정하다는 것을 밝혔습니다.
그리고는 국가 통계의 기본이 되는 '평균인(L'homme moyen)'의 개념을 처음으로 제시했습니다.
덧붙여 그는 인간의 성장도 통계적으로 관찰하여 체중은 키의 제곱에 비례하여 증가한다는 사실을 입증하여
오늘날까지 잘 사용하고 있는 'BMII(Body Mass Index) 지수', 원래 이름은 '케틀레 지수'를 고안했습니다.
'평균인'은 금세 '표준(standard)'이 되고, 대량 생산의 산업혁명 시기와 맞물려
옷 사이즈, 가구의 높이, 계단의 폭, 문의 넓이 등등 에서 '정상적인 기준'이 되었습니다.
국가는 통계 조사를 통해 '평균인'의 삶에서 벗어난 집단, 빈곤층이나 범죄 위험군을 파악하고,
이들을 관리하거나 구제하는 정책을 펼치기 시작했습니다.
통계 수업 시간에 한 번쯤은 그의 이름을 언급해야 할 사람, 바로 아돌프 케틀레 입니다.
그런데 사실 학생들에게 통계를 가르칠 때, 늘상 마음에 걸리는 게 있습니다.
'2022 수학과 교육과정'에서 통계 단원의 교수∙학습 방법 및 유의사항에서 이렇게 제시합니다.
"실생활에서 수집한 자료를 정리하고 해석할 때 비판적인 태도를 갖게 하고,
통계의 유용성과 함께 통계 자료의 오용과 남용의 가능성을 인식하게 한다."
통계는 복잡한 세상을 숫자로 요약해 주는 강력한 도구이지만,
통계가 틀릴 수도 있음을 늘 염두에 두어야 한다는 것입니다.
통계적 예측이 빗나갔던 사례들도 대단히 많습니다.
대표적으로 '미국 대선' 이야기입니다.
1936년 미국 대선에서 당시 유명한 잡지사인 '리터러리 다이제스트'는
무려 230만 명이라는 엄청난 응답을 받아서
공화당 알프레드 랜던 후보가 압도적 승리를 거둘 것이라고 발표했습니다만,
실제 결과는 민주당의 프랭클린 D. 루스벨트가 62%로 압독적으로 당선되었습니다.
2016년 미국 대선에서도, '힐러리 클린턴 vs 도널드 트럼프' 에서
'뉴욕타임스'를 비롯 대부분의 여론 조사는 힐러리 클린턴의 압승을 예측했습니다만,
실제 결과는 도널드 트럼프의 당선이었습니다.
이때 여론 조사를 틀리게 만든 원인이, '샤이 트럼프'(Shy Trump)' 였다는 것입니다.
사회적 비판을 우려하여 여론 조사에서는 '모르겠다'거나 '힐러리 클린턴을 지지한다'라고 얘기해 놓고는
실제 투표장에서는 트럼프를 찍은 '샤이(shy)'한 투표자들이 많았다는 것입니다.
심지어 통계를 악의로 이용하는 거짓말쟁이도 물론 분명 있지요.
"숫자 자체는 거짓말을 하지 않지만, 거짓말쟁이들은 숫자를 이용한다."라는 말도 있으니까요.
통계 수업에서 특히 '평균의 함정'에 대해서도 꼭 짚고 넘어갑니다.
예를 들어 어느 축구팀 선수 6명의 연봉 데이터가 3억, 3.5억, 4억, 4.5억, 5억, 580억 이라고 할 때,
평균 연봉은 100억입니다만, 5명의 연봉이 모두 5억 이하인데, 평균이 100억이라니요.
이때 평균 100억은, 결코 6명의 연봉을 대표하지 않습니다.
이렇듯 '평균의 함정'이 발생하는 주요 원인은,
평균은 데이터에 있는 극단적인 값에 민감하다는 것입니다.
사회 시간에 배웠듯이, 1인당 GDP(Gross Domestic Product)는 높지만,
미국, 사우디아라비아, 남아프리카 공화국 등등 소득불균형이 심한 나라들이 많습니다.
그래서 통계 수업 시간에는 '대푯값'으로 '평균'을 사용할 수 없는 경우들에 자주 주목하게 합니다.
'수학 시험,
나의 목표는 늘 평균 이상
나의 점수는 늘 평균 이하
세상에서
제일 먼저 없애고 싶은 것은,
평균, 너다.’
서윤이가 쓴 수학 시(詩) '평균이라는 슬픔' 입니다.
'평균'은 우리에게 아주 친숙한 개념입니다만, 그래서 무섭습니다.
어렸을 때부터 '평균'은 늘 공정한 얼굴을 하고, 우리에게 다가왔지요.
열다섯 살 평균키는 160cm,
4인 가구 평균 소득은 570만원,
성인의 평균 심박수는 분당 60~100회,
평균 가족수는 4명,
평균 수명은 80세.
'평균'이 마치 정답인 것처럼 제시되고 나면,
그 즉시 ‘나는 평균 이하다’, ‘너는 평균 이상이다’가 결정되어 버립니다.
아울러 정상/비정상, 우/열이 금세 정해지는 것 같지요.
최근에는 통계에 대한 우려의 목소리로,
'평균의 함정'(샘 L.새비지), '벌거벗은 통계학'(찰스 윌런), '새빨간 거짓말, 통계'(대럴 허프),
'평균의 종말(토드 로즈)' 등등 책들이 출간되고 있습니다.
특히 '평균의 종말'은 '사제동행 독서 활동'의 일환으로 학생들과 교사들이 함께 읽은 책이기도 하지요.
평균에 맞춘 비행기 조정석을 만들었을 때, 그 조종석에 딱 맞는 조종사는 오히려 거의 없다,
평균에 맞는 신체 치수를 가진 '노르마'와 비슷한 신체를 가진 여성도 거의 없다는 것입니다.
'표준'이라고 믿었던 평균은 실제로는 아무것도 대변하지 못하는 허상이라는 것입니다.
'평균의 종말'에서는 특히 교육 시스템에서 평균 개념의 위험성을 날카롭게 지적합니다.
대안으로 '개별성의 원칙'과 '맥락성의 원칙'과 '경로의 원칙'을 제안합니다.
개개인의 다양성과 복잡성을 이해하고,
학생이 처한 특수한 상황을 고려하고,
그 과정에서의 경로나 속도가 학생마다 다를 수 있음을, 저자 토드 로즈는 자신의 경험에 비추어 강변합니다.
“평균은 편리한 허구일 뿐이다. 진정한 가치는 개인의 다양성과 고유성에 있다.”
서윤아, 네 수학 점수가 평균 이하이지만,
네가 칠판에 그린 친구 얼굴 그림은,
네가 쓴 시 한 구절은,
네가 베푼 친구에 대한 도움의 손길은,
너의 평균 이하의 수학 시험 점수보다도 훨씬 더 큰 의미가 있단다.