「현실의 다양한 문제들을 숫자로 생각한다!」
이 책의 소제목은 「현실의 다양한 문제들을 숫자로 생각한다!」이다.
이 책은 대학 1학년 학생들이 수치적 분석 또는 양적 추론을 사용해 실행할 문제에 답할 수 있도록 고안된 강좌용 교재이다. 목적은 기초 수학 능력을 활용해 신중하게 추론하고 양적 논증을 할 수 있는 역량을 개발하는 것이다. 특히 데이터 분석에 관심이 있거나 공부하는 사람은 질문을 명확히 하는 방법, 근거를 제시하는 방법, 필요한 데이터를 구성하는 요령 등을 알아가는 데 많은 도움이 될 책이다.
책에서는 대학은 다닐 만한 가치가 있을까? 쌀에 있는 비소 성분을 걱정해야 할까? 오염 물질을 재활용할 수 있을까? 개인금융, 공중보건, 사회 정책과 같은 현실적인 질문에는 진지한 데이터 기반 분석이 필요하다. 이와 같은 질문에 답할 수 있도록 양적 추론 도구를 제공한다.
질문을 명확히 하고 편견을 인식해 예방하고, 관련 요인을 분리하고, 데이터를 수집하고, 해석을 위해 수치적 분석 등 그 방법을 모델링 한다. 본문과 부록에 많은 질문과 문제 해결 방법은 대수, 함수, 그래프, 확률과 같은 수학 영역을 배우는 데 도움이 된다.
내용은 1장 대학은 다닐 만한 가치가 있을까? 2장 미국 남북 전쟁에서 얼마나 많은 사람이 죽었을까? 3장 이 자동차 가격은 얼마일까? 4장 우리는 쌀에 있는 비소를 걱정해야 할까? 5장 미등록 이민자가 경제에 미치는 영향은 무엇일까? 6장 의료 보험에 가입해야 할까? 7장 오염 물질을 재활용할 수 있을까? 8장 밤하늘은 왜 어두울까? 9장 별들은 낮에 어디로 사라질까? 10장 두통에 약을 먹어야 할까? 와 부록은 수리 능력, 산술, 대수, 기하학, 단위 및 과학적 표기법, 함수, 확률, 통계, 추정 등이다.
[두통에 약을 먹어야 할까?]
이 질문을 수학적으로 해결할 수 있을까? 하는 의문이 들었다. 이 질문에 답을 수학적으로 표현하기 위해서 ‘약이 효과적인지 알아보기 위해 모의 임상 시험 데이터를 분석하고 상당한 확률과 통계가 수반된 관련 지식을 보강한다. 그런 다음 약의 비용 대비 효능을 평가할 수 있다’라고 제시한다. 그 방법으로,
이 질문이 우리가 바라는 효과를 얻을 수 있는지 그 가능성을 평가하는 것임을 인식한다.
표본 크기가 커지면 표본 평균의 확률은 정규 분표를 따른다.
치료 집단과 위약 집단으로 나누어 임상 시험을 고안하고, 두 집단이 피험자를 대상으로 두통이 사라지는 데 걸리는 시간을 측정한다.
정규 분표를 사용하여 치료 집단의 두통이 우연히 더 짧은 시간에 사라질 확률을 추정한다.
약이 효과적인 것을 알더라도 여전히 약의 비용이 두통 시간을 감소한 만큼의 가치가 있는지 결정할 필요가 있다.
생각할 때 고려해야 하는 것.
약을 먹을까 말까? 간단한 질문처럼 보인다. 한 번 먹어보고 효과가 있는지 확인하면 된다. 약은 비용이 든다. 단지 10% 정도의 시간 단축 효과라면 차라리 두통을 참는 것이 나을 수 있다. 경제학자는 통증을 없애는 보상과 효과가 없을 수도 있는 일에 돈을 쓰는 위험을 저울질해야 한다고 말할 것이다.
약을 먹으면 효과가 있을 수도 있고, 아무 효과가 없거나 더 나쁜 결과를 초래할 가능성도 있다. 하지만 단지 두 가지 선택만 있다고 해서 두 사건이 일어날 가능성이 동등하다는 것은 아니다. 이렇게 서로 다를 결과는 무언가의 확률로 발생한다.
가능성이란 무엇인가?
확률이나 통계에서 대부분 문제가 그렇듯이, 동전 던지기를 통해 이 문제의 본질을 미리 알 수 있다. 공정하다는 것은 앞면과 뒷면이 나올 가능성이 동등하다는 것이므로 확률은 1/2 또는 50%이다.
약물의 효과 또는 작용 가능성을 확인하기 위해 약물 시험을 진행할 때 많은 피험자를 대상으로 한다. 특정 결과가 연속으로 발생할 가능성이나, 그저 그런 평균 결과가 나올 가능성 등과 같은 과정을 여러 번 반복한 다음에 확률을 고려해야 한다.
임상 실험에 얻은 긍정적인 결과가 단지 우연히 일어난 것인지 아닌지를 판단하기 위해 동전을 여러 번 던질 수도 있다. 그런데 앞면이 절반 정도 나오지 않았다면 이런 의문이 생긴다. 동정이 공정하지 않고 오히려 무게가 쏠려 있다는 결론을 내릴 수밖에 없지 않을까? 이 질문에 답하기 위해서 확률을 계산해야 한다.
공정한 동전이라면 서른 개를 던져서 앞면이 열두 개 이하로 나올 확률이 18%에 불과하다는 계산이 나온다. 냉철한 분석을 위해 신뢰 수준을 95%로 설정해야 결론을 더 확신할 수 있다. 이러한 유형의 논증을 ‘가설 검정’이라고 한다.
이제 약이 두통에 효과가 있는지 평가하는 방법을 알아낼 수 있다. 두통을 앓고 있는 다수의 ‘무작위’ 사람들을 대상으로 시험하고 그 효과를 측정할 것이다. ‘두통이 사라진다면 우리 약이 좋다는 것일까?’ 그렇지 않다! 치료하지 않더라도 어느 순간 두통은 사라진다. 그렇다면 두통약의 역할은 무엇일까? 추측하건대 약이 두통을 더 빨리 가라앉게 할 것이다. 환자가 약을 먹은 후 기록한 ‘기분이 좋아지는’ 시간과 약을 먹지 않은 상태에서 기분이 좋아지는 시간을 비교할 수도 있다.
결론
질문에 양적으로 답하면, 두통약 열 알의 비용이 25달러라고 하고 두통 시간이 평균 1/4분 정도 단축될 가능성이 매우 크다고 단순하게 가정해 보자. 그러면 기본적으로 4분간 통증 감소를 위해 한 번에 2.5달러 비용이 든다. 여러분은 약을 먹을까? 그것은 현금 유동성, 즉 주머니 사정과 고통에 대한 인내심에 달려 있다. 정답은 없다. 개인적인 선택이지만, 우리가 분석한 후 그 선택은 정보에 근거한 것이다.
[대학은 다닐 만한 가치가 있을까?]
먼저 질문에 반응하는 우리의 감정적인 대응을 살피고, 질문을 해석할 수 있는 다양한 방법을 기록한다. 경제성 분석을 시작한 다음, 필요한 데이터를 확인하고 수집한 대학 진학과 비진학을 비교한다. 단계별 요약은
이 질문에 대해 재정적 측면만 고려하기로 하고, 전체적인 관점에서 불충분할 수 있음에 주의한다.
대학의 비용과 편익, 즉 등록금 비용과 미래 소득을 파악한다. 비진학자도 마찬가지다.
대학 졸업자와 비졸업자를 대상으로 지출과 일반적인 급여를 조사한다. 출처의 신뢰성과 데이터의 한계를 논의한다.
대학 진학과 비진학을 대상으로 평생 수익을 합산한다.
대학 진학이 비진학보다 평생 수익이 많다는 것을 알게 되며, 확신을 두고 긍정적으로 답을 한다. 단, 사립대학교와 국립대학교의 비용 차이는 생각하지 않는다.
◈ 질문을 바라보는 방식,
질문이 명확화, 여기서는 ‘노스웨스턴대학교의 학부 교육 과정’을 대상으로 한다. 질문은 ‘재정적인 관점에서 노스웨스턴대학교는 다닐 가치가 있을까?’로 명확하게 한다.
◈ 답 구상하기,
질문을 특정했으니, 노스웨스턴대학에 입학했을 때의 순 비용 또는 편익에 대한 추정치를 찾는다. 비용-편익 분석은 경제 이론의 기본 구성 요소이다. 모든 결정은 여러 가지 선택에 따른 예상 순 이득을 비교한다는 관점에서 접근할 수 있다.
◈ 모델 구축,
어떤 요인을 탐구할 것인가? 문제에 관한 보다 분명한 관점과 답을 위한 몇 가지 대응을 준비해 브레인스토밍 세션을 시작한다. +는 수익, -는 비용을 나타내고, ±는 불분명한 것을 나타낸다.
-수업료, -숙식비, -교재비, +소득, 직장 급여, -대학에 다니는 동안 생긴 손실, +사회적 네트워크 형성 기회, -기타 숨은 비용, ±간과한 혹은 미확인 요인 등.
◈데이터,
이제 조사를 시작해서 수업료, 숙식비 등 실제 배용을 알아봐야 한다. 이 과정이 가장 어렵다. 때로는 데이터가 회사 비밀이거나 쉽게 알아내기 매우 어렵거나, 전혀 구할 수 없는 때도 있다. 다양한 출처에서 데이터를 찾다 보면, 신뢰할 수 있고 대표성이 있으며 편견이 없다고 여겨지는 수치만 선택하게 된다. 정학하고, 질문과 관련이 있으며, 편견이 없는 사실만 필요하다.
-학업 비용은 노스웨스턴이 제공한 수치를 사용한다.
-최근 노스웨스턴 졸업생의 급여는 국가교육통계센터 데이터에 따라 초봉 48,500달러로 가정한다.
-최근 고등학교 졸업자의 소득은 국가교육통계센터 데이터를, 실업률은 노동통계국 데이터를 사용한다.
-대학 졸업자는 45년, 대학에 다니지 않은 사람은 49년 근무한다고 가정한다.
-학위 시간 및 학위 취득률은 노스웨스턴 수치 자료를 사용한다.
◈ 모델 구축하기,
어떤 것을 더 추가할까?
첫 번째 근삿값, 간단한 모델에 수치를 대입해 보자. 오류의 원인을 찾아낸다.
-급여 수준은 개인마다 다르다. 데이터로 정확하게 모델링할 수 없다.
-급여 데이터는 평균값이 아닌 중앙값으로 제시되었다.
-돈의 가치는 시간이 지남에 다라 변한다.
-대학 배용은 학자금 대출 조건에 따라 달라진다.
-학사 학위 소지자가 아닌 사람의 직무 교육 비용을 고려하지 않았다.
-고소득자가 저축 및 투자를 할 경우 소득(손실)이 더 증가할 수 있다.
-비졸업자의 소득에 관한 모든 수치는 근로자 전체의 평균이다. 사람마다 다를 수 있다.
-비졸업자의 실업률은 학사 학위 소지자에 비해 높다. 등
◈ 대안 모델
지금까지 한 분석이 우리가 개발할 수 있는 유일한 접근 방법은 아니다. 예를 들어, 질문을 현금 흐름에 관한 문제로 바라볼 수 있다.
◈ 결과 분석
작업 검토, 현실에서 작업 검토에 필요한 팁.
-다른 방법으로 다시 한다.
-현실성을 검토하기 위해 메모지에 간단하게 계산해 추정치를 구한다.
-결과가 타당한지 확인하려면 여러 수치로 시뮬레이션하고 모델에 적용한다.
◈ 현실성 검토
만약 60세에 대학 입학을 생각하고 있다면, 이 결론을 적용하기 힘들 수 있다. 또한 이미 높은 임금을 받는 직업을 가지고 있지만, 노스웨스턴에서 철학 공부를 시작하려고 직장을 그만둘 생각을 한다면 이 결론은 적용되지 않는다. 이런저런 경우도 있다.
전혀 계산 불가능할 것 같은 주제를 수학적 계산으로 답을 제시하고 있다. 재미있는 책이다. 현재 고민하는 문제가 있다면, 이런 방식으로 질문하고 풀어보면 좋을 듯하다.
책 소개
『양적 추론』 에릭 재슬로 지음. 김혜영·최병문 옮김. 2022.12.223. 청아출판사. 456쪽. 25,000원.
에릭 재슬로 Eric Zaslow.
다트머스 대학교에서 수학과 물리학 복수 전공, 하버드대학교에서 물리학 석·박사 학위 취득. 노스웨스턴대학교 수학과 교수, 우수 교수상, 교육 과정 개발상 등 수상. 저서, 『얼티밋 기술과 전술』 등.
김혜영. 이화여대 물리학과 졸업, 같은 대학원에서 물리학으로 석·박사 학위 취득. 한국체대 교수. 저서, 『고학 산책, 자연과학의 변주곡』 등.
최병문. 공주사범대학 수학교육학과 졸업. 고려대 대학원 수학과에서 석·박사 학위 취득. 대전대 혜화리버럴아츠칼리지 교수. 저서, 『암호의 세계』 등.
#양적추론 #에릭 지슬로 #김혜영 ##최병문 #청아출판사 #물리학 #수학 #문제