feat. 방송대 수리통계학 1강
역시나 감탄을 금치 못했다.
방송대 수업을 듣다보면 깜짝깜짝 놀랄 때가 많다.
내가 궁금해 하던걸 저리도 쏙쏙 집어내어 설명해 주시다니.
들을 때는 물론 다 알거 같다.
뒤돌아서면 까먹을테지만.
그래서 서둘러 정리해 보기로 했다.
수리통계학 첫번째 강의다운, 역사적 배경과, 무엇을 배우고자 함인지에 대한 수업에 대해서.
수리통계학 강의의 목적, 목표는 통계적 추론의 구조를 이해하는 것이다.
따라서 크게 두부분으로 나눌 수 있는데 처음은 확률분포를 이해하는 것이며 두번째는 추론 이론을 이해하는 것이다.
달리 말하자면, 통계학의 원리를 수학과 시뮬레이션으로 일반화한 것이다.
세상은 불확실하다. 확실한건 불확실하다는 사실 밖에 없다. 그리고 그것을 확률로 표현할 수 있다.
세상의 일부를 측정, 이를 바탕으로 불확실한 세상을 추론한다.
"통계학자는 생각하는 방법, 자기 견해를 내세우는 방법을 변화시켜서 세상을 바꾸었다."
불확실성, 불완전성, 변동성을 포함한 데이터로부터, 지식을 일반화하고 효율적으로 사용할 수 있도록 하는 학문. 그럼 어떻게?
*모집단(Population) : 관심 대상 전체
*표본(Sample): 모집단의 일부
*빈도론적 해석: 동일 사건 무한히 반복될 때, 그 사건이 일어나는 비율(대수의 법칙)
*인식론적 확률: 외부의 속성이 아니라 개인적 믿음
*확률변수(Random Variables): 사건을 숫자로 바꿔주는 함수. 관측치, 데이터와 다름 주의.
*확률분포: 몇개의 모수(parameter)가 포함된 수학적 함수로 표현.
*통계량(Statistics): 표본의 함수
*표본분포(Sample Distribution): 통계량의 분포
*통계적 추론: 모집단에서 추출한 표본으로부터 모집단의 확률분포(모수)를 추측.
*추정: 표본으로 모집단에 대한 일반적 결론을 도출하는 방법.
*검정: 모집단에 대한 주장에 대해 표본을 통해 그 주장의 타당성을 점검하는 방법.
--> 모수의 불확실성 포함하면 베이즈주의자, 불포함하면 빈도주의자(모수가 변하지 않고 일정함을 의미하는 듯).
*가능도 함수: 결합확률분포. 데이터, 관측치에 대한 함수가 아니라 "모수"에 관한 함수로 바꿔줌.
*충분성의 원리(Sufficiency Principle) : 표본을 요약한 통계량이 모수에 대한 정보를 잃지 않는다는 원리.
*제1종의 오류: 귀무가설이 참인데 기각하는 오류.
*제2종의 오류: 대립가설이 참인데 기각하는 오류.
--> 최적의 검정은 주어진 제1종의 오류 기준 아래에서 제2종의 오류를 최소화하는 검정
확률변수니, 관측치이니, 통계량이니, 추정이니, 검정이니, 가능도함수이니, 제1종오류니, 제2종오류니 헷갈리는 부분들이었는데 한 번의 수업으로 정리되었다.
하지만 또 좋았던 부분이 있었는데 통계학의 역사에 대해 설명해 주신 부분이었다. 통계학의 시작과 발전, 그리고 변화까지 정리해 주셨는데 - 베이즈 1강처럼 - 그부분이 또한 너무 좋았다.
역사 이야기를 듣다보면, 법칙이니 규칙이니만을 공부할 때 보다, 훨씬 더 생생하게 와닿는다. 어떠한 논쟁이 벌어졌을지, 그리고 어떠한 과정을 거쳐 그러한 법칙, 규칙들이 등장하게 되었는지, 머릿속에서 살아움직이는 것(?) 같은 기분을 느낀다.
아무튼 글로 깔끔하게 정리하고 싶었는데, 그게 그리 쉽지 않을거 같다.
직접 강의를 듣는 것 만큼 좋은 일은 없겠지만 그래도 공부하는 사람이라고 제목을 달았는데 내 나름 정리를 해야하지 않을까 싶었다.
그래서 손으로 정리하고 필기 노트를 올리기로 마음먹었다.
통계학 시대별 주요흐름
통계 관련 학자
브런치 덕분에 한번 더 듣고, 한번 더 들었다. 감사하다.
다시 들어도 재밌었다.
역사 이야기도 재미있지만, 과학 역사의 이야기 또한 흥미롭고 재밌다.
앞으로 또 어떤 수업이 나를 기다리고 있을지 기대가 된다.
안녕. 끝!