brunch

You can make anything
by writing

C.S.Lewis

by 최바람 Oct 07. 2024

잘못 생각했다. 실전은 다르다.

feat. 방송대 베이즈 두번째 강의 그리고 중간 과제.

쉽게 생각했다. 어려울거라 생각하고 시작했지만 첫번째 강의가 너무 흥미진진했기에 잘해낼 수 있을거라는 믿음이 생겼다. 사실 달리 생각해보면 이러한 일들이 반복되며 실력이 향상되는 것이 아닐까 싶기도 하다. 


1. 오, 해 볼만 하다. 

2. 아니다, 이거 내가 생각한것과는 너무 다른데. 너무 어렵다. 

3. 오, 깨달았다.


1에서 3을 무한히 반복하는 마치 시지프스가 매일 아침 돌을 밀어올리는 기분으로. 


산이 너무 높아보이면 시작조차 못할테니. 천릿길도 한걸음부터 히말라야도 첫 한걸음부터.






지금은 방송대 중간고사(?) 기간이다. 이번 학기는 4개의 강좌를 듣고 있는데 중간평가를 3개는 과제물로, 1개는 출석수업이다. 베이즈는 중간 과제물을 제출하는 수업이었다.


좌절했다.


총 3개의 문제에 각각의 하위문제들이 존재했다. 분명 수업들을때는 쉬워 보였는데...

쉬워보였던 수식의 전개조차 쉽지 않았다. 과제를 끝낸 지금도 제대로 해낸 것인지 모르겠다. 보통 이런 느낌이 든다면... 무언가 놓치고 있는 것이다.




방송대 베이즈 데이터 분석 두번째 강의, 강의명 베이즈 추론.


두번째 강의는 베이즈 추론에 관한 강의였다. 첫번째 강의는 역사적 배경에 관한 것이었고, 두번째 강의는 베이즈 추론에 대한 첫 수업이었다.


앞으로 진행 될 수업에 따라 이해하는 정도가 달라질 수 있지만 이번에 들을 내용만을 토대로 이해한 바를 정리해 보아야겠다는 생각이 들었다.


베이즈 추론의 목표는 다음과 같다. 


* 목표: 자연의 법칙을 나타내는 모수의 분포를 관측치를 통해 추정하는 것.

* 구성요소: 사전분포, 확률모형(가능도), 사후분포

(단, 확률모형과 가능도 함수는 정확히 같은 개념은 아니다.)


사후분포 = 사전분포 * 가능도


* 사전분포: 관측치를 보기 전, 모수의 분포

* 확률모형: 관측치 x의 모수에 따른 조건부 분포. 

* 가능도: 모수의 그럴듯한 정도를 나타냄, 이때 관측치 x는 고정되어있음.

* 사후분포: 관측치를 본 후, 모수의 분포


관측치 x에는 x의 분포가 모수 theta에 따라 달라지기 때문에 관측치 x에는 모수 theta에 대한 정보를 가지고 있다. 사후분포에는 추정에 필요한 모든 정보가 담겨있다.


사후분포는 다음 관측치가 생기면 다음 관측치에 대해서는 사전분포가 된다.

관측하면서 모수의 추정을 업데이트 해 나간다.


즉, 모수의 분포는 고정되어 있지 않다. 이것이 빈도주의자, 기존에 우리가 알던 확률과 다른 점이다.



맨 첫 사전분포에 가정이 필요하다. 이부분이 빈도주의자 또는 다른 결정론자들이 좋아하지 않는 부분이 될 수 있을거 같다 생각했다.


우리가 만약 모수 theta에 대해 완벽히 무지하다면, 즉, theta1과 theta2가 발생할 확률의 대소를 구별할 수 없다거나 모수에 대한 아무런 가정, 정보를 주고 싶지 않을 때, 무정보 사전분포, 균등분포함수를 사용한다.


균등분포함수는 베타함수의 특수한 형태의 하나이다.


U(0, 1) = Beta(1,1)


베이즈 법칙 또는 정리라 함은 사후분포를 계산하는 수학적 방법이다.






사실 내가 쓰면서도 뭘 쓰고 있는지 모르겠다. 그래도 정리해 보고 싶었다. 나중에 강의를 들으면서 조금씩 더 이해가 깊어질테니까. 그리고 하나씩 깨닫는 과정의 즐거움을 남겨두고 싶었다. 그리고 강의를 들으며 요약했던 다음 필기를 올리고 싶었기도 하다.


베이즈 2강 수업 필기 노트




끝.

매거진의 이전글 제 가설에는 그게 필요하지 않습니다.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari