feat. 베이즈 & 라플라스
한동안 베이즈가 인기였다.
내가 읽는 논문들에 베이즈 추론을 기반으로 한 논문들이 한동안 대량으로 출판됐었다.
요즘은 생각보다 줄었지만 그래도 이따끔 눈에 띄는 논문들이 나오고 있다.
처음 베이즈 이론을 읽었을 때는 이게 어려울게 뭐가 있는가 그냥 분모, 분자 넘겨서 곱해주는 것이 아닌가라고 아주 단순하게 생각했었지만 그런게 아니었다. 역시 겉핡기만 하면 여러문제가 생긴다.
아무튼 두려움을 극복하는데에는 수업만큼 좋은게 어디있을까.
방송대 통계학과 4학년 과정에 베이즈 과정이 생겼고 나는 한치의 망설임도 없이 신청하였다. 그리고 역시나 1강부터 내 마음을 흡족하게 해 주었다.
빈도주의자 vs. 베이지안 주의자
통계에서 확률을 바라보는 관점이 크게 두가지가 있는데 확률을 사건의 빈도로 보는 빈도주의적 관점과 확률을 사건 발생에 대한 믿음 또는 척도로 보는 베이즈 주의자(베이지안)가 있다.
동전을 던지면 앞뒤가 나올 확률이 반반이며 앞에 던졌던 동전의 앞뒤와 상관없이 현재 시행할 동전을 앞뒤가 나올 확률을 변하지 않는다. 이는 앞의 사건과 뒤의 사건이 독립(independent)이라는 뜻이며 앞뒤가 나올 확률은 변하지 않는다(Identical)는 것을 믿고 있다는 뜻이다. 확률을 이런 관점에서 보는걸 빈도주의자라고 하며 앞뒤 사건이 독립, 그리고 그 확률을 일정하게 변하지 않고 존재한다고 믿는 법칙이 IID(Independent Identically Distribution) Assumption이다. (혹시 제가 잘못 이해하고 있다면 언제든지 말씀해 주세요...)
대부분은 이러한 가정 아래서 통계학이 발전해 왔다. 이에 벗어나는 종류의 데이터들이 있는데 시계열 데이터의 경우가 그러하다. 시계열 데이터의 경우 앞의 사건에 뒤의 사건이 영향을 받아 조건부 확률이 변하게 된다. 만약 앞에 있는 사건에 의해 다음 사건의 확률이 변하지 않는다면 IID가 성립하는 특수한 형태의 시계열 데이터가 된다. 즉, 시계열 데이터의 특수한 한 형태가 IID 가정이 성립하는 데이터셋이라고도 볼 수 있지 않을까.
아무튼 사전확률, 가능도, 사후확률의 의미를 가지고 있는 베이즈 추론에서는 가능도가 기존 빈도주의자들이 관점에서의 확률이며, 사전확률은 주관적인 한 개인이 자신이 믿고 있는 사건이 일어날 확률에 대한 믿음의 척도를 나타낸다. 가령 의사선생님(한 영역의 전문가)이 자신이 생각하는 환자의 5년 생존률 같은게 있다면 그것이 사전확률이 될 것이고 데이터가 추가될 때 마다 그 확률(가능도)를 이용해 사전확률 * 가능도를 통해 사후확률을 업데이트 하게된다. 그리고 그 사후확률은 다음 사건이 발생할 때 다시 사전확률로서 기능하게 된다. 이게 지금까지 수업을 듣기 전 내가 가지고 있는 베이즈에 대한 이해이다.(그래서 잘못이해하고 있는게 당연히 있을 것이다... 그래서 글을 써서 확인받고 싶어하는 것이기도 하고)
아무튼 베이즈 이론과 베이즈 추론은 다르다.
https://sumniya.tistory.com/29
< 방송대 통계학과 베이즈 데이터 분석 >
명강의였다.
순례자의 길을 떠나기 전 들었던 1강 베이즈 추론의 역사정 배경 수업은 꼭 글을 쓰고싶다고 생각했다. 벌써 3주나 지났지만 순례자의 길을 다녀온 뒤(맛본 뒤) 사실상 이글이 첫글이 되었다.
토마스 베이즈 vs. 피에르 시몽 라플라스
통계를 통해 신을 존재를 증명하고자 했던 학자와 신의 존재가 필수가 아님을 보이려고 했던 학자.
토마스 베이즈
신의 존재를 통계를 통해 증명하고 싶어했다. 통계에서 상관관계가 아닌 인과관계를 찾아냄으로써 신의 존재를 증명하고자 했다.
출판한 논문은 한편이다. 그게 초초초초대박이다.
심지어 그 논문도 다른 사람이 사후에 정리해서 출판했다고 한다.
지금 보아도 부족함이 없는 아주 뛰어난 논문이라고 한다.
부유한 집안의 아들로 태어났다.
일을 거의 하지 않아도(일주일에 한시간반) 사는데 부족함이 없었다.
https://ko.wikipedia.org/wiki/%ED%86%A0%EB%A8%B8%EC%8A%A4_%EB%B2%A0%EC%9D%B4%EC%A6%88
피에르 시몽 라플라스 : 베이즈 분석을 데이터에 적용한 18세기 프랑스의 수학자.
인과관계를 보임에 있어 신의 존재를 필요로 하지 않음을 보여주려 하였다.
태양계 안정성을 증명키 위해 중심극한정리를 발견하고 평균의 개념을 활용(평균은 이미 알려져 있었으나 당시 학계에서는 반대가 심했다고 함)
역시 부유한 집안 사람이다.
신학학교를 다니다 수학자가 되고 싶어 신학자가 되길 포기하고 수학자가 되었다.
개인 수학자가 돈을 벌 방법이 당시에는 더 없었다.
그래서 펀딩을 받기 위해 왕립학회 회원이 되기로 결정했다.
왕립학회 회원은 평생 공로상 같이 업적을 많이 쌓은 나이든 학자들만이 주로 되었다.
그래서 젊은 라플라스는 당시 이슈가 되고 있던 태양계의 안정성 문제(예상되는 목성과 토성의 질량으로 인한 태양에 가까워지는 목성 그리고 멀어지는 토성)를 해결해 왕립학회 회원이 되기로 결심한다. 클라스가 다르다. 수학자가 되려고 당시 최고 난제 중 하나인 문제를 해결해서 왕립협회 회원부터 되겠다는걸 문제해결책으로 삼다니. 남다르다.
나폴레옹이 라플라스를 싫어했다고 한다. 라플라스의 저서, 논문에는 신의 존재가 등장하지 않아서였다.
뉴턴의 만유인력(보편중력)에서 조차 신의 존재가 등장하는데 왜 라플라스의 수학에서는 신의 존재가 등장하지 않느냐며 나폴레옹이 라플라스에게 물었는데 라플라스가 이렇게 대답했다고 한다.
"제 가설에는 그게 필요하지 않습니다."
오, 멋짐이 폭발한다.
스케일이 다르다 생각했다. 그리고 난 왜 그런 생각을 못했을까도 생각했다.
뭐든 다 해 내는 사람이 따로 있는걸까란 생각도 들었다.
학자란 사람들, 무서운 사람들이구나도 생각했다.
어릴 적에는 공부만 하는 친구들을 공부벌레라고 하며 체력적으로나 심적으로 상대적으로 조금 부족하지 않을까 하는 생각들을 했었지만
실은 어떠한 분야에서든 두각을 나타내는 사람들은 모두 다 엄청난 배짱과 배포를 가지고 있는거 같다.
신의 존재를 논하며 당대 최고 권력자와의 논쟁도 논박도 주저하지 않는 배짱이라니.
세상에는 이상한 사람도 많지만 멋짐이 폭발하는 사람도 많구나.
나도 멋짐이 폭발하는 사람이 되고 싶다.
이론만 배우기보다 이러한 역사적 배경의 이야기를 듣는것이 무척이나 흥미로웠다.
이런 배경을 몰랐다면 수식과 씨름하고 있었겠지.
이 모든 업적들이 사실은 우리와 같은, 하지만 다른, 인간들의 이야기였음을.
나도 멋진 이야기를 들려주고 싶다. 내가 한때 딛고 살았던 이 지구에.
3주전에 들었던 수업을 이정도 기억하고 있음에 뿌듯하지만 잘못된 기억이 있을수 있다. 피드백은 언제든지 환영합니다. 그래야 제가 공부가 될테니까요.
안녕.
끝!