[독서노트] 파이썬을 활용한 베이지안 통계

서평


베이지안 통계란!!


베이스(T. Bayes)가 주창한 통계적 방법으로서 표집에서 얻은 정보뿐만 아니라, 연구자가 갖고 있는 사전 지식이나 주관적 의견 또는 신념과 같은 정보도 포함시키는 추리통계의 한 방법. 전통적 통계방법에서는 통계적 추리를 할 때 표집으로부터 얻은 정보 이외의 다른 정보는 사용하지 않는다. 베이지안 접근방식에서도 수리통계에서 사용하는 모든 방식이 그대로 적용되며, 단지 전통적인 접근방식과의 차이점은 사전 정보를 이용한다는 데 있다.


불확실한 상황에서 통계적으로 얻은 정보를 토대로 어떤 의사결정을 해야 하는 경제학·경영학·자연자원 개발 등의 분야에서 베이지안 통계방안이 보다 많이 사용되는 경향이 있다. 이 방법에서 중요시되는 사항으로 베이스의 정리가 있다. 예컨대, X와 Y가 비연속 무선변인(無選變因)으로서 X는 A1, …, Ai, …, Aj 중 어느 한 값을 갖고 Y는 B1, …, Bi, …, Bk 중 어느 한 값을 갖는 다고 하자. 그러면 Y변인이 Bk 값을 가질 때, X변인이 Aj 값을 갖게 될 조건확률은 P (Aj/Bk)로 표시된다.

베이스의 정리는 다음과 같이 나타낼 수 있다. (출처 : 네이버백과사전)

1393.jpg?type=w530_fst&wm=N


베이지안 통계를 계산하기 위해 파이썬을 활용하는지 베이지안 통계의 종류별로 설명하고, 적합한 문제를 통해 파이썬 실습을 하며 익힐 수 있는 책이다.


목차 및 요약

CHAPTER 1 베이즈 이론

CHAPTER 2 계산 통계

CHAPTER 3 추정 1

CHAPTER 4 추정 2

CHAPTER 5 공산과 가산

CHAPTER 6 의사 결정 분석

CHAPTER 7 예측

CHAPTER 8 관측 편향

CHAPTER 9 두 차원

CHAPTER 10 근사 베이지안 계산

CHAPTER 11 가설 검정

CHAPTER 12 증거

CHAPTER 13 시뮬레이션

CHAPTER 14 계층 모델

CHAPTER 15 차원 다루기


KakaoTalk_20220722_092605642.jpg



기본적으로 베이즈 이론의 조건부 확률이다.

1장에서는 조건부 확률에서 베이즈 이론을 도출하고, 실제 데이터 셋을 활용해 실습을 한다.

KakaoTalk_20220722_092605642_01.jpg


2장은 베이즈 정리를 통해서 조건부 확률과 연관된 보다 까다로운 몇가지 문제를 다루어 본다.

KakaoTalk_20220722_092605642_02.jpg


장장은 분포에 관한 부분으로 확률질량함수를 나타내는 Pmf 객체를 사용해서 문제를 다루어 본다.

KakaoTalk_20220722_092605642_03.jpg


4장은 비율 츄정으로 유로 동전 문제를 풀면서 베이지안 통계를 다루어 본다.

KakaoTalk_20220722_092605642_04.jpg


5장은 수량 추정으로 모수의 크기나 수량에 관한 문제를 다루어 본다.

KakaoTalk_20220722_092605642_05.jpg


6장은 공산 가산 부분으로 새로운 개념이다.

KakaoTalk_20220722_092605642_06.jpg


7장은 통계의 가장 기본적인 부분으로 최소, 최대 그리고 혼합분포에 대해 다룬다.

KakaoTalk_20220722_092605642_07.jpg


8장은 베이지안 통계에서 어찌보면 가장 많이 활용되는 포아송에 대해 살펴본다. 임의의 시간에 발생하는 이벤트를 나타내는 모델이며, 포아송 모델을 만들고 예측을 위해 사후분포를 사용한다.

KakaoTalk_20220722_092605642_08.jpg


데이터를 많이 다루면 많은 부분이 분류에 관한 부분이고, 딥러닝 기계학습에서도 가장 많이 사용된다. 12장은 분류를 어떻게 하는지, 그리고 어떤 코드를 사용하여 하는지 간단하게 보여준다.

KakaoTalk_20220722_092605642_10.jpg
KakaoTalk_20220722_092605642_09.jpg


16장은 로지스틱 회귀분석으로 베이즈 규칙에서 공산을 사용해 베이즈 정리를 다시 풀어쓴 후 규칙을 도출하고, 로그 스케일의 베이즈 규칙을 살펴 보면서 연속 갱신을 통해 증거를 누적하는 방법에 대한 통찰을 사용한다.

KakaoTalk_20220722_092605642_11.jpg


로지스틱 회귀 분석을 위한 간략한 코드 내용과 결과를 확인할 수 있다.

KakaoTalk_20220722_092605642_12.jpg
KakaoTalk_20220722_092605642_13.jpg



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

keyword
매거진의 이전글[독서노트] 아들 키우기 왜 이렇게 힘들까