brunch

You can make anything
by writing

C.S.Lewis

by 데이터파머 DataFarmer Jul 22. 2022

[독서노트] 파이썬을 활용한 베이지안 통계

서평


베이지안 통계란!!


베이스(T. Bayes)가 주창한 통계적 방법으로서 표집에서 얻은 정보뿐만 아니라, 연구자가 갖고 있는 사전 지식이나 주관적 의견 또는 신념과 같은 정보도 포함시키는 추리통계의 한 방법. 전통적 통계방법에서는 통계적 추리를 할 때 표집으로부터 얻은 정보 이외의 다른 정보는 사용하지 않는다. 베이지안 접근방식에서도 수리통계에서 사용하는 모든 방식이 그대로 적용되며, 단지 전통적인 접근방식과의 차이점은 사전 정보를 이용한다는 데 있다.


불확실한 상황에서 통계적으로 얻은 정보를 토대로 어떤 의사결정을 해야 하는 경제학·경영학·자연자원 개발 등의 분야에서 베이지안 통계방안이 보다 많이 사용되는 경향이 있다. 이 방법에서 중요시되는 사항으로 베이스의 정리가 있다. 예컨대, X와 Y가 비연속 무선변인(無選變因)으로서 X는 A1, …, Ai, …, Aj 중 어느 한 값을 갖고 Y는 B1, …, Bi, …, Bk 중 어느 한 값을 갖는 다고 하자. 그러면 Y변인이 Bk 값을 가질 때, X변인이 Aj 값을 갖게 될 조건확률은 P (Aj/Bk)로 표시된다.

베이스의 정리는 다음과 같이 나타낼 수 있다. (출처 : 네이버백과사전)


베이지안 통계를 계산하기 위해 파이썬을 활용하는지 베이지안 통계의 종류별로 설명하고, 적합한 문제를 통해 파이썬 실습을 하며 익힐 수 있는 책이다.


목차 및 요약

CHAPTER 1   베이즈 이론

CHAPTER 2 계산 통계

CHAPTER  3 추정 1

CHAPTER  4 추정 2

CHAPTER  5 공산과 가산

CHAPTER  6 의사 결정 분석

CHAPTER  7 예측

CHAPTER  8 관측 편향

CHAPTER  9 두 차원

CHAPTER  10 근사 베이지안 계산

CHAPTER  11 가설 검정

CHAPTER  12 증거

CHAPTER  13 시뮬레이션

CHAPTER  14 계층 모델

CHAPTER  15 차원 다루기




기본적으로 베이즈 이론의 조건부 확률이다.

1장에서는 조건부 확률에서 베이즈 이론을 도출하고, 실제 데이터 셋을 활용해 실습을 한다.


2장은 베이즈 정리를 통해서 조건부 확률과 연관된 보다 까다로운 몇가지 문제를 다루어 본다.


장장은 분포에 관한 부분으로 확률질량함수를 나타내는 Pmf 객체를 사용해서 문제를 다루어 본다.


4장은 비율 츄정으로 유로 동전 문제를 풀면서 베이지안 통계를 다루어 본다.


5장은 수량 추정으로 모수의 크기나 수량에 관한 문제를 다루어 본다.


6장은 공산 가산 부분으로 새로운 개념이다. 


7장은 통계의 가장 기본적인 부분으로 최소, 최대 그리고 혼합분포에 대해 다룬다. 


8장은 베이지안 통계에서 어찌보면 가장 많이 활용되는 포아송에 대해 살펴본다. 임의의 시간에 발생하는 이벤트를 나타내는 모델이며, 포아송 모델을 만들고 예측을 위해 사후분포를 사용한다.


데이터를 많이 다루면 많은 부분이 분류에 관한 부분이고, 딥러닝 기계학습에서도 가장 많이 사용된다. 12장은 분류를 어떻게 하는지, 그리고 어떤 코드를 사용하여 하는지 간단하게 보여준다.


16장은 로지스틱 회귀분석으로 베이즈 규칙에서 공산을 사용해 베이즈 정리를 다시 풀어쓴 후 규칙을 도출하고, 로그 스케일의 베이즈 규칙을 살펴 보면서 연속 갱신을 통해 증거를 누적하는 방법에 대한 통찰을 사용한다.


로지스틱 회귀 분석을 위한 간략한 코드 내용과 결과를 확인할 수 있다.



"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다." 

매거진의 이전글 [독서노트] 아들 키우기 왜 이렇게 힘들까
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari