우리가 일상생활에서 관심 있는 대상에 미래 결과는 불확실하지만, 발생할 수 있는 가능성(확률)을 확인할 수는 있으며 이 확률을 가진 변수를 확률 변수라고 한다.
확률변수가 가지고 있는 모든 값들에 대한 각각의 확률을 나타내는 함수를 확률분포하고 한다.
확률 분포는 함수다. 따라서, 확률변수 모든 값들과 개별 함숫값들과 1:1 관계이다.
확률변수는 크게 연속형(Continuous) 변수와 이산형(Discrete) 변수 두 가지로 구분할 수 있다.
연속형은 대부분 측정단위를 가지고 있어서 계량형(Quantitative)라고도 한다. 크기나 양을 측정할 수 있는
변수를 말한다. 또한 정확한 값을 사용할 수는 없고, 측정하는 측정도구의 한계만큼만 알 수 있다.
사람의 “키"를 생각해 보자.
175센티미터라고 할 수 있지만, 정확히는 무한의 소수점 형태인 175.2454…….라고 상상할 수 있다. 엄밀하게 말하면 근삿값을 사용한다고 할 수 있다.
이산형은 계수형(Counative)라고도 하며, 자연수로 표현하며 특정한 것을 세어서 얻는 변수를 말한다. 보통 개수, 횟수등으로 표현한다. 연속형과는 달리 자연수로 측정하기 때문에 연속형과는 데이터와 데이터는 서로 분리된(Discete) 모습을 하고 있다.
확률분포는 눈으로 확률을 쉽게 확인할 수 있는 그래프로 표현할 수 있다. 연속형은 곡선으로 표현하며, 이산형은 주로 막대그래프를 활용하여 표현한다.
자 이제 미래 리스크를 예측하기 위한 모든 준비가 끝났다.
실무에서는 다음과 같은 순서로 활용할 수 있다.
1) 내가 관심 있는 대상(변수)을 결정한다.
2) 어떤 상황인지 이해한다.
3) 상황과 대상의 종류(이산형, 연속형)에 따른 확률분포를 선택한다.
4) 확률분포를 사용하기 위한 최소한의 정보(Parameter)를 계산한다.
5) 리스크에 대한 확률을 확인하고 이를 최소화하기 위한 행동을 한다.
-- 추가(참고용) --
* 이산형확률분포 함수 = 확률 질량 함수(PMF : Probability Mass Function)
= 확률은 개별값 또는 개별값의 합
* 연속형 확률분포 함수 = 확률 밀도 함수(PDF : Prbability Density Function) = 확률은 면적