통계학적 사고의 중요성

by 김재광


1. 미래는 존재하는가? 존재라는 것을 어떻게 정의하느냐에 따라 다르겠지만 우리가 통상 어떤 것이 존재한다고 할때는 시공간 좌표 상의 특정 위치에 물리적 공간을 차지하고 있음을 지칭하는 것이기에 어떤 미래가 존재한다는 것은 정확한 표현이 아니다. 10년뒤에 내가 지구상에 살아있는 미래는 있을수도 있고 또는 없을수도 있는 것이니 10년뒤의 나는 확률로서 존재할 뿐이다.


2. 확률로써 존재한다는 것을 다르게 표현하면 확률 사건이라고 할수 있다. 확률사건이라는 의미는 발현되는 사건이 결정론적으로 나타나는게 아니라 확률적으로 나타난다는 것인다. 동전을 던지면 앞면이 나올지 뒷면이 나올지가 확률적으로 나타나는 것처럼 어떤 사건이 나올지는 확률적으로 결정된다는 의미이다.


3. 하지만 좀더 생각해보고 싶은 질문은 과연 "왜" 확률사건이 존재하는가 하는 것이다. 동전을 던졌을때 앞면이 나올지 뒷면이 나올지가 사실은 던질때의 힘과 미묘한 공기저항과 바닥의 표면의 성질 등의 여러가지 물리적 성질로 정확하게 결정되는게 아닐까? 만약 정교한 실험실에서 힘과 공기와 동전의 속성을 정밀한 기계로 콘트롤하면 결과는 정확하게 예측될수 있지 않을까? 그렇다면 과연 이런 경우에도 이를 확률사건이라고 부를수 있을까?


4. 앞의 예에서처럼 확률사건과 결정적 사건의 경계는 모호한 경우도 많고 사실 동일한 사건도 상황에 따라 확률 사건이라고 부를수도 있고 그렇지 않을수도 있다. 예를 들어 개기일식 같은건 천문학이 발달하지 않은 시기에는 언제 일어날지 모르는 확률사건으로 이해되었지만 지금은 그건 아주 정확하게 예측될수 있는 결정론적 사건이다.


5. 즉, 확률사건이라는 것은 (다시 말해서 스토캐스틱이라는 성질은) 사건의 실제 속성이라기 보다는 사실은 우리의 인식의 표현방식에 불과한 것이다. 우리의 관측의 한계와 인과관계에 대한 지식의 한계로 인해 모든것을 관측하고 모든것을 반영하여 정확하게 예측하는 것은 거의 불가능하므로 대신에 그 사건에 대한 확률구조를 이해하는 문제로 환원하여 문제를 단순화하는 것이다.


6. 따라서 확률구조는 우리가 원하는 정확한 결정론적 구조에 대한 근사공식이 되는 것이다. 그 근사공식이 실제 구조에 가까울수록 정교한 과학에 가까와지는 것이기에 천문학과 물리학과 같은 자연과학에서는 이러한 확률 구조가 크게 중요하지 않을수 있고 (물론 양자물리는 제외한다) 사회과학은 현상 자체의 복잡성 때문에 그러한 근사공식의 정확도가 높지 않아서 확률 구조에 대한 이해가 더욱 중요해 지는 것이다.


7. 확률구조에 대한 틀을 모형이라고도 부른다. 모형은 확률 구조에 대한 사전지식이나 가설을 수학적 함수식으로 나타내는 것이다. 이러한 모형이 얼마나 현실을 제대로 반영하는지에 대한 판단은 데이터를 바탕으로 학습을 시켜서 평가하게 된다. 모형이라는 것이 어차피 근사이기에 정확하지는 않지만 좋은 모형은 분명 도움이 된다.


8. 확률론적 (또는 통계학적) 사고라 함은 관측과 지식의 한계에도 불구하고 불확실한 사건에 대한 어떤 최선의 판단을 하고자 할때 필요한 접근법이다. 관심 사건에 대한 적절한 확률 모형이 데이터를 통해 학습되면 그에 대응하는 각각의 의사결정과 관련한 기대 효용 (또는 리스크)를 계산하여 이 중에서 최선의 판단을 결정할 수 있게된다. 세상이 더 복잡해질 수록 그리고 기존지식이 충분히 쌓이지 않은 분야의 새로운 문제일수록 이런 확률론적 사고 방식은 문제 해결에 상당한 수준의 편리함을 제공할 것이다. 또 외부환경이 바뀌면 기존의 지식들이 폐기되고 새로운 환경에 맞는 지식을 찾아야 하는 경우도 많이 있을 것이다. 통계학적 사고가 점점 더 중요해지게 되는 이유가 이런 환경의 변화가 빨라지기 때문이기도 하다

매거진의 이전글통계학의 유용성