brunch

결국 질문입니다.

확률 계산은 컴퓨터가 정확하고 빠르지요.

by 김응석

중학교 2학년에 컴퓨터를 처음 접했다. 컴퓨터와 대화를 하기 위해서 프로그램을 만들어서 입력하니 내가 원하는 결과를 척척 해내는 기계를 정말 신기하게 바라본 적이 있었다.

그리고 얼아 지나지 않아서 컴퓨터와 컴퓨터를 연결하여 보이지 않는 가상의 세계에서 거리에 상관없이 사람들을 만나고 대화할 수 있게 된 것도 또 다른 신기한 경험이었다. 사람만이 아니라 정보까지 공유하는 시대가 되었고, 내가 알고 싶은 것을 가상의 공간인 인터넷에서 검색들 통해 쉽게 접근할 수 있는 시대가 되었다.

이제는 "검색의 시대"라는 문을 닫고, "질문의 시대"라는 새로운 문을 힘차게 열고 있는 것 같다.

Open Ai가 눈앞에 나와서 "알고 싶고, 궁금한 것을 잘 질문"하면 전 세계에 흩어져 있는 지식을 정리해서 알려주는 시대가 된 것이다.


미래 일어날 Risk에 대해서 확률을 통해 관리하고 싶다면, Open Ai 서비스를 이용하는 것처럼 내가 알고 싶은 문제를 잘 정리해서 질문을 하는 것이다.


세상의 상황을 단 두 개의 결과(성공과 실패)로 바라보는 관점을 베르누이 상황이라고 정의하였다.

1) 베르누이 상황이 단 1회인가? ---> 베르누인 분포

2) 전체 데이터 수가 정해져 있고, 이 중에서 샘플을 뽑았을 때 샘플 중에서 성공한 경우를 알고 싶은가?

--> 초기하 분포

3) 전체 데이터 수가 크고, 이 중에서 샘플을 뽑았을 때 샘플 중에서 성공한 경우를 알고 싶은가?

--> 이항 분포

4) 특정 시간, 공간, 구간에서 발생하는 사건의 회수를 알고 싶은가? --> 포아송 분포

5) 관심 있는 성공 횟수를 달성할 때까지 몇 번 시도를 해야 하는지 알고 싶은가? --> 음이항 분포

6) "처음 성공"할 때까지 몇 번 시도를 해야 하는지 알고 싶은가?> --> 기하 분포


실생활에서 발생할 수 있는 상황을 좀 더 구체적으로 살펴보면...

1) 오늘 생산한 제품 1000개 중에서 50개를 랜덤 하게 샘플링하여 1000개 제품 중에 있는 불량품의 수를

예측하고 싶다.

--> 1000개 데이터가 작다고 생각하면 초기하분포, 크다고 생각하면 이항 분포

2) 1년 동안 서울에서 발생하는 대형 화재 건수를 예측하고 싶다.

--> 1년이라는 시간적 구간 --> 따라서, 포아송 분포

3) 게임을 할 때 희귀 아이템을 세 번 얻기 위해서 과연 몇 번 게임을 해야 하는지 예측하고 싶다.

--> 3번 성공을 위한 시도 --> 음이항 분포

4) 게임 아이템을 처음 얻기 위해서 몇 번 게임을 해야 하는지 예측하고 싶다.

--> 첫 번째 성공을 위한 시도 --> 기하 분포


이렇든 확률은 특정한 상황이나 질문에 답하기 위해서 개발한 것이다. 따라서 실제 문제를 정확하게 빠르게 해결하기 위해서는 해결해야 할 문제 상황의 본질을 정확히 이해한 다음 적절한 분포를 신중하게 선택하면 된다. 분포를 결정한 다음 계산은 컴퓨터에게...


이산형 확률분포는 상황에 기반한 질문이 결정합니다.


keyword
작가의 이전글최초 버디는 몇 번 홀에서?