좀 오래된 이야기이다.
회사 생활 시작하고 얼마 되지 않아서 MBC에서 청춘남녀들의 공객적인 맞선을 하는 소위 짝짓기 예는 프로그램인 '사랑의 스튜디오'를 방영했었다. 그 시절 청춘으로써 거의 같은 세대 젊은이들의 생기 발랄한 모습과 이어질 듯 이어지지 않는 인연, 반전의 선택 등이 재미 요소였던 것으로 기억된다.
최근에도 다른 형태의 다양한 짝짓기 프로그램들을 방영하고 있고 인기 있는 출연자는 거의 연예인급의 관심을 받는 거 같다.
이런 프로그램에 내가 출연을 한다면 관심사가 무엇일까?
"이상형을 찾아서"라는 짝짓기 예능 프로그램이 있다. 남자, 여자 총 10명씩 출연을 하고, 참가자들은 랜덤 하게 3명과 데이트를 할 수 있는 기회를 얻는다고 한다. 물론 사람을 알아가기 위해서는 직접 만나서 이야기를 해야겠지만, 참가자 프로필과 사진으로 판단했을 때 호감이 가는 사람이 3명이 있다.
과연 나는 오늘 3번의 데이트 기회 중에서 호감이 가는 사람들과 몇 번 데이트를 할 수 있을까?
관심사는 "몇 번"이다.
미래를 정확히 알 수는 없지만 내 관심사인 "몇 번"에 대한 확률은 미리 계산할 수 있다.
이런 상황에서 확률을 계산할 때 사용하는 분포를 초기하 분포이다.
결국 내 관심사는 3번의 데이트 기회 중에서 호감 가는 사람과 데이트를 "몇 번"할 수 있는 것인가이다. 이를 정리하면 다음의 네 가지 경우가 되고 각각의 확률을 초기하 분포를 활용하여 사전에 확인할 수 있다.
- 3번 중 한 번도 하지 못하는 경우 - 3번 중 한 번만 하는 경우
- 3번 중 두 번만 하는 경우 - 3번 중 세 번 모두 하는 경우
내가 알고 있는 정보를 활용해서 확률을 구할 수 있다.
참가 인원은 10명, 이 중에서 내가 호감 가는 사람은 3명, 내가 선택할 수 있는 횟수는 3명... 이 세 가지 정보를 바탕으로 초기하 분포를 활용한다.
상황을 정리하면 확률을 계산할 수 있는 분포는 자동으로 결정된다.
잘 생각해 보면, 개별 데이트 결과는 두 가지 결과만을 가진다. 내가 호감이 가는 사람, 그렇지 않은 사람...
베르누이 상황이다. 즉, 베르누이 상황을 확장한 상황 중의 하나가 바로 초기하 분포 상황이다. 다만, 10명의 참가자 중에서 첫 번째 파트너와 데이트를 하고 나면, 선택지가 10명에서 9명으로 줄어든다. 이를 비복원 추출이라고 한다. 즉, 베르누리 상황이 연속해서 발생하는데, 상황이 계속해서 바뀌는 상황이다.
초기하분포 = 베르누이 분포의 비복원 추출 상황
위 상황을 초기하 분포로 다음과 같이 표현한다.
. 관심사(X) = 호감 가는 참가자와 데이트를 하는 횟수
. 관심사(X) ~ hypergeo(참가자 전체 인원수, 호감이 가는 인원수, 기회 수)
~ hypergeo(10,3,3)