새벽 다섯 시, 동네 빵집의 불이 켜집니다. 오븐의 열기가 서서히 공간을 채우고, 갓 구운 빵 냄새가 골목을 깨웁니다. 이 빵집에는 매일 아침마다 은근한 긴장감이 흐르는데, 그 이유는 바로 ‘크루아상 품질 테스트’ 때문입니다. 이 빵집의 대표 메뉴인 크루아상은 맛있기로 유명하지만, 만드는 과정이 까다롭습니다. 겹겹이 쌓인 버터층이 제대로 살아야만 바삭한 식감이 나오기 때문에, 숙련된 제빵사라도 항상 일정한 품질을 보장하기 어렵습니다.
그래서 사장님은 매일 아침 20개의 크루아상을 구워 품질을 확인합니다. 그중 완벽한 품질로 나오는 비율은 평균적으로 70% 정도라고 알려져 있습니다. 그렇다면 이런 질문이 생깁니다.
“오늘 구운 20개의 크루아상 중에서 정확히 15개가 성공작일 확률은 얼마나 될까?”
이 질문을 이해하는 순간, 우리는 자연스럽게 이항분포(Binomial Distribution)의 세계로 들어가게 됩니다.
이항분포는 다음과 같은 상황에서 등장합니다.
결과가 성공/실패 두 가지뿐일 때
각 시행이 서로 독립적일 때
성공 확률이 매 시행마다 동일할 때
총 시행 횟수가 정해져 있을 때
크루아상 품질 테스트는 이 조건을 완벽하게 만족합니다.
성공(맛있다) / 실패(맛없다)
각 빵은 독립적으로 굽힌다
성공 확률은 70%로 일정
총 20개를 굽는다
따라서 오늘의 빵 굽기 결과는 이항분포 B(n=20, p=0.7)를 따르게 됩니다.
이항분포의 확률 질량 함수(PMF)는 다음과 같습니다.
P(X=k)=(nk) pk(1−p) n−k
여기서
n=20
p=0.7
k=15
이 값을 Python으로 계산해 보면 훨씬 직관적입니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
# 파라미터 설정
n = 20 # 시행 횟수
p = 0.7 # 성공 확률
k = 15 # 정확히 15개 성공
# 정확히 15개 성공할 확률
prob_15 = binom.pmf(k, n, p)
print(f"정확히 15개가 성공할 확률: {prob_15:. 4f} ({prob_15*100:.2f}%)")
# 15개 이상 성공할 확률
prob_15_or_more = 1 - binom.cdf(14, n, p)
print(f"15개 이상 성공할 확률: {prob_15_or_more:.4f} ({prob_15_or_more*100:.2f}%)")
# PMF 계산
x = np.arange(0, n+1)
pmf_values = binom.pmf(x, n, p)
# PMF 그래프 그리기
plt.figure(figsize=(10, 6))
plt.bar(x, pmf_values, color='skyblue', edgecolor='black')
plt.title("Binomial Distribution PMF (n=20, p=0.7)")
plt.xlabel("성공 횟수 (k)")
plt.ylabel("P(X = k)")
plt.grid(axis='y', linestyle='--', alpha=0.7)
# k=15 강조 표시
plt.bar(k, prob_15, color='orange', edgecolor='black', label='k = 15')
plt.legend()
plt.show()
4. 계산 결과 해석
이 코드를 실행하면 다음과 같은 결과를 얻게 됩니다.
정확히 15개가 성공할 확률: 0.1789 (17.89%)
15개 이상 성공할 확률: 0.4164 (41.64%)
즉, 오늘 아침 크루아상 20개 중 15개가 완벽한 품질로 나올 가능성은 꽤 현실적인 수준입니다. 하지만 18개, 19개, 20개가 모두 성공작이 되는 날은 매우 드물겠죠. 이항분포는 이렇게 “가능하지만 흔하지 않은 사건”을 수치로 보여줍니다.
이항분포는 단순히 확률 계산을 넘어서, 우리가 매일 마주하는 불확실성을 이해하는 도구입니다.
마케팅 이메일을 보냈을 때 클릭할 사람의 수
병원에서 특정 치료가 효과를 보일 확률
공장에서 불량품이 나올 확률
시험에서 정답을 맞힐 확률
이 모든 상황이 이항분포의 틀 안에서 설명됩니다.
빵집 사장님은 이 확률을 바탕으로 품질 관리 전략을 세울 수 있습니다. 예를 들어, 성공 확률을 70%에서 80%로 끌어올리면 15개 이상 성공할 확률이 얼마나 증가하는지 계산해 볼 수 있습니다. 이런 작은 변화가 비즈니스 전체의 안정성을 크게 높일 수 있습니다.
정확히 15개가 성공할 확률: 0.1746 (17.46%)
15개 이상 성공할 확률: 0.8042 (80.42%)
이항분포는 “성공과 실패”라는 단순한 구조 속에서 세상의 복잡한 불확실성을 이해하게 해주는 강력한 도구입니다. 빵집의 크루아상처럼, 우리의 일상도 수많은 시행과 확률로 이루어져 있습니다. 그 속에서 패턴을 발견하고 미래를 예측하는 것, 그것이 바로 통계가 주는 지혜입니다.