빵집에서 배우는 이항분포: 성공과 실패의 확률을 굽다

by 박정수

새벽 다섯 시, 동네 빵집의 불이 켜집니다. 오븐의 열기가 서서히 공간을 채우고, 갓 구운 빵 냄새가 골목을 깨웁니다. 이 빵집에는 매일 아침마다 은근한 긴장감이 흐르는데, 그 이유는 바로 ‘크루아상 품질 테스트’ 때문입니다. 이 빵집의 대표 메뉴인 크루아상은 맛있기로 유명하지만, 만드는 과정이 까다롭습니다. 겹겹이 쌓인 버터층이 제대로 살아야만 바삭한 식감이 나오기 때문에, 숙련된 제빵사라도 항상 일정한 품질을 보장하기 어렵습니다.

그래서 사장님은 매일 아침 20개의 크루아상을 구워 품질을 확인합니다. 그중 완벽한 품질로 나오는 비율은 평균적으로 70% 정도라고 알려져 있습니다. 그렇다면 이런 질문이 생깁니다.


“오늘 구운 20개의 크루아상 중에서 정확히 15개가 성공작일 확률은 얼마나 될까?”

이 질문을 이해하는 순간, 우리는 자연스럽게 이항분포(Binomial Distribution)의 세계로 들어가게 됩니다.



1. 이항분포란 무엇인가


이항분포는 다음과 같은 상황에서 등장합니다.

결과가 성공/실패 두 가지뿐일 때

각 시행이 서로 독립적일 때

성공 확률이 매 시행마다 동일할 때

총 시행 횟수가 정해져 있을 때


크루아상 품질 테스트는 이 조건을 완벽하게 만족합니다.

성공(맛있다) / 실패(맛없다)

각 빵은 독립적으로 굽힌다

성공 확률은 70%로 일정

총 20개를 굽는다


따라서 오늘의 빵 굽기 결과는 이항분포 B(n=20, p=0.7)를 따르게 됩니다.


2. 확률 계산: 정확히 15개 성공할 확률


이항분포의 확률 질량 함수(PMF)는 다음과 같습니다.

P(X=k)=(nk) pk(1−p) n−k

여기서

n=20

p=0.7

k=15


이 값을 Python으로 계산해 보면 훨씬 직관적입니다.


3.Python 코드 예시


import numpy as np

import matplotlib.pyplot as plt

from scipy.stats import binom

# 파라미터 설정

n = 20 # 시행 횟수

p = 0.7 # 성공 확률

k = 15 # 정확히 15개 성공

# 정확히 15개 성공할 확률

prob_15 = binom.pmf(k, n, p)

print(f"정확히 15개가 성공할 확률: {prob_15:. 4f} ({prob_15*100:.2f}%)")

# 15개 이상 성공할 확률

prob_15_or_more = 1 - binom.cdf(14, n, p)

print(f"15개 이상 성공할 확률: {prob_15_or_more:.4f} ({prob_15_or_more*100:.2f}%)")

# PMF 계산

x = np.arange(0, n+1)

pmf_values = binom.pmf(x, n, p)

# PMF 그래프 그리기

plt.figure(figsize=(10, 6))

plt.bar(x, pmf_values, color='skyblue', edgecolor='black')

plt.title("Binomial Distribution PMF (n=20, p=0.7)")

plt.xlabel("성공 횟수 (k)")

plt.ylabel("P(X = k)")

plt.grid(axis='y', linestyle='--', alpha=0.7)

# k=15 강조 표시

plt.bar(k, prob_15, color='orange', edgecolor='black', label='k = 15')

plt.legend()

plt.show()


4. 계산 결과 해석

binorm.png

이 코드를 실행하면 다음과 같은 결과를 얻게 됩니다.

정확히 15개가 성공할 확률: 0.1789 (17.89%)

15개 이상 성공할 확률: 0.4164 (41.64%)

즉, 오늘 아침 크루아상 20개 중 15개가 완벽한 품질로 나올 가능성은 꽤 현실적인 수준입니다. 하지만 18개, 19개, 20개가 모두 성공작이 되는 날은 매우 드물겠죠. 이항분포는 이렇게 “가능하지만 흔하지 않은 사건”을 수치로 보여줍니다.


4. 이항분포가 주는 통찰


이항분포는 단순히 확률 계산을 넘어서, 우리가 매일 마주하는 불확실성을 이해하는 도구입니다.

마케팅 이메일을 보냈을 때 클릭할 사람의 수

병원에서 특정 치료가 효과를 보일 확률

공장에서 불량품이 나올 확률

시험에서 정답을 맞힐 확률

이 모든 상황이 이항분포의 틀 안에서 설명됩니다.


빵집 사장님은 이 확률을 바탕으로 품질 관리 전략을 세울 수 있습니다. 예를 들어, 성공 확률을 70%에서 80%로 끌어올리면 15개 이상 성공할 확률이 얼마나 증가하는지 계산해 볼 수 있습니다. 이런 작은 변화가 비즈니스 전체의 안정성을 크게 높일 수 있습니다.


정확히 15개가 성공할 확률: 0.1746 (17.46%)

15개 이상 성공할 확률: 0.8042 (80.42%)


5.마무리


이항분포는 “성공과 실패”라는 단순한 구조 속에서 세상의 복잡한 불확실성을 이해하게 해주는 강력한 도구입니다. 빵집의 크루아상처럼, 우리의 일상도 수많은 시행과 확률로 이루어져 있습니다. 그 속에서 패턴을 발견하고 미래를 예측하는 것, 그것이 바로 통계가 주는 지혜입니다.




이항분포2.png


이전 11화Python으로 분석하는 "우리 동네 빵집 맛집 탐방"