A/B 테스트는 A와 B만 나누는 게 다가 아니다 (4)
- 실험1 : 10명 중 2명 (20%) vs 10명 중 3명 (30%)
- 실험2 : 10,000명 중 2,000명 (20%) vs 10,000명 중 3,000명 (30%)
- 실험3 : 100,000명 중 2,000명 (2%) vs 100,000명 중 2,200명 (2.2%)
(우리의 직관) 100,000명끼리 비교해서 차이가 고작 0.2%p 수준이다
VS
(통계) 0.2%p 차이밖에 없더라도 표본이 100,000명이나 되니
이 정도면 충분하다 + 우연이라고 볼 수 없다
우리는 단순히 비율을 비교하는 게 아니라,
이 비율의 차이가 우연이 아닌지 알고 싶은 거다
두 그룹의 차이가 아무리 적어도 표본만 크면 충분히 유의미할 수도 있다
그럼 대체 표본은 어느 정도가 필요한 건가?
표본은 많을수록 좋으니 실험은 무조건 오래, 크게 하면 되나?