내가 분석한 데이터가 맞는지 틀리는지 검증이 필요할 때 P-Value
데이터 분석가 남편 일루와 봐
A 할인쿠폰과 B 적립 쿠폰은
효과 차이가 있을까?
아닙니다.
동의하시죠?
우리는 두 가지 질문에 답할 수 없습니다.
A 할인 쿠폰 : 구매 1043, 구매 안 함 3
B 적립 쿠폰 : 구매 2, 구매 안 함 1432
A 할인 쿠폰 : 구매 73, 구매 안 함 125 (37% 구매)
B 적립 쿠폰 : 구매 59, 구매 안 함 131(31% 구매)
P 값은 0.05보다 작아야 돼
A 할인 쿠폰 : 구매 73, 구매 안 함 125
A 할인 쿠폰 : 구매 71, 구매 안 함 127
P-값 : 0.9
“두 그룹 간에 차이가 없다!” = “차이를 증명하는데 실패(기각)했다.”
A 할인 쿠폰 : 구매 71, 구매 안 함 127
A 할인 쿠폰 : 구매 72, 구매 안 함 126
P-값 : 1
A 할인 쿠폰 : 구매 75, 구매 안 함 123
A 할인 쿠폰 : 구매 70, 구매 안 함 128
P-값 : 0.7
A 할인 쿠폰 : 구매 60, 구매 안 함 138(30% 구매)
A 할인 쿠폰 : 구매 84, 구매 안 함 114(42% 구매)
P-값 : 0.01
실제로는 차이가 없지만 작은 P값을 얻는 것을
거짓 양성(FALSE POSITIVE)이라고 합니다.
없다!
A 할인 쿠폰 : 구매 73, 구매 안 함 125 (37% 구매)
B 적립 쿠폰 : 구매 59, 구매 안 함 131 (31% 구매)
P-값 = 0.24
P값이 더 작을수록 효과의 차이가 큰 것은 아니다
A 할인 쿠폰 : 구매 73, 구매 안 함 125 (37% 구매)
B 적립 쿠폰 : 구매 59, 구매 안 함 131 (31% 구매)
P-값 = 0.24
A 할인 쿠폰 : 구매 5005, 구매 안 함 9868 (34% 구매)
B 적립 쿠폰 : 구매 4800, 구매 안 함 9000(35% 구매)
P-값 = 0.04
실패 박물관
매년 신제품을 모았을 뿐인데 그중 90%가 실패했다.
이유는 소비자의 마음을 제대로 읽지 못했기 때문이다.
기억하세요 이 모든 것들이 작은 생쥐 한 마리에서 시작되었다는 사실을요