p-Value의 의미
노 사연님의 노래 만남에서는 "우리의 만남이 우연이 아님"을 이야기하고 있다. 만남은 마음의 설렘등을 통해서 확인할 수 있다지만, 일을 하면서 내가 생각한 조치과 효과가 우연이 아님을 확인하려면 어떻게 해야 할까?
집에서 원두커피를 즐겨 마시는 편이다. 그래서 맛이 좋은 카페를 발견하면 원두를 구매해오곤 한다.
원두커피 종류를 변경했을 때 커피 맛의 변화가 있었는지 여부를 어떻게 확인할 수 있을까?
통계에서는 "변화"가 우연하게 발생했을 가능성을 데이터를 활용하여 제공하는데 이를 'p-Value(값)'라고 한다.
여기서 p-Value는 "우연하게 변했을 확률"을 의미한다.
새 원두의 맛과 기존 원두의 맛에 대해서 평가를 해서 통계적 분석을 통해 p-Value가 0.03이라고 한다면 어떤 결정을 내려야 할까?
0.03 즉 3%는 "원두에 따라 커피 맛이 우연하게 변했을 확률이 3%"라는 것이다. 우연하게 변했다고 보기에는 너무 확률이 작은 결과가 나왔기 때문에 원두에 따라 커피 맛이 다르다는 결론을 내릴 수 있다.
만약에 p-value가 0.4 즉 40% 일 때는 어떻게 해야 할까?
우연하게 변할 확률이 40%나 되기 때문에 " 원두의 차이가 커피 맛의 차이가 없다."라는 결론이 된다.
이렇듯 p-Value는 우리가 의사 결정을 할 때 판단의 근거가 되는 역할을 한다. 제조 현장에서 생산 조건의 변화가 품질 또는 생산성이 좋아졌는지 여부, 다이어트 약이 효과가 있었는지 여부, 공부하는 방법을 변경했을 때 성적의 변화가 있었는지 여부 등 다양한 상황에서 의사 결정할 때 도움을 주고 있다.
p-Value는 작을수록 우연이 아니라는 강한 증거가 된다. 따라서, 효과가 있다고 강하게 주장할 수 있다
하지만, 효과의 크기(Effect Size)는 설명할 수 없고, 우연여부만 확인한다는 점은 주의해야 한다.
p-Value는 probabiliy Value의 약자로 말 그대로 확률 값을 말하며, 통계학에서는 이를 유의 확률이라고 한다.