F값의 이해와 일상생활의 활용
우리는 일상생활에 늘 원인(X)과 결과(Y)를 연결해서 해석하려고 노력하고 있다.
"와 친구야 살이 많이 빠진 거 같은데? 운동했어?"
"내가 주로 가는 카페의 커피 맛이 너무 마음에 들어. 왜냐하면 이탈리아의 좋은 원두와 훌륭한 바리스타가 있거든"
"공부 방법을 바꿨는데, 이번 시험 성적이 올랐어"와 같이 일상 대화에서 원인과 결과를 연결해서 말하고 있다.
이렇듯 Y(결과) = F(X:원인) + Error라는 모델을 우리가 세상을 이해하는 기본적인 틀(Frame)과 맞닿아 있다.
그렇다면, 결과가 원인에 의한 결과인지, Error에 의해 우연한 결과인지 여부를 어떻게 확인할 수 있을까?
Y(결과)의 변동의 크기를 원인에 의한 변동과 Error에 의한 변동으로 구분할 수 있다면 쉽게 확인할 수 있을 것이다.
몸무게 = F(운동량) + Error의 상황에서 우리의 관심사는 몸무게 증감 여부일 것이다.
운동량 변화에 따라 몸무게의 변동과 Error에 의한 몸무게 변동으로 구분한 다음, 두 개의 비를 계산한다면 운동량이 몸무게에 얼마나 크게 영향을 주는지 쉽게 확인할 수 있다.
이 비(Ratio)를 "F 값"이라고 하는 데 단위는 "배"가 된다.
만약에 F값이 5라고 한다면, "운동으로 인한 체중의 변화의 힘이 Error에 의한 체중의 변화 힘 보다 5배 크다" 라는 뜻이다.
즉. F값을 통해서 우리는 일상생활에서 원인이 결과에 얼마나 영향을 주는지 또는 원인이 결과를 얼마나 잘 설명해 주는 지를 확인할 수 있다.
F값이 크다 → X가 Y에 큰 영향을 주고 있다. X가 Y를 잘 설명한다.
F값이 작다 → X는 Y에 영향을 주지 않는다. X가 Y를 잘 설명하지 못한다. --> 다른 원인을 찾아야 한다.
F 값을 만들 사람은 F. A. Fisher(1890~1962)입니다. 통계학의 아버지라고 불리며 미국에서 최초ㅀ 통계학과를 만드신 분입니다.
1920년대 비료 종류에 따라 수확량이 우연에 의한 것인지, 비료 때문인지 확인 하기 위해 이런 아이디어를 만드셨습니다. 이 분의 공헌으로 결과(Y)의 변화가 진짜 원인 때문인지 아니면 우연(Error)때문인지를 수치로 확인할 수 있게 되었으며, 오늘날 거의 모든 분야(제조, 의학, 마케팅, 생명과학, AI 등)에서 널리 활용하고 있습니다.