3화 – 상관관계는 꼭 인과관계가 아닐 수도 있다는 거

(우산과 장화가 닮은 건, 둘 다 비 때문이야)

by 라이브러리 파파

너 혹시 이런 말 들어봤냐?

“상관관계가 있다고 해서
꼭 인과관계가 있는 건 아니다.”


나는 그 문장을
진짜 한 백 번 들었어.

그런데도 몰랐어.

그게 무슨 말인지.
그리고 왜 그렇게까지 강조하는지.


내가 그걸 진짜 이해한 건
논문 피드백받고 나서야.


그땐 이런 식이었거든.

"팀장의 리더십 점수가 높을수록
팀원들의 몰입도도 높았다.

따라서 리더십이 몰입도를 높인다고 할 수 있다."

교수님이 그 문장 보고
딱 한 줄 쓰셨지.

“그래서요?”


와... 그거 보고
노트북 닫을 뻔했어.

상관계수는 높았어.

Pearson r = 0.72
게다가 유의미했어.
p <. 001


그래서 난 정말 자신만만했지.
이거 완전 인과관계잖아요 교수님!
했는데… 아니더라고.


형이 너한테 꼭 알려주고 싶은 건 이거야.

우산을 쓰는 사람과 장화를 신은

사람이 많을수록
비가 오는 건 아니다.


둘은 비가 와서 생긴 결과야.

비가 원인이고,
우산과 장화는 그 결과인 거지.


상관관계는
그저 같이 움직인다는 것만 보여줘.


근데 인과관계는
하나가 다른 하나에 영향을 줬다는 걸 보여줘야 해.

그 차이, 진짜 중요해.

왜냐면 논문이 말하고 싶은 건
그냥 “얘랑 얘가 비슷해요~”가 아니라
“얘가 얘한테 영향을 줬어요!” 거든.

그건 차원이 다른 말이야.

그래서 내가 다시 썼던 문장은 이랬어.


"본 연구에서는 리더십 점수와

팀원 몰입도 간의 유의미한 상관관계를

발견했지만,
인과관계를 주장하기 위해서는

추가적인 실험 설계와 통제변수가

필요함을 논의한다."


음... 뭔가
‘잘은 모르겠지만 조심하겠습니다’ 같은 느낌이지?

맞아, 그게 논문에서 중요한 태도야.

형이 경험으로 얘기해 줄게.
상관계수는 자랑이 아니고,

인과설명은 겸손에서 출발해야 해.

이게 너도 나중에 피피티 만들면서
스스로 느끼게 될 거야.

슬라이드에서 화살표 하나

더 그려 넣는 순간,
책임감이 막 생기거든.

그리고 이건 꼭 기억해.


인과는 늘 설명을 요구하지만,
상관은 그냥 보고 끝나.

이런 차이가
논문을 허접하게 만들 수도 있고,
날카롭게 만들 수도 있어.


“A Korean grad student drawing two circles connected by an arrow and a line graph, pondering the difference between correlation and causation, in a study room with notes and a laptop open to SPSS or R Studio” (3).jpg


그러니까 너도
두 변수 사이 숫자가 비슷하다고 해서
성급하게 "그래서 얘가 얘를 만들었어!"
이런 말은 하지 마.


그건 비가 와서 둘 다 젖었을 뿐이야.
누가 누구한테 물 뿌린 건 아니니까.

다음에 교수님이

“그건 상관이야? 인과야?”
이렇게 물으시면,

눈빛 흔들리지 말고,
침착하게 말해.

"아직 인과를 말하긴 조심스럽습니다."

그거면 박수받을 거야.


다음 화 예고

4화 – 회귀분석이 나한테 말 걸었어.
“네 데이터, 직선으로 설명할 수 있을까?”

keyword
매거진의 이전글2화–평균은 친근한데,표준편차는 왜 이렇게 싸늘할까