14화–통계는 팩트를주고 사람은 그걸로 이야기를만든다

(결과보다 위험한 건, 해석이다)

by 라이브러리 파파

그날 나는 친구랑

같은 데이터를 분석하고 있었어.


팀 프로젝트였고,

데이터는 설문조사 결과.


리더십, 몰입도, 성과.

변수도 똑같았고, 분석 방식도 같았어.


근데 문제는 여기서부터야.



내 해석은 이랬지.


“리더십이 높으면 몰입도가 올라가고,

몰입도가 성과를 설명한다.”


근데 친구는

완전 반대로 말했어.


“몰입도가 성과에 직접 영향을 주고,

리더십은 그걸 간접적으로 조절한다.”




같은 데이터, 같은 분석,

근데 결론은 다름.


나는 멍했지.


‘통계는 진실을 말한다며…

그럼 우리는 왜 다르게 말하지?’




교수님은 그걸 듣더니

차분하게 말씀하셨어.


“통계는 결과를 보여주지만,

해석은 늘 사람이 한다는 걸 잊지 마세요.”




그 순간,

통계의 ‘객관성’이

무너졌다기보다

다르게 보였어.


숫자는 그 자체로 존재하지만,

의미는 해석자에 따라 달라지는 거야.




형은 그 이후로

통계를 다룰 때

이 세 가지를 꼭 적어.


1. 이건 데이터가 말한 건가,

내가 말하게 한 건가?


2. 다른 해석 가능성은 없는가?


3. 내 이론이나 가설이

결과를 강제로 끌어가고 있진 않은가?




우리는 자꾸

p값이 유의미하다고 하면

“그래! 내 말이 맞았어!”

라고 생각해.


근데 그건

데이터가 그렇게 말했다기보다,

우리가 그렇게 듣고 싶은 거야.




형은 그걸

"통계적 확증 편향"이라 불러.

보고 싶은 것만 보는 것.

그건 과학이 아니라,

자기주장에 숫자만 붙인 거야.




진짜 좋은 해석은

‘맞는 말’이 아니라

‘조심스러운 말’이야.


그래서 논문에서

“제한점”을 쓰는 이유가 그거야.

결과는 이렇지만, 다른 가능성도 열어두겠다.




형이 너한테 꼭 해주고 싶은 말.


통계는 객관적이지만,

해석은 항상 주관적이다.


그걸 인정하고 쓰는 사람만이

진짜 설득력 있는 분석자가 돼.




그러니까 분석 끝났다고

“이게 정답입니다!” 하지 마.


그건 그냥

숫자에 취한 거야.


한 걸음 물러서서,

‘이 숫자가 말하고자 하는 게 뭘까?’

그걸 계속 질문하는 사람이 돼야 해.




다음 화 예고


15화 – 논문 속 통계표,

숫자보다 ‘문장’을 먼저 써야 한다


(표는 근거일 뿐, 설명은 네 몫이다)


keyword
매거진의 이전글13화 – 독립이냐 종속이냐