4화 – 회귀분석이 나한테 말 걸었어

(“네 데이터, 직선으로 설명할 수 있을까?”)

by 라이브러리 파파

그날은
SPSS 창을 10분 동안 바라보다가
그냥 껐던 날이었어.


회귀분석 창 앞에서
무슨 변수를 넣고,
무슨 버튼을 눌러야 할지 몰랐거든.

근데 더 솔직히 말하면
회귀분석이 뭘 하려는 건지도 몰랐어.

“A Korean graduate student staring at a line graph that doesn’t fit, scratching their head in frustration, a coffee mug beside the laptop, background shows notes with curved trend lines drawn” (3).jpg

형은 처음에
‘회귀’라는 말에서부터 막혔어.

‘다시 돌아간다’는 뜻 아닌가?
대체 뭘 회귀하겠다는 거지?
(이건 나 혼자만 레벨업에 나온다는

그 회귀인가..?)


데이터가 집으로 돌아간다는 건가?

진짜 그렇게 생각했어.
농담 아니고.

그때 교수님이 이렇게 말했어.

"회귀분석은 변수 간 관계를 직선으로 설명하는 모델입니다."


딱 그 한마디 듣고,
아… 그래프구나.
X축, Y축, 그리고 직선.
y = a + bx.


근데 문제는 여기서부터였어.

직선은 그릴 수 있는데

왜 이게 회귀인지,
그리고 내 데이터가
그 직선을 따라가는 게 맞는지
전혀 감이 안 오는 거야.


그러다 내가 내 데이터를 들여다보다가
진짜 이상한 느낌을 받았어.


얘가 나한테 말 거는 느낌이었어.

“형…
나 직선으로 설명 안 돼요.”


진짜 그랬어.
팀장의 리더십 점수가 올라갈수록
팀원 몰입도는 올라가다가
어느 지점부터 다시 떨어지더라고.


처음엔 상사에 감동하다가
나중엔 너무 간섭해서 지친다는 거지.

직선으로 설명하면
그 뒷부분 감정은 다 날아가.


그때부터 형은 알았어.

회귀분석은
설명하고 싶은 ‘방향’이 명확해야 한다는 걸.


단순히
X가 오르면 Y도 오르나요?
이게 아니라,

“내 데이터는 진짜 그렇게 움직이나?”
를 물어야 한다는 거야.


그제야 y = a + bx
이 공식이
숫자의 공식이 아니라
태도의 공식이란 걸 느꼈지.



“A Korean graduate student staring at a line graph that doesn’t fit, scratching their head in frustration, a coffee mug beside the laptop, background shows notes with curved trend lines drawn” (1).jpg

형이 피피티 만들던 그 밤도 기억나.
교수님 앞에서 말해야 했거든.


“리더십 점수와 몰입도 간 관계를
회귀분석으로 설명하고자 했습니다.

하지만 단순선형은 설명력이 떨어졌고,
곡선형 패턴이 존재했습니다.”


떨렸지.

근데 교수님이 고개를 끄덕이셨어.

그건 완벽한 분석이 아니라
솔직한 분석이었기 때문이야.


회귀분석은
멋진 그래프를 그리는 게 아니라
‘내 데이터가 정말 어떤 성격을 갖고 있는지’
그걸 인정하는 거거든.

형이 말해줄게.


회귀분석은
네가 데이터를 얼마나 잘 알고 있는지
그게 딱 드러나는 구간이야.


그러니까 데이터가 말 걸면
가만히 들어봐.


“형,
나 직선 말고 곡선인데요?”

이 말,
한 번쯤 꼭 들을 거야.


그때 절대 억지로 선에 끼워 맞추지 마.

그건 분석이 아니라 압박이야.


다음 화 예고

5화 – p값이 알려주는 건 단 한 가지.
“우연인가, 아닌가.” 그 이상도, 이하도 아냐.

keyword
매거진의 이전글3화 – 상관관계는 꼭 인과관계가 아닐 수도 있다는 거