brunch

You can make anything
by writing

C.S.Lewis

by 해이 Jul 07. 2022

썸타기에 대한 수학적 고찰

회사원을 위한 수학 [상관분석, 회귀분석 #1]


남자가 여자에게 점심을 삽니다.

여자는 고맙다고 커피를 사네요.

그렇게 3번 정도 점심과 커피를 주거니 받거니.


남자가 이번엔 저녁을 사겠다고 합니다.

여자가 하필 그날은 선약이 있어서 오후에 커피나 한잔 하잡니다.


남자는 며칠이 지난 후,

이번엔 범죄도시2를 같이 보자고 합니다. 여자는 손석구가 보고 싶었다며 흔쾌히 수락합니다. 영화를 보고 돌아가는 길에 여자는 남자에게 '영화 굿굿이었어요'라고 보냅니다.


용기가 생긴 남자는 며칠 뒤에 저녁 번개를 쳐봅니다. '을지로3가 맥주에 노가리, 콜?' 답장이 오기까지 시간이 걸렸지만 결국 '굿굿굿! 퇴근 7시 궈궈~'라는 답장을 얻어냅니다. 거기 7시에 가면 만석인 게 함정 

여름밤 습한 바람에 노상에서 맥주 마시는 갬성. 목구멍을 적시는 호프, 거기에 마요네즈/고추장이 반반 섞인 동서양 혼합 소스를 찍어 먹는 노가리 맛의 밸런스... 지금까지 본 중에 여자의 표정이 가장 환해 보입니다. 맥주를 시원하게 들이켜는 그녀를 보며 이번엔 더 용기를 내봅니다.


남: 주말에 드라이브 갈래요? 파주에 장어 맛집 있는데.

여: 오~ 맛있겠다! 콜!


이게 돼?

쿵쾅 거리는 가슴을 부여잡고 주말에 차를 끌고 나선 남자. 약속 장소에서 여자를 만나고, 파주까지 가는 강변북로를 달립니다. 창문을 여니 강바람이 세차게 들어옵니다. 머리를 흩날리며 햇빛에 반짝이는 한강을 바라보는 여자의 입에서 "와~~! 완전 좋아!"라는 외침이 나옵니다. 맛있는 장어, 출판단지 산책과 북카페... 여자는 일주일의 피로가 풀리고 기분이 환기가 된다며 좋아합니다. 도심을 벗어나 교외로 나온 게 신의 한 수 같습니다.


커피 한잔 시켜놓고 둘은 이런저런 대화를 하는데, 남자는 이 대화가 성에 안 찹니다.
마음속에 있는 그 말을 어서 해야 할 텐데...
좀만 더 어둑해지면 분위기 좋으련만 여름은 왜 이리 해가 긴 건지...
그나저나 이 여자도 나와 같은 생각인 건지...
지금까지 행동을 보면 말을 해도 되지 않을까...


이런 잡생각이 머리를 휘감는 중에 남자는 자기도 모르게 그만,


남: 우리 사귈래요?

여: ...






문제:

남자의 고백에 여자는 어떤 대답을 할까요?


우리는 감으로 압니다. 틀릴 수도 있지만, 어쨌든 우리는 감으로 압니다. 하지만 그 감이라는 것, 촉이라는 것. 사실 우리 머릿속에서 계산을 한번 돌린 결과입니다.


남자는 사실 그간의 행동을 이렇게 순서쌍으로 생각하며 그 추세를 헤아렸을 겁니다.


(점심, 커피)

(점심, 커피)

(점심, 커피)

(저녁, 커피)

(영화, 굿굿)

(맥주, 굿굿굿)

(주말, 완전좋아)

.

.

.

(고백, ???)


사실 이런 머릿속 정리가 상관분석, 회귀분석의 시작입니다.

우리는 그 개념을 이미 머릿속에 탑재하고 있습니다.

일상의 썸타는 관계에 빗대어 설명해보겠습니다.




1. 상관분석이란?

  - 관계의 방향과 그 강도를 파악하는 것


| 관계의 방향

둘의 관계는 누가 봐도 썸입니다. 위의 7개의 순서쌍을 보면 남자가 점차 +(positive) 행동을 강화할 때 여자도 +(positive) 반응이 강해졌습니다. 물론 중간에 삐끗(저녁, 커피)한 게 있긴 합니다. 남자는 +로 상승한 요청을 했는데, 여자는 -(negative)로 하강한 반응을 보였죠(그 값이 -인 게 아니라 방향이). 하지만 전체적으로 보면 둘의 관계는 +방향으로 향해 있습니다.


| 관계의 강도

관계라는 건 방향도 있지만, 그게 어느 정도의 강력함이냐 라는 것도 있습니다. 관계의 강도라는 건 뭐냐면, 둘이 유사한 수준의 행동 변화를 보였냐는 겁니다. 남자가 점심(+) → 영화(++) → 맥주(++++) → 주말(+++++) 이렇게 그 행동의 변화량을 점차 크게 할 때, 여자도 그에 맞춰 커피(+) → 굿굿(++) → 굿굿굿(+++) → 완전좋아(++++) 이렇게 반응의 변화량이 점점 커졌습니다. 어느 한쪽이 커지는 양상과 비슷한 양상으로 다른 쪽도 커지느냐, 또는 비슷한 양상으로 작아지느냐 이것이 관계의 강도입니다. 관계의 강도가 비슷한 양상으로 커지고 작아진다는 말은, 차트로 그려봤을 때 점들이 관계의 방향을 따라서 서로 얼마나 밀집해 있느냐를 뜻하게 됩니다. 관계의 강도가 약하다면, 남자의 구애 행동이 커질 때 여자의 반응 행동의 크기가 너무 들쑥날쑥할 겁니다. 그것을 차트로 그려보면, x값(남자 행동)이 오른쪽으로 갈 때 y값(여자 반응)이 위아래로 요동을 칠 테니 점들이 밀집해 있지를 못하겠죠.


강한 썸(+). 직진하세요.



| 음(-)의 관계이고, 강도도 센 경우

아까와는 다른 이런 경우를 가정해봅시다.

'점심' 먹자(+)니까 '굿굿'(++) 했다고 해보겠습니다.

'영화' 보자(++)니까 '선약이 있어요'(-) 그러고,

'저녁' 먹자(+++)니까 '혼자 드세여'(---) 그러고,

'주말'에 보자(+++++)니까 '꺼져'(----) 그랬다면,

남자의 +행동에 여자는 점차 -로 행동하니까 둘의 관계는 -방향으로 향해 있는, 여자가 남자 싫은 거죠. (여자가 -행동만 해서 -방향이라는 게 아닙니다. 처음에 점심 요청에는 굿굿(++)이라고 +행동을 했어요. 점차 행동이 낮아지는 쪽으로 갔다는 점에서 -방향이라는 거예요.) 여기서, 남자의 +행동의 크기가 점차 커지는 폭만큼 여자의 반응은 점차 유사한 폭으로 낮아지므로, 그 '싫은 관계'의 '강도가 꽤 세다'라고 말할 수 있는 겁니다.


남자를 강려크하게 싫어하는 관계.



| 양(+)의 관계인데, 강도가 약한 경우

'점심'을 샀더니(+) 갑자기 '굿굿굿'(+++) 그러고,

'영화' 보자(++) 했더니 '굿굿'(++) 그러고,

'저녁'(+++) 먹자 했더니 '완전 좋아'(++++) 그러고,

'맥주'(++++) 먹자 했더니 술 말고 '커피' 먹자고(+) 하고,

'주말'에 만나자(+++++) 했더니 또 '완전 좋아'(++++) 그러면?

이 경우, 대체로 +에 +로 응하였으니 둘의 관계가 썸이라는 +방향은 맞습니다. 하지만 남자의 행동 수준이 점점 커지는 양상에 비해 여자의 행동 수준이 들쑥날쑥합니다. 여자도 남자에게 호감 있는 것 같긴 한데, 좀 종잡을 수가 없습니다. 종 잡을 수 없다는 건, '썸 관계'인 건 맞는데, '그 강도가 약한' 겁니다.


남자 헷갈립니다. 여성분께서 만약 마음이 있다면, 상대방 마음의 크기에 맞춰서 반응해주세요.



| 상관관계를 찾을 수 없는 경우

'점심'(+) 샀더니 '커피'(+) 답례하고,

'영화'(++) 쐈더니 '커피'(+) 답례하고,

'저녁' 먹자(+++) 했더니 '커피'(+) 답례하고,
남자가 뭘 해도 여자가 다 '커피'만 산다면?

이 경우, 남자의 +행동에 여자가 +응답을 하는 것 같지만, 가만 보면 일정한 고정값으로 응하므로 둘의 관계는 아무런 관계도 아닌 겁니다. 커피 답례받았다고 썸은 아닌 것이며, 그렇다고 여자의 반응에 변화가 없다고 해서 여자가 남자를 '싫어한다'라고 곧바로 해석할 수도 없습니다. 속내는 모르겠지만 일단 그냥 '무관심' 한 것으로 해석해야 합니다. 이런 경우 둘 간의 관계는 +냐 -냐 이런 게 아니라 그냥 '무'의 관계입니다.


No 관심입니다. 포기하세요.




2. 회귀분석이란?

  - 관계를 방정식으로 표현하는 것


| 우린 신이 아니기에, 실측 데이터 필요

이렇게 관계의 방향과 크기는 알겠는데, 마지막 순서쌍(고백, ???)이 문제입니다.

아무리 썸이라고 해도, 그리고 그 썸의 세기가 세다고 해도, 고백했을 때 어떤 반응일지는 아무도 모르는 겁니다.


고백하면 어떻게 될지 데이터 없이는 모릅니다.



| 실측 데이터로부터 추세선(회귀식)을

물론, 예측은 됩니다. 지금까지의 순서쌍을 통해 볼 때, 고백하면 받아 줄 것 같기는 합니다.

지금 이 말이 중요합니다. 지금까지의 순서쌍을 통해 볼 때 라는 말. 우리는 생판 미래를 예측할 수는 없습니다. 과거의 관계(데이터)로부터 미래의 관계를 생각하게 되어 있습니다. 배드민턴 치자고 꼬셔 커피 한 잔 하자고 불러 넌 한 번도 안 된다는 말이 없었지 라는 노래 가사처럼, 거절하지 않았던 그 흐름의 연장선에서 남자는 생각한 겁니다. 점차 데이트의 수위를 높여나갈 때 그녀의 반응도 높아졌으니, 고백도 그에 상응한 반응을 할 거라고.


많은 구애 행위로부터 데이터를 얻어야 합니다. 실측 데이터로부터 추세선을 그릴 수 있거든요.
추세선을 그리게 되면 그 연장선으로부터 고백이라는 행동이 어떤 결과를 가져올지 예측이 가능합니다.
그녀의 마음은 이미 고백을 받아줄 준비가 되어 있었군요.



| 예측 위해 추세선(회귀식)을 구하는 것이 회귀분석

차트를 놓고 말하자면, 모든 실측 데이터(점)들에 가장 가까이 지나가는 선을 구하는 것이 회귀분석입니다. 수식을 놓고 말하자면, 실측 데이터들로부터 X가 어떤 과정을 거쳐서 Y라는 값으로 변환되는지 그 방정식을 구하는 것이 회귀분석입니다. 회귀분석을 하는 목적은 실측 데이터에 없는 X를 대입했을 때, 어떤 결과 Y가 나올지 예측하기 위함입니다.

이것은  미래만 예측하기 위함은 아닙니다. 이미 있는 데이터 중에 값이  너무 튀는 경우, 추세대로였다면 이건 어떤 값이었을까 하는 궁금증도 풀어줍니다. 회귀식을 구했다면, 우리는   최초의 예에서 저녁 먹자고  남자의 요청에 커피만 마시자고 거절했던 여자의 속마음을 예측해볼  있습니다. "다른 모든 행동의 순서쌍을 통해 이런 선을 그을  있었고  선대로라고 가정하면, 그때 여자는 사실 '굿굿굿'이라고 외치며 저녁식사에 응했을  있겠구나"라는 예측이 됩니다. 어쩌면 여자가 너무 순순히 마음을 여는 것처럼 보일까  한번쯤 튕긴 것은 아니었겠나...라고 우리는 회귀식을 통해 예상해볼  있는 것입니다. (예측은 예측으로만. “당신도 사실 나랑 저녁 먹고 싶잖아!?” 하면 안돼요.)



정리하면,

상관분석은, 무슨 관계인지(방향과 크기)만 따져보는 겁니다. 서로 좋아하네 짝사랑이구나 앙숙이네... 와 같은 관계의 방향을 파악하고, 서로 좋아서 죽네, 지독한 짝사랑, 현실 남매 수준의 앙숙... 과 같이 관계의 강도를 분석합니다.

회귀분석은, 썸이구나... 와 같은 관계 파악에서 한걸음 더 나아가, 이 관계를 가장 잘 나타내 주는 회귀식(방정식)을 찾아내는 겁니다. 그 방정식을 찾아낸다면, 그 식에 남자의 행동 값 [고백]을 대입했을 때 이 여자의 행동 [???]를 예측할 수 있게 됩니다. 회귀분석은 예측을 위한 분석입니다.



3. 다음 글에서 조금 더 수학적으로


상관분석과 회귀분석.

순수한 호기심도 있겠지만, 회사 업무 때문에 검색하신 경우라면, 본인이 보고서에서 회귀분석  내용을 상급자(피보고자)에게 설명해야 해서 궁금한 것이라 생각됩니다. 그렇다면 두 개 분석의 개념을 이론적으로 완벽하게 아실 필요까지는 없습니다. 이미 회귀분석을 이용해 어떤 수치를 보고서에 담은 분이라면 대강의 개념은 아시리라 생각됩니다. 핵심은 아래의 궁금증이 아닐까 합니다.


"R은 뭐고 R2는 뭐였더라"

"유의성(P-value, P값)이 뭐였더라"

"별표가 3개(***)면 결정력이 높다는 거였던가 유의성이 높다는 거였던가"

 (아니 근데, 결정력이 높으면 그게 유의미한 거 아니야? 이걸 왜 구분해?)


이런 궁금증은 완벽하진 않더라도 그 원리를 이해해야 풀립니다. 다음 글에서는 상관분석, 회귀분석의 원리를 조금 더 수학적으로 정리하겠습니다.





* 커버 사진: 바다가 들린다 (1993, 지브리 스튜디오)


매거진의 이전글 손흥민의 성장 추세를 구하라
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari