brunch

You can make anything
by writing

C.S.Lewis

by yangpa Jun 03. 2018

기계학습의 아킬레스 건

2016년 7월 11일

컴퓨터와 인간의 뇌는 정말 다르다. 인간의 뇌에게 아주 단순한 문제가 컴퓨터에게는 무지 어려운 경우가 대부분이고, 그 반대도 그렇다. 얼마 전에 읽은 책 (Thinking, Fast and Slow) 읽으면서 본 이혼 공식이 바로 그런데 -  


한 커플이 이혼할까 안 할까는 다음의 아주 간단한 공식으로 예측 가능하다.     


부부관계 횟수 - 싸움 횟수     


이 숫자가 마이너스면 이혼할 가능성이 높아지고, 플러스면 이혼 안 할 가능성이 높다. 통계와 기계학습에서 예측 모델을 만들 때에 아주 중요하게 여기는 것이 '단순함'인데, 그런 면에서 위의 공식은 아주 훌륭하다.     


하지만 위의 공식을 보고 확 열 받을 수가 있다. 저런 간단한 걸로 결혼생활을 예측하다니, 말도 안 된다!!     

당연하다.     


여기에서 위의 공식을 보고 들 수 있는 생각 중에 틀린 것은 -     


"그럼 섹스를 많이 하면 이혼 안 하겠네" => 아냐 틀려!! 

"그럼 안 싸우면 이혼 안 하겠네??" => 아냐 틀려!!     

위의 반응은 "이혼 안 함 => 좋은 결혼생활" 로 곧바로 치환해서 그런데, 이것은 컴퓨터와 인간의 뇌가 아주 다르다는 것을 간과해서 그렇다. 결혼 상담 전문가에게 좋은 결혼의 공식을 물어본다면 뭐 여러 가지 대답을 하겠지만, 컴퓨터는..     

좋은 결혼이든 아니든 이혼을 할 건지 안 할 건지만 예측한다. 그걸 물어봤잖아?     


그러므로 -     

여자가 (사회적으로 이혼이 어려워서/경제적 자립이 불가능해서) 어쩔 수 없이 참고 사는 경우 - 남자에게 대들지도 못하고, 성관계 요구를 무조건 받아들여야 함

(기러기, 혹은 별거/윈도 부부 상태) 부부관계 횟수도 없지만 싸우지도 않음. 귀찮아서/애들 때문에 이혼도 안함

아주 격렬하게 싸우고, 화해도 아주 격렬하게 함. 보통 한 달에 한 번씩 관계하고, 애들 앞에서 집 때려 부수며 쌍방폭행하는 싸움과 화해도 매 분기마다 한 번씩 함.     


위의 세 가지 예 중에 어느 하나도 '좋은 결혼'은 없다. 하지만 세 커플 다 이혼은 하지 않는다. 그러므로 컴퓨터 모델이 맞다. 내가 물어본 질문은 '이혼을 예측하는 공식'을 달라는 거였고, 여러 가지 변수를 다 살펴보니 제일 간단하고 정확한 모델이 저거라는 거지.     


그렇다면 우리가 진짜 원했던 질문은 -     

"행복한 결혼생활을 어떻게 예측하냐"     

인데, 컴퓨터는 물론 '좋은 결혼생활' 이런 거 모른다. 내가 변수를 하나 찍어줘야 한다. 이럴 경우 부부들에게 설문조사를 해서 "결혼생활이 행복하다"에 "네" 라고 답변할 확률이 얼마나 높은가를 데이터로 넣어서 다시 예측 모델을 만들어야 한다.     


하지만 또 다음 예를 보자.     

여자가 경제권 없어서 잡혀 살고, 남자는 자기 맘대로 외도하며 가족 못살게 굴고 내조받을 건 다 받음. 그러므로 남편은 '좋은 결혼생활'에 '네'라고 대답.

남자가 한국에서 죽도록 일해서 월급 보내고 여자는 외국에서 애 데리고 기러기 엄마 하다가, 한국 들어가기 싫어서 외도하는 건 비밀로 하고 생활비는 계속 받음. 여자는 '좋은 결혼생활'이라고 생각함. 

여자는 며느리의 도리를 해야 한다는 책임감으로 시댁에서 시할머니까지 모시고 살림하고 있음. 남편은 '좋은 결혼생활'이라고 생각. 

남자는 적성에 안 맞는 일이지만 가족 먹여 살려야 한다는 책임감으로 꾸역꾸역 일하고 있음. 부인은 '좋은 결혼생활'이라고 답함.     


한쪽은 죽겠다고 하지만 다른 쪽이 행복하다면, 그리고 그 사람이 답했다면, 그것도 좀 에러죠.     


결론은.     

혹시라도 통계적으로 어쩌고저쩌고하면 꼭 하나 기억합시다. Correlation is not causation. 연관 관계가 있다고 해서 그게 이유는 아닙니다. 예측할 때 유용한 변수라고 해서 인과관계가 성립되는 건 아니죠.     


초등학교 1학년 - 6학년 학생들을 모아놓고 구구단 물어보면, 학년이 높을수록 정답률이 높죠. 그럼 학년을 높이면 머리가 좋아진다 => 틀린 결론. 학년이 높다는 것은 나이가 많다는 거고, 그만큼 산수 공부를 더 많이 했을 거고 구구단도 공부했을 거니까 정답률이 높습니다.     

다이어트 음식을 섭취하는 사람 중에 뚱뚱한 사람이 더 많다 -> 당연. 날씬한 사람보다 뚱뚱한 사람이 더 다이어트를 할 거고, 다이어트 음식 섭취할 확률도 높아지겠지. 그러므로 '다이어트 음식 먹으면 뚱뚱해진다' -> 틀려!!     


위의 이혼 공식의 제대로 된 설명은 -     

부부간에 사랑과 신뢰가 있고 여유가 있고 하면 부부관계의 횟수가 높을 확률이 더 높음. 싸우지 않고 문제를 좋게 해결할 수 있다면 그것도 좋음. 그러므로 이런 부부는 이혼할 가능성 작음.     

좋은 결혼이 아닐 경우, 문화권을 자세히 조사해봐야 낮은 이혼율의 의미를 이해할 수 있음. 이혼녀가 살기 힘들다든지, 여자에게 경제권이 없다든지, 부부간 성폭행이 성립 안 되는 지역이라든지 등등으로 이혼율이 낮을 수도 있음.     

그래서 기계학습이 만능은 아니고요 - 기계학습에서 기억해야 할 법칙 -     

똑똑한 질문을 해야 똑똑한 답이 나옵니다!



매거진의 이전글 오래전 책 후기로 이렇게 썼다. 미래의 나에게
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari