brunch

You can make anything
by writing

C.S.Lewis

by 캬닥이 Feb 06. 2021

삶의 최적값을 찾는 방법

<알고리즘, 인생을 계산하다> 서평

멀쩡히 다니던 회사를 나와 대학원에 들어간 것도 3년 전이다. 이제는 대학원 졸업을 앞두고 다음 단계를 찾는 참이다. 과거의 선택이 맞았는지 모르니 지금 하는 선택도 옳을지 자신이 없었다. 삶에 답이 있기를 바라지만, 다중우주 속 나를 비교할 방법은 없기에 정답이라는 게 없다는 것도 잘 알고 있다. <알고리즘, 인생을 계산하다>를 읽기 시작한 이유가 삶의 답을 찾기 위해서는 아니었다. 오히려 앞에 놓인 수많은 선택지에 하나를 더 늘리려는 목적이었다. 데이터 사이언스를 공부하면 진로에 도움이 될까 싶다가, 관련 지식을 쉽게 풀어 쓴 책을 고른 것이었기 때문이었다. 의외로 책은 삶의 답을 찾는 방법을 말하고 있었다.

컴퓨터과학과 수학자들의 문제 해결 내력을 삶에 바로 적용하기는 어려울 것이다. 그럼에도 내로라 하는 학자와 엔지니어들이 머리를 맞대고, 인간의 계산 능력을 아득히 초월하는 기계를 이용해 답을 찾는 이야기에는 저마다 교훈이 있었다. 알고리즘은 정답이 아니라 최적값을 내놓는다. 완벽한 결과를 보장하지는 않지만, 저마다의 방법론을 적용해 나온 값은 무작정 찍은 답보다 훨씬 낫다.


탐색과 이용(exploration & exploitation). 계산신경과학 수업을 들을 때 운율이 인상적이라 기억하던 용어다. 처음 들어본 용어라도 알고보면 우리 모두 겪는 문제이다. '언젠가 더 큰 호기가 올 지도 모르는데 지금 기회에 매달려야 하나?', ‘몇 번째 연애에 결혼을 할까?’ 수학자들은 이 문제의 최적값을 내놓았다. 기회를 찾는 기간 중 37% 시점에서 이전보다 더 나은 기회를 만났다면 잡아라. 그러면 37% 확률로 최고의 선택을 하게 된다. 이 부분을 읽는 동안 내게도 탐색과 이용의 갈등이 있었다. 작가가 알려준 명쾌한 숫자는 적어도 내 선택의 합리화에는 도움이 되었다. 지금이면 내 기회 탐색 시간의 37% 시점은 되었겠거니 하며 눌러 앉기를 택했다.


과적합(overfitting). 이 용어도 머신 러닝에서 많이 나온다. 관찰한 데이터 몇 개를 바탕으로 그래프를 그려 모르는 구간의 값을 예측한다. 이 때 알고있는 데이터를 전부 식에 넣으면 도리어 그래프가 망가진다. 정확한 값을 추구할수록 실제와 멀어지는 셈이다. 자각하지 못했을 뿐이지 일상에서도 과적합 문제는 많이 생긴다. 결단을 내리기 무서워 근거만 긁어 모을 때다. 근거가 너무 많아도 나쁜 결정을 내린다. 차라리 몇가지 큰 근거로 직관을 따를 때가 더 나은 선택일 수 있다.


Overfitting | DataRobot Artificial Intelligence Wiki


우습지만 나는 이 이야기를 요새 한참 빠진 취미 생활에 적용했다. 취미란 덕질이요, 원작의 크고 작은 요소를 따와 패러디 만화를 그리는 2차 창작이다. 인물의 대사 인용구나 작품 내 사건이 일어난 연도 등 자료가 필요할 때마다 팬덤위키를 뒤져 정확한 정보를 찾았다. 어느 순간이 되니 원작을 좋아하는 나도 기억을 못하는 세세한 사항을 그리고 있었다. 읽는 사람도 알아차리지 못할 내용이었다. 당연하지만, 이런 내용보다는 다들 공감하는 내용을 그릴 때가 나도 재밌고 독자도 좋아한다.


이 외에도 책에는 답을 구하는데 너무 많은 비용이 들 때 덜 정확한 답을 택하는 ‘완화’, 앞뒤 사정을 모를 때는 딱 중간으로 생각하라는 '코페르니쿠스 원리' 등, 답을 구할 수 없는 상황에 적용할 지침이 많이 나온다. 읽기만 해도 재미있는 알고리즘도 많다. 처리 속도를 높이기 위한 캐싱 전략, 인터넷이 데이터를 주고받는 방법 등. 알고리즘이 사람의 삶을 위해 나온 것은 아니지만, 요즘 우리에게 계산 기계는 이미 삶의 일부이기 때문이다.

 

앞서 말한 ‘탐색과 이용’의 기로에서 '이용'을 택한 덕에 데이터 사이언스 공부 계획은 접었다. 이 책에 나온 알고리즘을 스스로 코딩할 일도 아마 없을 터이다. 선택은 내렸으니 이제는 잘 살면 되는 문제다. 세상에 정답은 없되 나는 최적값을 찾을 뿐이며, 바꿀 수 있는 것은 답이 아니라 과정이기 때문이다.



표지 출처: Normal Distribution (Statistics) - The Ultimate Guide (spss-tutorials.com)

* 코페르니쿠스 원리란 우주에서 지구는 펑범한 별일 뿐이라는 것이다. 계산과학에서 코페르니쿠스 원리는 '내 관찰이 특별하지 않다'로 적용된다. 세상이 정규분포를 따른다면, 내 관찰값은 평균에 제일 가까울 것이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari