커리어의 과대적합 overfitting 피하기

지역 최적해가 아닌 전역 최적해 구하기

Apr 28. 2024

이직 초기에 혼란이 많았습니다. 제가 알고 경험한 매니징이란 이런 거였는데 팀에서 이야기하는 매니징이랑 저런 거였고, 제가 아는 기획이란 이런 거였는데 이직한 팀에서 장려하는 기획이란 저런 거였거든요. 조직 규모도 비슷하고 거의 같은 직무인데, 본질도 방향도 성과를 내는 방법도 모두 달랐습니다.

처음엔 그간 내가 알던 게 너무 얕았다며 스스로의 현재와 과거를 부정하고 의심했습니다. 그런데 끝내 의문스러웠습니다. 분명 그때에는 그 방식으로 문제를 풀었거든요. 그때에 합을 맞춘 분들과도 여전히 알고 지낼 계기가 되었고요.

부정과 의심, 의문이 끝난 건 업계 선배와의 커피챗이나 멘토링, 혹은 명상이나 정신상담도 아닌 '머신러닝' 덕분이었습니다. 과대적합(overfitting), 지역최적해(local optima), 그리고 전역최적해(global optima)라는 말이 눈에 띄었거든요.

머신러닝에선 기존에 가진 데이터 중 일부를 활용해 패턴을 학습하여 모델을 만든 뒤, 다시 나머지 데이터로 테스트를 해보고 스스로의 성능을 진단합니다. 그리고는 "오 나 이 정도면 제법 하는지도?" 혹은 "오 이 문제를 푸는 방법은 이거로구나!" 라며 세상에 나아갑니다. 실전에서 앞으로 마주할 문제도 비슷하게 풀 수 있을 거라고 믿으면서요.

그런데 때로 모델이 기대만큼 성능을 내지 못하는 경우가 있습니다. 모델을 만들 때 사용한 데이터에만 너무 딱 맞는 탓에, 이와는 다른 실제 데이터에는 적응 혹은 적용을 못하는 겁니다. "분명 나는 뛰어났는데... 왜 그런 거지...!!" 라면서요. 이를 너무 과하게 적응했다 하여 과대적합이라 부르고, 이렇게 구한 답은 일부 지역에만 적합하다 하여 지역 최적해로 불립니다.

사실 모델의 성능이 나쁜 게 아닙니다. 분명 문제를 해결했고, 그 안에선 성과가 좋았으니까요. 다만 환경이, 마주하는 문제의 패턴이 다를 뿐이었던 거죠. 그럴 줄을 모르고 너무 지금의 방식, 지금의 문제를 푸는 방법을 익히는데 집중한 거고요.

그제야 커리어도 인생도 최적화 optimization의 문제임을 깨달았습니다. 우리가 익히고 구한 역량이 지역 최적해가 되지 안으려면 다양한 경험이 필요하겠구나, 그리고 이전의 경험과 나라는 모델이 열등하거나 틀린 게 아니라 한정적이었을 뿐이구나, 받아들이게 되었습니다.

다시 머신러닝의 이야기를 빌려보며 글을 마무리합니다. 각각의 뛰어난 모델을 섞어 이용하는 걸 앙상블이라고 합니다. 다양한 프로젝트, 다양한 조직, 다양한 직무는 그래서 필요한 겁니다. 최대한 다양한 경험을 매 순간 열심히 하면 결국 좀 더 나은 답을 구하게 되어있습니다.

keyword

매거진의 이전글분석가의 마음, 분석가의 윤리Analyst 너머 Activist로서의 DA매거진의 다음글