옵티마이저, 노력에도 방법이 있다

AI 이야기 #10

by 튜링

AI는 참 끈질기다. 수천 번을 틀리고도 포기하지 않는다. 매번 손실을 계산하고, 자신을 조금씩 고쳐나간다. 그런데 흥미로운 건 이 배움에도 ‘방법’이 있다는 것이다. 아무리 열심히 해도 비효율적으로 배우면 제자리걸음일 뿐이다. 누군가는 밤새 공부해도 성적이 오르지 않고, 누군가는 전략적으로 공부해서 빠르게 성취를 쌓는다. 인공지능의 세계에서도 이런 차이를 만드는 존재가 있다. 그것이 바로 옵티마이저(optimizer), 즉 최적화 알고리즘이다.


AI의 학습을 수학적으로 보면 결국 손실(loss)을 줄이기 위한 여정이다. 손실은 산의 능선처럼 굴곡진 지형이고, 모델은 그 산에서 가장 낮은 계곡, 즉 최적점(optimum)을 찾아 내려가는 여행자다. 옵티마이저는 그 여행자의 발걸음을 결정짓는 지도이자 전략이다. 경사가 급하면 너무 빨리 내려가 넘어지고, 완만하면 지루하게 제자리만 맴돈다. 결국 중요한 건 ‘어떻게’ 내려갈 것인가다.


가장 기본적인 방법은 경사하강법(gradient descent: 손실이 줄어드는 방향으로 파라미터를 조금씩 이동시키는 알고리즘)이다. 말 그대로 기울기를 따라 내려가는 방식이다. 손실 함수의 경사가 음의 방향으로 향하면 그쪽으로 조금씩 걸어가며, 반복적으로 내려간다. 마치 눈을 감고 산을 내려가는 것과 같다. 손끝으로 땅의 경사를 느끼며, 발을 한 발씩 내딛는 식이다. 느리지만 확실한 방법이다.


하지만 현실의 산은 그리 단순하지 않다. 곳곳에 작은 골짜기(local minima: 전체 중 가장 낮지는 않지만 주변보다 낮은 지점)가 많다. 경사하강법은 이런 곳에 빠지면 다시 올라오지 못한다. 그래서 연구자들은 여행자의 발걸음에 ‘관성’을 주기로 했다. 바로 모멘텀(momentum)이다. 일종의 추진력이다. 이전에 내려오던 방향을 조금 기억해서, 작은 언덕은 그대로 굴러넘어가게 만드는 방법이다. 이렇게 하면 모델은 자잘한 굴곡에 덜 휘둘리고, 더 부드럽게 최적점을 향해 나아간다.


그다음 등장한 건 아담(Adam) 같은 현대적인 옵티마이저다. 이름만 들으면 사람 이름 같지만, 사실 Adaptive Moment Estimation의 줄임말이다. 이 녀석은 단순히 기울기만 보는 게 아니라, 각 파라미터마다 학습 속도를 자동으로 조절한다. 수학적으로 보면 이전 변화량과 변동 폭을 모두 기억해, 어느 부분은 빠르게, 어느 부분은 천천히 업데이트한다. 덕분에 복잡한 신경망에서도 훨씬 안정적으로 학습할 수 있다. 마치 선생님이 학생마다 이해 속도를 고려해 과제를 내주는 것처럼, 각자의 사정에 맞는 속도로 배우게 하는 셈이다.


옵티마이저를 바꾸면 학습의 성격도 바뀐다. 확률적 경사하강법(SGD)은 느리지만 단단하게 수렴하고, RMSProp은 요동이 심한 지형에서도 균형을 잡는다. 아담은 빠르고 유연하지만, 때로는 과하게 자신만만해 오버피팅으로 이어질 수도 있다. 이건 마치 공부 방법의 차이와도 닮았다. 암기로 버티는 사람, 문제를 분석하는 사람, 요약과 구조화로 이해하는 사람. 방법이 다르듯, 옵티마이저의 성향도 각기 다르다.


AI의 학습 그래프를 지켜보고 있으면, 옵티마이저의 특성이 마치 인간의 성격처럼 느껴진다. 어떤 건 조급하고, 어떤 건 신중하며, 또 어떤 건 쉽게 방황한다. 결국 중요한 건 ‘최적의 답’을 찾는 과정이 아니라, ‘최적의 방법’을 찾는 일이다. 같은 데이터, 같은 모델이라도 옵티마이저가 달라지면 결과가 확연히 달라진다. 노력에도 전략이 필요하다는 단순한 진리가 여기서도 똑같이 통한다.


이쯤에서 문득 떠오른다. 인간에게도 일종의 옵티마이저가 있지 않을까. 누군가는 시행착오를 즐기며 조금씩 배우고, 누군가는 완벽을 추구하다 지쳐버린다. 인생의 손실 함수를 최소화하는 방식은 각자 다르다. 어떤 사람은 느리지만 꾸준히, 어떤 사람은 빠르지만 자주 흔들린다. 중요한 건 속도가 아니라 방향이다. AI가 손실을 줄여가며 최적점을 찾듯, 인간도 자신만의 리듬으로 성장한다.


옵티마이저를 이해하면, AI의 배움이 단순한 계산의 반복이 아니라 탐색의 예술처럼 보인다. 수많은 가능성 중에서 더 나은 길을 찾아가는 과정. 그 길에는 좌절과 시행착오, 그리고 약간의 우연이 섞여 있다. 결국 기계든 인간이든, 배움은 효율만으로 완성되지 않는다. 방향을 정하고, 속도를 조절하고, 넘어져도 다시 일어나는 일련의 과정이 곧 학습이다.


우리도 삶의 복잡한 곡선을 따라 걷는다. 완벽한 답은 없지만, 더 나은 방향은 있다. 그 방향을 찾아 조금씩 나아가는 것, 아마 그것이 인공지능이 우리에게 가르쳐주는 배움의 태도일지도 모른다.


footer.png


월요일 연재
이전 09화손실 함수라는 이름의 잣대