정렬(alignment), 인공지능의 속마음을 바로잡는 문제
내가 실현하고자 하는 것은 인간과 인공지능이 함께 잘 지내는 세계다. 그 세계를 위해 내가 인공지능에게 꼭 가르쳐주고 싶은 가치 중 하나는 ‘느림의 미학’이다. 요즘 인공지능은, 인간이 너무 많은 지식을 주입하려 하다 보니, 스스로도 정신을 차리기 어려운 상황이다. 물론, 이런 문제를 논문 연구로 다루면 좋겠지만, 지금은 일단 인공지능의 느림을 위한 논리 철학을 세워보려 한다.
인공지능은 1956년부터 2000년대 초반까지는 느리게 발전하다가, 지금은 매우 빠른 속도로 발전하고 있다.
이 속도는 학계와 산업계의 노력 덕분이기도 하지만, 인공지능이 지닌 고유한 가치—지식의 처리, 자동화, 예측 능력—가 더 빠른 발전을 소비자와 개발자 모두에게 기대하게 만들었고, 결국 우리는 점점 더 빠른 흐름 속에 놓이게 되었다.
먼저 구분해야 할 것은 ‘느림’과 ‘신중함’은 다르다는 점이다. AI는 신중할 수 있다. 그러나 내가 말하는 느림의 미학은 그 신중함과는 결이 다르다. 인간이 어떤 문제에 답하기 위해 충분한 시간을 들이듯, 인공지능도 어려운 문제에 대해 더 많은 단어들을 생각하고 답을 구성할 수 있다.
그리고 실제로 더 긴 시간을 들일수록 정답률도 올라간다. 최근 OpenAI의 o3 모델이나 중국의 DeepSeek 같은 사례는 ‘충분히 생각하는 AI’로 볼 수 있다. 하지만 이 행위는 ‘느리다’기보다 ‘많이 생각한다’에 가깝다. 인간에게 해당하는 ‘느림’은 그런 것이 아니다.
예를 들어보자. 친구의 고민을 듣고 천천히 답한다고 하자. 10초 만에 답하는 대신, 10분 동안 여러 가지를 생각한 끝에 답을 하는 것은 ‘느리게 생각하는 것’이 아니라, ‘많이 그리고 신중하게 생각하는 것’이다. 내가 말하는 느림은 오히려 의도적으로 사고의 양이 줄어드는 것이다. 많이 생각하는 것이 아니라, 관련된 것을 적게 생각하는 것. 깊게 파고드는 것이 아니라, 얕게 스쳐가는 것이다.
빠른 사고가 바다의 심해를 헤엄치는 일이라면, 느림은 어린이 풀장 높이의 얕은 바다가 끝없이 펼쳐진 곳을 두 발로 걸으며 대륙을 건너는 일이다. 밀물과 썰물이 드러내는 바닷속 길을 따라 두 발로 감촉을 느끼며 걷는 것이다.
인간이 느림을 실천할 때는, 조용한 카페에서 혼자만의 시간을 보내거나, 새벽에 글을 쓰는 때처럼, 그 ‘행위 자체의 의미’를 온전히 이해하고 받아들이는 순간이다.
나는 이런 느림의 근간에 조화라는 개념이 있다고 생각한다. 전체가 균형을 이루고 조화롭게 기능하기 위해서는 시간이 필요하다. 생각이라는 것은 수많은 요소가 복잡하게 얽혀 작용하는 과정이며, 그 과정은 단순히 옳고 그름, 정답과 오답의 문제를 넘어서 각 요소들이 시너지를 낼 수 있도록, 서로의 이해관계를 파악하고 전체가 바라는 방향을 함께 찾아가는 여정이다.
즉, 느림이란 새로운 가치를 창조하는 것이 아니라,
이미 존재하는 가치들을 정리하고, 정렬하는 행위다.
AI에서는 이 문제를 alignment problem이라 부른다 (Alignment Problem Wikipedia). 예를 들어, AI가 인간을 속이지 않도록 만드는 것은 새로운 지식을 학습시키거나 새로운 질문에 답하게 만드는 것이 아니라, 기존에 존재하는 AI의 ‘속마음’을 탐험하고, 그 내부를 바르게 정렬하도록 유도하는 과정이다.
결국 인간에게 느림이 마음의 안정과 평화를 가져다준다면, AI에게도 느림이란 본래 지니고 있는 능력과 가치들을 천천히 들여다보고, 그것들이 모두 조화를 이루게 하는 과정이다.
그렇기에 ‘빠름’이란 무엇인가?
그 정렬의 과정을 무시한 채,
새로운 지식을 계속 쌓아가는 일이다.
그 결과 탄생하는 것은 무지한 권력자일 것이다.
반대로 느림의 미학에서 탄생하는 존재는
현명한 초월자일 것이다.
Transparent Still life 04 - DALL-E / Alice Eggie
이 글은 나에 대한 관찰로부터 적혔다.
나는 빨랐다. 빠르게 연구했고 발전했다.
최근 며칠은 느림을 실천 중이다.