합리주의 VS 경험주의
“고양이는 참치 통조림을 이해하지만, 우리와 같은 방식으로 이해하지 않는다.
사람들은 주변의 물건들에 대해 서로 다른 방식과 다른 수준의 이해력을 가지고 있다”
- 요슈아 벤지오
최근 20년동안 AI를 연구하는 학자들이 깨달은 사실 중 하나는 데이터가 알고리즘보다 중요하다는 것이다. 이제 AI의 지능은 알고리즘 기반에서 데이터 기반으로 바뀌었다. 이를 뒷받침하는 핵심기술이 머신러닝이다. 수많은 공식이 중첩된 논리적 판단보다는 데이터베이스의 경험을 참조로 하는 개연적 판단이 주가 된 것이다. 그렇다고 해서 소프트웨어의 미래가 알고리즘에서 데이터로 완전히 전환된 것은 아니다. 알고리즘과 데이터는 별개의 것들이 아니다. 알고리즘은 데이터를 필요로 하고, 데이터 역시 알고리즘을 필요로 한다. 알고리즘이란 수학적으로 완결된 논리구조를 통칭하는 말이다. 간단하게 말하자면 어떠한 문제를 푸는데 필요한 단계와 순서를 명시한 것이다. 그리고 알고리즘을 컴퓨터가 처리할 수 있게 표현하는 것이 소프트웨어다. 일부 인류학자들은 인류가 이뤄낸 가장 큰 혁신이 언어이고, 그 다음으로 중요한 것이 문자의 발명이라고 말한다. 이와 유사하게 컴퓨터를 만들어낼 수 있었던 근본 가치는 알고리즘에 있으며, 가장 큰 혁신은 소프트웨어의 발명에 있다.
알고리즘의 기본은 판단과 처리에 있다. 이것은 if ~ then이라는 프로그래밍 문법 구조로 표현된다. 따라서 알고리즘은 프로그래밍과 컴퓨터에 최적화된 논리구조라고 할 수 있다. 알고리즘이라는 단어의 어원은 9세기경 페르시아 수학자였던 무하마드 알콰리즈미의 성을 라틴어로 표기한 알고리트미에서 유래했다. 사실 알고리즘의 발명은 2000년 전으로 거슬러 올라간다. 고대 그리스 유클리드의 <기하학 원론>이 최초의 알고리즘 문헌이다. 따라서 무하마드 알콰리즈미가 알고리즘을 최초로 발명한 사람은 아니다. 그럼에도 불구하고 9세기경 사람이었던 알과리즈미의 이름이 알고리즘의 어원이 된 데에는 다른 이유가 있다. 고대 그리스인들은 수학문제를 풀기 위해 기하학을 고안해냈다. 즉, 그림으로 수학을 표현하고 계산해 낸 것이다. 그에 반해 알콰리즈미는 대수적 표현법, 다시 말해 임의의 숫자를 문자로 치환하는 방식을 사용했다. x+y와 같은 식으로 말이다. 소프트웨어 프로그램에서 연산을 하기 위해 변수를 할당하는 것과 같은 이치다. 그림으로 개념을 표현하는 대신 문자를 직접 사용하여 수들 사이의 상호작용을 패턴으로 나타낼 수 있게 된 것은 기념비적인 발상이었다. 대수적 표현법이 알고리즘을 가능케 한 것이다.
이후 알고리즘과 컴퓨터는 불가분의 관계를 형성하며 발전해왔다. 1642년 프랑스의 수학자 파스칼이 최초의 기계식 계산기를 발명하였고, 독일의 수학자였던 라이프니츠는 덧셈, 뺄셈만 가능했던 파스칼의 계산기를 개량하여 곱셈과 나눗셈이 가능한 계산기를 만들었다. 이때 라이프니츠는 이미 기계적 계산에 적합한 언어는 이진코드라는 것을 알고 있었다. 다시 말해 0과 1이라는 디지털 세계의 도래를 라이프니츠는 예견했던 셈이다. 그로부터 150년 후 영국의 과학자였던 찰스 베비지가 차분기관을 발명하여 오늘날 컴퓨터의 원형을 제시하게 된다. 앨런튜링과 폰 노이만은 컴퓨터 역사에서 또한 결코 빼놓을 수 없는 인물들이다. 폰 노이만은 최초로 컴퓨터라는 것을 개념화시킨 과학자로 평가받으며, 그의 제자 앨런 튜링은 오늘날의 컴퓨터공학과 정보공학의 시조로 인정받는다.
과거 AI의 발전 역시 알고리즘에만 의존한 측면이 컸다. AI분야는 크게 두 부류로 나뉘었는데, 하나는 심볼릭AI라고 불리는 기호주의학파로 인간의 지식을 모두 기호로 만들어서 기호들의 관계를 표현하면 컴퓨터가 지능을 가질 수 있다는 사상을 기반으로 한다. AI라는 단어의 창시자로 알려진 마빈 민스키 박사가 대표적인 기호주의 사상가다. 이것은 알고리즘을 기반으로 하는 전통적인 연구방식으로 볼 수 있다. 다른 하나의 부류는 신경망(Neural Network)을 연구하는 연결주의 학파다. 이들은 인간의 뇌가 신경망으로 이루어져 있으므로 컴퓨터에 이와 비슷한 구조를 만들어내면 지능을 창조할 수 있다고 믿는다. 인터넷이 등장하고 무어의 법칙으로 일컬어지는 2년마다 두 배씩 증가하는 컴퓨팅 성능 덕분에 빅데이터가 주목을 받게 되면서 학자들은 알고리즘만큼이나 데이터 역시 중요하다는 사실을 깨달았다. 구글이나 페이스북과 같은 거대 IT기업들이 빅데이터의 발전을 가속화시키게 된다. 구글의 창업자인 래리 페이지는 구글이 검색기업이 아니라는 말을 공공연히 하고 다녔는데, 그가 말한대로라면 구글은 검색기업이 아니라 AI기업이다. 구글의 사명은 설립 때부터 검색을 더 좋게 하기 위해 AI를 사용하는 것이 아니라 AI를 개발하기 위해 검색을 사용하고 있다는 것이다. 그런 면에서 막대한 데이터와 검색능력을 보유한 구글이 AI 최신기술의 첨두에 서있는 것은 그리 놀랄만한 사실은 아니다.
데이터가 점점 주목받게 된 것과 달리, 알고리즘을 사용한 기존 방식들은 하나둘 한계를 노출하게 된다. 컴퓨터 비전(Computer Vision)의 이미지 프로세싱 역시 과거에는 알고리즘에만 의존하고 있었다. 인간은 사람의 얼굴을 구분할 때 전체 얼굴을 보고 한 번에 누구인지 판단해낼 수 있으나 컴퓨터는 그와 같은 처리가 불가능하다. 컴퓨터가 이미지를 읽는다는 것은 결국은 픽셀을 하나하나씩 읽는 것에 지나지 않는다. 사람 역시 마찬가지로 조그만 구멍을 통해 한 번에 1제곱센티미터의 얼굴 면적만 보게 한다면 다른 사람의 얼굴을 분간해내기는 어렵다. 수많은 if then을 중첩하는 것은 한계가 있을 수밖에 없었다. 기존 알고리즘이였던 귀납적 논리 구조로는 이미지 프로세싱 분야의 더이상의 발전이 어려워진 것이었다. 고전적인 알고리즘와 소프트웨어 프로그래밍의 체계는 플라톤과 데카르트가 구축한 합리주의 모델에 기반한다. 프랑스의 철학자 르네 데카르트는 합리주의 철학, 다시 말해 이성을 중시하는 근대 철학의 아버지라 일컬어진다. 합리적이고 이성적인 철학의 바탕은 시간이나 비용을 최소화하는 효율과 논리에 있다. 데카르트가 제창한 방법 서설(Discours de la method)은 다음과 같은 네 단계로 이루어진다.
첫째, 분명하게 참이라고 확인할 수 없다면, 그 무엇도 받아들이지 말라.
둘째, 길고 어려운 문제는 내가 잘 이해하고 해결할 수 있을 정도로 짧게 끊어 접근하라.
셋째, 가장 단순하게 알기 쉬운 것으로부터 복잡하고 어려운 순서로 차근차근 탐구하라.
넷째, 이상의 세 단계에서 검토한 부분들은 빠짐없이 모은 다음 확인하고 전체적인 관점에서도 문제가 없는지 재검토하라.
일의 효율을 중요시하는 공학자나 개발자들이 일하는 방식과 유사하다. 이 철두철미한 접근법을 거치면 어떤 문제도 해결할 수 있을 것처럼 보인다. 과연 그럴까? 이 접근법의 가장 큰 문제는 문제를 해결할 수 있는 지식을 미리 가지고 있지 않으면 무용지물이라는 것이다. 문제의 해결방법을 모르면 당연히 문제를 해결할 수 없다. 인간이 모든 지식을 머릿속에 가지고 있을 수 없듯이, AI나 컴퓨터에게 사전에 필요한 모든 지식을 우겨넣는 것은 한계가 있을 수밖에 없었다. 돌파구를 마련한 것이 훈련용 데이터를 가지고 AI가 의사결정 지도를 만드는 상향식 접근법, 즉 딥러닝 기술이었다. 스스로 필요한 것을 배워서 문제 해결에 사용할 수 있게 된 것이다. 이제 AI의 패러다임은 플라톤과 데카르트의 합리주의 모델에서 아리스토텔레스와 존 로크의 경험주의 모델로 전환되었다. 추상적인 아이디어와 명제를 중요시한 관념론에서 현실 세계에 발을 디디게 되는 실천 철학으로의 전환인 것이다. 17세기 영국의 철학자였던 존 로크는 인간이 백지 상태로 태어난다고 주장했다. 존 로크는 모든 지식은 경험을 통해 얻어진다고 주장했고 플라톤의 이데아론을 부정하였다. 빛의 파장은 색을 만들어내지만 그것은 보는 주체가 없으면 아무런 의미가 없다. 소리는 공기압의 진폭변화를 통해 만들어지지만, 우리에게 중요한 것은 그 소리가 어떻게 들리는지 하는 것이지 공기가 얼마의 주기로 진동하느냐가 아니다.
현재 AI의 방법론이 명백히 로크의 경험주의적 접근법을 취하고 있는 것은 자명해 보인다. 하지만 먼저 언급했듯이 알고리즘이 없는 데이터는 무용지물이다. 마찬가지로 데이터가 없는 알고리즘 역시 그러하다. AI의 발전이나 소프트웨어의 미래에 있어 이상론과 경험론의 절충이 필요하다. 다만 막힌 벽을 뚫고 나가기 위한 창조적 전환과정에 데이터는 중요한 요소가 되었다. 이는 창의력의 원천을 똑똑함이나 선천적인 지능으로 착각했던 과거의 인식을 뒤집은 것만큼이나 주요한 발견이다. 지능은 기존 방식이 존재할 때 의미 있는 능력이지만 창의력은 기존 방식이 존재하지 않을 때 문제를 해결하는 능력이다. 현재로서는 창의력은 AI가 범접할 수 없는 인간의 고유영역이지만, 데이터 처리와 알고리즘의 발달이 미래에 어떤 결과를 만들어 낼지는 모르는 일이다.