brunch

You can make anything
by writing

C.S.Lewis

by 최재운 Aug 06. 2024

컴퓨터에게 논리를 가르치자, 심볼릭AI의 등장

허버트 사이먼 & 앨런 뉴웰

<쉽고 재밌는 AI의 역사> 두 번째 이야기입니다. 먼저, 기존에 썼던 인공지능 역사 글들을 아래 링크에서 보셔도 좋지만, 안 보셔도 무방합니다 :)


<과거 매거진에 올렸던 AI의 역사>

자연철학의 시작과 앨런 튜링

기계는 생각할 수 있는가에 대한 튜링의 대답

1400만 목숨 구한 앨런 튜링의 비극적 최후

AI 역사를 철학에 빗대어 보는 이유

역사적인 1948년, 사이버네틱스가 탄생하다

인공지능, 이 불행한 이름을 지은자는 누구?

1964년 나온 AI 묵시록

인간은 생각하는 기계다


<쉽고 재밌는 AI의 역사>

1편. 머신러닝을 처음 만든 사람은 누구일까?





2편. 컴퓨터에게 논리를 가르치자, 심볼릭 AI(Symbolic AI)의 등장


우리는 예전 글에서 인공지능(AI, Artificial Intelligence)이라는 용어가 존 매카시, 마빈 민스키 등이 주도한 다트머스 컨퍼런스에서 유래했다는 역사적 사실을 살펴보았다. (링크) 1956년, 존 매카시와 그의 동료들은 다트머스 대학에 모여 두 달간 컴퓨터와 생각하는 기계에 대한 진지한 논의의 장을 마련하였고, 우리는 이를 다트머스 컨퍼런스라 부른다. 


다트머스 컨퍼런스에 참석한 연구원들, 왼쪽부터 올리버 셀프리지, 나다니엘 로체스터, 레이 솔로모노프, 마빈 민스키, 피터 밀너, 존 매카시, 클로드 섀넌


다트머스 컨퍼런스 개최를 위한 펀딩 작업에서 인공지능이라는 용어가 탄생했지만, 사실 인공지능은 다트머스에 모인 많은 학자들이 가진 각자의 아이디어를 포괄하는 명칭 중 하나일 뿐이었다. 디지털 통신의 선구자이자 다트머스 컨퍼런스에 참여하기도 한, 클로드 섀넌(미국의 스타트업 앤트로픽의 인공지능 '클로드'라는 이름이 이 클로드 섀넌에서 유래)의 경우, '오토마타 연구'라는 용어를 선호했으며, 오늘 글의 주인공인 허버트 사이먼과 앨런 뉴웰은 자신들의 연구를 '복잡한 정보 처리'라고 불렀다. 존 매카시와 함께 다트머스 컨퍼런스를 주도한 마빈 민스키 역시 인공지능은 다양한 해석이 가능한 '슈트케이스'라고 표현했다. 


하지만, 존 매카시는 야심 찬 자신의 비전을 담아낼 수 있는 '섹시'한 이름을 원했다. 그리고 그는 '인공지능'이라는 이름을 제안한다. 이를 통해 사람들의 관심을 끌 수 있고, 자금을 확보할 수 있으리라 생각했다. 무엇보다 인공지능이 섹시하고 멋진 기술이라는 점을 부각하고자 했다. 


다트머스 컨퍼런스를 통해 '인공지능'이라는 용어가 명문화되었으며, 인공지능에 대한 다양하면서 경쟁적인 접근 방식 역시 명문화된다. 오늘날까지도 이어지고 있는 연결주의(Connectionism)와 상징주의(Symbolic) 진영 간의 '인공지능 전쟁'이 시작된 것이다. 케임브리지 대학교의 연구원이자 구글 딥마인드의 윤리/정책 담당자인 해리 로는 이 전쟁을 'AI의 핵심 긴장(Core tension in AI)'라고도 부른다.


지금이야 딥러닝으로 대표되는 연결주의 인공지능이 대세를 이루고 있지만, 늘 연결주의가 우세했던 것은 아니다. 인공지능이라는 용어가 처음 제안되고, 수십 년 가까이 상징주의로 대표되는 심볼릭 AI(Symbolic AI)가 학계의 주류로 자리 잡고 있었다. 오늘날의 딥러닝이 주도하는 인공지능 혁명을 이해하려면, 딥러닝이 속한 학파인 연결주의의 역사를 돌아봐야 하며, 자연스럽게 이들과 대척점에 있었으며 수십 년간 인공지능 학계를 지배한 심볼릭 AI에 대해서도 살펴볼 필요가 있다.


연구자들은 컴퓨터가 지능을 가지길 원했다. 이를 위해 컴퓨터가 세상에 대해 배우고 이해할 수 있도록 돕기 위한 인공지능을 개발하기 시작했다. 이들은 "세상의 '지식'이 일련의 '규칙'으로 표현될 수 있으며, 컴퓨터는 규칙을 이용해 생각할 수 있다"라고 믿었다. 존 매카시와 그의 동료들은 컴퓨터에게 '학습의 모든 측면 또는 지능의 다른 특징'을 코드로 설명하고, 기계가 이를 모방하게 하였다. 즉, 인간 사고의 작동 방식, 추론의 규칙을 파악하여 레시피를 제공하면 컴퓨터가 이를 따르도록 프로그래밍 가능하다는 것이 심볼릭 AI를 주창하는 이들의 생각이었다. 특히, 심볼릭 AI의 선구자라 할 수 있는 앨런 뉴웰허버트 사이먼 '충분히 구조화된 사실과 전제를 가진 시스템이 광범위한 지능을 만들어낼 것'이라고 주장했다. 


그렇다면, 심볼릭 AI의 시작을 알린 앨런 뉴웰과 허버트 사이먼은 누구이며, 이들의 업적은 무엇일까? 참고로 이 둘은 모두 컴퓨터 과학계의 노벨상이라 불리는 튜링상을 수상했으며, 허버트 사이먼은 노벨 경제학상까지 수상한 역대급 천재들이다.




앨런 뉴웰(Alan Newell, 1927 ~ 1992)은 미국의 컴퓨터 과학자이자 인지 심리학자이다. 그는 스탠퍼드 대학에서 물리학을 전공했고, 산타모니카에 위치한 RAND 연구소에서 근무한다. 이곳에서 그는 다양한 연구를 진행하며, 기계가 지능을 가질 수 있을 것이라는 생각을 하게 되고, 몇 달 동안 체스를 인간처럼 두는 컴퓨터에 대한 글을 쓴다. 이 글이 당시 카네기 멜론 대학(CMU)에 교수로 재직 중이던 경제학자 허버트 사이먼의 관심을 끌게 된다.


독일에서 이주한 유대인 아버지를 둔 허버트 사이먼(Herbert Simon, 1916 ~ 2001)은 시카고 대학교에서 정치학 학사와 박사 학위를 받은 후, 시카고 일리노이 공과대학에서 정치학 교수로 재직한다. 이후, CMU로 자리를 옮긴 그는 행정학, 산업경영학 등 다양한 학과에 적을 두며 여러 분야의 전공을 융합하는 연구를 진행한다. 정치학과 경제학에 집중하였지만, 지금 글에서 소개하는 바와 같이 인공지능 분야에서도 큰 업적을 남기게 된다. 그래서 그는 훗날 튜링상과 노벨 경제학상을 동시에 수상하게 된다.


1958년 CMU에서 체스를 두는 허버트 사이먼(좌)과 앨런 뉴웰(우)


이 둘 천재의 만남은 다트머스 컨퍼런스 이전으로 돌아간다. 서로 간의 뜻이 맞음을 알아본 이들은 컴퓨터가 사람과 같이 사고하도록 하는 프로그램을 만들기 시작했으며, 다트머스 컨퍼런스 직전, RAND 연구소에서 조니악(Johnniac)이라는 폰 노이먼이 설계한 방식을 그대로 따른 컴퓨터에 LT(Logic Theorist)라는 프로그램을 구현하는 데 성공한다. 


LT라는 이름에서 알 수 있듯이, 이들이 만든 프로그램은 논리를 기반으로 한다. 그렇다면 LT가 논리적으로 사고할 수 있다는 것을 증명하는 방법은 무엇이 있을까? 아서 사무엘이 머신러닝을 개발한 후, 체커 프로그램을 두었던 것처럼, 이들은 자신들의 LT가 논리적이다는 것을 보이기 위해 수학 문제에 도전한다. 그것도 단순 더하기, 곱하기 문제가 아니라 수학자 버트런드 러셀과 노스 화이트헤드가 쓴 책인 <수학 원리 (프린키피아 마테마티카, Principia Mathematica)>에 나온 정리들의 증명에 도전한 것이다.


<수학 원리>는 러셀과 화이트헤드가 1910년부터 1913년까지 공동 집필한 책으로, 수학의 논리적 기초를 탐구하고 있다. 이 책은 수학의 모든 내용을 논리와 공리(기본적인 가정)만으로 증명하려고 시도했다. 즉, 수학이 얼마나 논리적인지를 보여주고자 했던 중요한 작업이었으며, 철학사에서도 기념비적인 책으로 꼽힌다. 이 책에 나온 수학 정리들의 증명을 LT가 해보겠다고 나선 것이다. 그 결과, LT는 <수학 원리> 제2장에 수록된 총 52개의 정리 중 38개를 증명해 낸다. 놀랍게도, 그중 하나의 정리는 책에 있는 증명보다 더 간단하게 해결했다. 그렇다면 LT의 접근 방법은 무엇이었을까?


여기서 '심볼(Symbol)'이라는 개념을 이해하고 넘어가야 한다. 훗날 이들이 기호주의(Symbolism)라 불리게 된 데에는 사이먼과 뉴웰의 접근 방식이 심볼에 기초하고 있기 때문이다. 이들은 인공지능을 구현하기 위해 컴퓨터가 이해할 수 있는 가장 작은 정보 단위로 심볼을 정의한다. 예를 들어, 숫자 7, 문자 A, 특수기호 '*'은 심볼이 될 수 있다. '심볼 구조'는 이러한 심볼을 리스트 형태로 묶은 것이다. (A, 7, *)과 같이 심볼을 묶어서 심볼 구조를 만들게 된다. 


컴퓨터 프로그램은 심볼 구조를 다른 심볼 구조로 변환한다. 여기서 변환이라는 것은, 어떤 규칙을 적용해서 하나의 구조를 다른 구조로 바꾸는 것을 말한다. 예를 들어, "7과 5의 합"이라는 심볼 구조가 있다고 한다면, 이 구조는 "7 + 5"로 재구성 가능하다. 그다음에는 "7 + 5"를 "12"로 변환할 수 있다. 


최대한 쉽게 설명하려 했지만, LT가 논리 정리를 증명하는 과정을 이해하기 어렵기에, 간단한 퍼즐 문제를 하나 더 예로 들고자 한다. 아래 왼쪽의 3 X 3 배열의 퍼즐을 이동시켜 목표 상태로 만드는 문제를 가정해 보자.


좌에서 우로 만드는 것이 목표!


왼쪽의 퍼즐은 다음과 같은 심볼 구조를 가지게 된다: ((2, 8, 3), (1, 6, 4), (7, B, 5)). 여기서 'B'는 빈칸을 의미한다. 컴퓨터는 이 심볼 구조에서 '변환'을 사용해 타일을 이동시켜 목표 상태에 도달하려고 한다. 목표 상태의 심볼 구조는 다음과 같이 표현할 수 있다: ((1, 2, 3), (8, B, 4), (7, 6, 5)). 목표 상태에 도달할 때까지 컴퓨터는 계속 변환을 시도하게 된다.


이렇게 많은 변환을 시도하다 보면 발생하는 문제는 시간이 오래 걸린다는 것이다. 그래서 뉴웰과 사이먼은 '휴리스틱(heuristic)'이라는 방법을 사용한다. 휴리스틱은 문제를 해결할 가능성이 높은 변환만 시도하는 방법으로, 오늘날도 많은 알고리즘이 휴리스틱을 기반으로 하고 있다. 휴리스틱 기법을 사용하게 되면, 타일이 목표 상태와 얼마나 가까운지를 기준으로 변환을 진행하게 된다. 이런 방법을 통해 인공지능이 복잡한 문제를 더 효율적으로 해결할 수 있었다.


이후, 이들은 자신들의 LT를 더욱 발전시켜 나갔으며, 1959년 파리에서 열린 인공지능 컨퍼런스에서 "일반 문제 해결기(GPS, General Problem Solver)"라는 프로그램을 발표했다. 이 프로그램은 사람들이 일반적인 문제를 해결하는 방식을 컴퓨터로 구현한 것이었다. 이처럼 뉴웰과 사이먼은 인간의 지능을 설명하는 데 관심이 많았고, 그들은 이 프로그램 자체가 인간 문제 해결 행동에 대한 이론이라고 주장한다.


GPS는 초기의 LT 프로그램을 기반으로 심볼 구조를 조작하는 방식으로 작동했다. 하지만 GPS는 LT에서 더 나아가 문제를 작은 문제로 나누는 기능이 있었다. 예를 들어, "윤우를 유치원에 데려다 주기"라는 목표가 있을 때, GPS는 '윤우가 현재 집에 있다'는 현실과 '윤우가 유치원에 있다'라는 목표 간의 '차이(difference)'를 계산한다. 이 차이를 줄여나가는 방향으로 GPS는 동작한다. 집과 유치원의 차이를 줄이기 위해, GPS는 윤우를 차로 유치원에 데려다주는 방법을 생각해 낸다. 하지만, 차 배터리가 나갔다면, 배터리를 고치는 것이 또 다른 하위 문제가 된다. GPS는 이 하위 문제를 해결하기 위해, 정비사를 부르기로 결정한다. 정비사가 배터리를 교체하면, 다시 원 문제로 돌아와 윤우를 유치원에 데려다주는 문제를 해결한다. 


이러한 방식이 익숙하게 느껴지는 사람들도 있을 것이다. 오늘날 컴퓨터 과학에서 자주 사용하는 방법인 '재귀(recursion)'라는 기법의 초기 형태를 GPS는 사용하였다. 재귀는 오늘날 알고리즘을 공부할 때 가장 기초로 배우는 중요한 아이디어로, 큰 프로그램이 작은 프로그램을 불러와서 그 작업이 끝날 때까지 기다렸다가 다시 시작하는 구조라 이해하면 쉬울 것이다. 사람들도 문제를 해결하는 과정에서 재귀와 같은 로직으로 하위 작업을 처리하는 경우가 있지만, 인간의 기억력에는 한계가 있어 완벽하게 흉내내기는 어렵다. 재귀라는 사고방식은 컴퓨터가 인간보다 뛰어날 수 있다는 것이다.


뉴웰과 사이먼은 GPS가 다양한 문제를 해결할 수 있는 일반적인 방법이라 굳게 믿었다. 각 문제에 맞는 "차이 테이블(difference table)"만 있다면, GPS는 그 어떤 문제도 해결할 것만 같았다. 실제로, GPS는 많은 기호주의 학자들이 차용하여 여러 가지 논리 문제와 퍼즐을 해결하게 된다. 이처럼 GPS와 같은 심볼릭 AI는 인공지능 초기 발전에 큰 기여를 한다. 그리고 인공지능뿐만 아니라 다른 분야에도 많은 영향을 미치게 된다.




1956년 가을, MIT에서는 가장 중요한 과학 모임이자, 다양한 학문 분야의 선구자들이 모여 각자의 연구를 발표하고 토론하는 IRE(Institute of Radio Engineers) 회의가 열린다. 하지만 문제가 벌어졌다. 


다트머스 컨퍼런스를 주도한 존 매카시는 사이먼과 뉴웰이 만든 LT를 발표하고 싶어 했다. 다트머스에서의 성과가 있었음을 세계 석학들에게 보여주고 싶었던 것이다. 자신이 만든 섹시한 이름의 '인공지능'도 홍보할 겸 말이다. 하지만, 사이먼과 뉴웰은 이에 반대한다. 그들은 자신들이 만든 LT는 다트머스 회의 이전에 이미 완료한 것이며, 매카시가 그들의 공을 가로채려 한다며 상당히 불쾌해했다. 


많은 이들이 나서 갈등을 빚고 있는 그들을 중재했고, 매카시는 다트머스 컨퍼런스의 개요를 발표하고 뉴웰과 사이먼은 LT에 대해 발표한다. 아이러니하게도 이 세션은 당시 참석했던 세계적인 석학들, 특히 조지 밀러와 노엄 촘스키에 큰 영향을 미치게 된다.


세계적인 석학이자 언어학자인 노엄 촘스키, 최근에도 인공지능과 관련된  의견을 적극적으로 피력 중이다


같은 회의에서 노엄 촘스키는 생성 문법(generative grammar)에 대해 발표했다. 촘스키의 생성 문법은 인간의 언어 능력을 설명하기 위한 이론으로, 훗날 인공지능의 자연어 처리 분야에서 중요한 토대가 된다. 또 다른 발표자는 조지 밀러였다. 밀러는 그의 대표 논문인 '마법의 숫자 7, ±2(The Magical Number Seven, Plus or Minus Two)'를 발표했는데, 이 논문은 인간이 한 번에 처리할 수 있는 정보의 양이 약 7개 항목(±2)이라는 것을 밝혔다. 이 발견은 인지 심리학에서 중요한 이정표가 된다.


밀러는 이 회의를 마치며 심리학, 언어학, 인지 과정의 컴퓨터 시뮬레이션이 모두 더 큰 전체의 일부라는 확신을 가지게 되었다고 회상한 바 있다. 그는 이러한 다양한 학제의 연구들이 상호 연관되어 있고, 이를 통합적으로 이해하는 것이 중요하다고 느꼈다.


훗날, 이 회의를 인지 혁명(cognitive revolution)의 발단이라 보는 학자들이 다수 있다. 인지 혁명은 심리학, 철학, 컴퓨터과학, 신경과학 등 여러 학문 분야에서 인간의 마음과 사고 과정을 연구하는 새로운 접근 방식을 도입한 혁신적 변화였다. 


특히, 심볼릭 AI는 인공지능에서 주요 연구 분야로 자리 잡게 된다. 앞서 살펴본 바와 같이, 심볼릭 AI는 기호와 규칙을 사용해 문제를 해결하는 방식으로, 복잡한 문제를 해결하기 위해 인간의 사고를 모방하고자 했다. 이는 주요 인공지능 연구의 패러다임으로 자리 잡게 된다. 


이를 확인해 볼 수 있는 것이 앨런 뉴웰이 1957년 작성한 박사 논문이 다루고 있는 영역이다. 참고로, 앨런 뉴웰은 LT와 GPS를 공동으로 개발한 허버트 사이먼 교수 밑에서 박사 학위를 마치게 된다. 


뉴웰의 박사 논문에서 중점적으로 다룬 정보 처리의 5가지 영역은 다음과 같다.


1. 문제 해결 (Problem Solving)

2. 학습 (Learning)

3. 언어 처리 (Language Processing)

4. 기억 (Memory)

5. 추론 (Reasoning)


이들 영역은 인공지능 연구 초창기부터 주요 주제로 자리 잡았으며, 이후 수십 년 동안 인공지능의 발전을 이끄는 중요한 기초가 된다. 특히, 뉴웰의 연구는 초기 인공지능 분야의 방향을 설정하는 데 중요한 역할을 했다. 


뉴웰과 사이먼의 연구는 거침없었다. 그래서 자신감이 넘쳤던 걸까? 1957년 미국 운영 과학회(Operations Research Society of America)에서 그들은 10년 안에 벌어질 네 가지 사건을 다음과 같이 예측한다.


1. 예술적으로 흥미를 유발할 음악을 컴퓨터가 작곡할 것이다.

2. 새로운 수학 정리를 컴퓨터가 증명할 것이다.

3. 대다수 심리 이론이 컴퓨터 프로그램으로 만들어져 있을 것이다.

4. 컴퓨터가 세계 체스 대회에서 우승할 것이다.


그들의 네 가지 예언은 과연 맞아떨어졌을까?

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari