어떻게 인간과 공존하는 인공지능을 만들 것인가(김영사)●●●●●●●●●○
우리는 기계를 진정으로 지적으로 만드는 방법을 아직 알지 못한다.
완벽하게 합리적인 존재는 자신이 나아가기로 선택할 수 있는 모든 가능한 미래의 삶에 관한 자기 선호의 기대 만족도를 최대화 한다. 이 결정 문제의 복잡성을 기술하는 숫자들을 여기서 죽 적어 내려갈 수는 없지만, 다음의 사고 실험이 도움이 될 것이다. 먼저, 인간이 평생에 걸쳐 하는 운동 제어 선택의 수가 약 20조 번임을 생각하자. 이어서 현재의 가장 빠른 컴퓨터보다 10억 곱하기 1조 곱하기 1조 배 더 빠른 세스 로이드의 궁극 물리학 노트북의 도움을 받으면, 얼마나 엄청난 힘을 얻을지 살펴보기로 하자. 그 노트북에 영어 단어들의 가능한 모든 서열을 나열하는 과제를 맡기자. 그 일에 노트북을 1년 동안 돌린다. 그때쯤 나열할 수 있는 서열은 얼마나 길어져 있을까? 1천 쪽 분량에 달할까? 1만 쪽? 그렇지 않다. 아직 서열은 단어 11개에서도 벗어나지 못한 상태다. 이는 20조 가지 행동으로 이루어지는 가능한 최고의 삶을 설계하는 것이 어렵다는 것을 말해준다. 한마디로, 우리는 시속 9천억 킬로미터로 여행하는 우주선 엔터프라이즈 호를 따라잡으려는 민달팽이보다도 더 합리적인 존재와 거리가 멀다. 우리는 합리적으로 선택한 삶이 어떠할지 전혀 짐작도 못한다.
- p. 339. 상황을 복잡하게 만드는 요인 : 우리들.
. 우리에게 너무도 가깝게 와닿았던 '알파고 쇼크'가 실제 인공지능 개발에서 가지는 의의에 대한 냉정한 평으로부터 출발해서 인공지능의 원리와 원칙, 미래, 인공지능과 인간과의 관계, 나아가야 할 방향, 어려움에 이르기까지 현 시점에서 이야기할 수 있는 인공지능의 모든 것을 다룬 책이라도 무방할만한 역작. 그동안 알파고 이슈에 편승해 무수한 인공지능 관련서가 쏟아져 나왔었지만 그 대부분은 어렸을 때 봤던 학습만화 수준만도 못한 책이 대부분이었는데, 이 책에서 다루는 인공지능과 관련된 기술과 철학에 대한 이야기를 읽고 있으면 저자가 인공지능에 대해 얼마나 오랜 시간 동안 많은 고민을 해왔는지 감탄하게 된다.
. 책은 알파고에 대한 냉정한 평으로부터 시작한다. 물론 알파고가 몇몇 두드러진 기술적 진보를 보여주긴 했지만, 1) 불연속적이고 2) 관찰 가능하며 3) 규칙이 알려진 4) 2인용 게임이라는 한정적 모델 하의 성취였다는 점에서 저자는 알파고 쇼크는(최근의 챗GPT 열풍도 그렇겠지만) 인공지능이 가야 할 본질과는 거리가 멀다며 선을 긋는다. 스튜어트 러셀 교수가 생각하는 인공지능의 본질은 그게 어떤 분야가 되었든 모방과 관찰을 통해 학습이 가능해야 한다는 것이고, 그러기 위해서는 당장의 퍼포먼스보다는 인공지능의 원리를 고민하고 설계하는 것이 훨씬 더 중요하다. 그래서 그가 봤을 때 알파고는 인공지능을 구성하는 특정 일부분의 성취에 불과하고, 와닿게 비유하자면 바둑이라는 게임에서 인공지능이 인류를 이겼다고 지구정복을(....) 이야기하는 건 멀어도 너무 멀다는 것이다.
이는 인간이 종종 자신의 선호와 반대되는 방식으로 행동하리라는 것을 의미한다. 예를 들어, 이세돌은 알파고와 대국에서 졌을 때, 질 것이 확실한 한두 수를 두었고, 알파고는 그런 수를 알아차렸을 수도 있다. 이 때 알파고가 이세돌이 지는 쪽을 선호한다고 추론한다면 맞지 않을 것이다. 대신에 이세돌이 이기는 쪽을 선호하지만 어떤 계산 한계 때문에 모든 상황에서 올바른 수를 선택하지 못한다고 추론하는 편이 합리적일 것이다. 따라서 이세돌의 행동을 이해하고 그의 선호에 대해 더 많이 알아내려면, 세 번째 원칙 ("인간의 선호에 관한 정보의 궁극적 원천은 인간의 행동이다")을 따르는 로봇은 인간의 행동을 생성하는 인지 과정에 관해서도 뭔가 이해를 해야 한다. 로봇은 인간이 합리적이라고 가정할 수 없다. 그 결과 AI, 인지과학, 심리학, 신경과학 분야는 한 가지 매우 심각한 연구문제를 안게 된다. 우리가 깊이 박혀 있는 근원적인 선호 - 그런 것이 존재한다면 - 에 다다를 정도까지 인간의 행동을 '역공학적으로' 분석할 수 있을 만큼 인간의 인지를 충분히 이해해야 한다는 것이다.
- p. 340. 상황을 복잡하게 만드는 요인 : 우리들.
. 하지만 그렇다고 저자가 인공지능을 부정하거나 무용론을 주장하는 건 아니다. 저자는 한치의 흔들림도 없이, 인공지능이 인류의 삶을 바꿔놓을 날은 반드시, 당연히 올 것이라고 단언한다. 그렇기 때문에 지금부터 인공지능 기술과 기술연구의 윤리적, 정책적 측면에 대해 논의해야 하고, 또 지금도 이미 그렇게 하고 있다고 이야기한다. 우리가 흔히 생각하는 것과 달리 인공지능 개발은 이미 한 개인은 물론이고 한 국가에서 단독으로 진행하기엔 너무 복잡하고 정교해져 있고, 그렇기 때문에 특정인이나 특정국가가 성과를 악용하는 것 역시 충분히 규제할 수 있다고 설명한다. 만화에서처럼 정신나간 천재과학자가 홀로 연구한 끝에 스스로 불러온 재앙에 짓눌릴(^^;) 정도로 만만한 분야가 아니라는 것이다.
원초적인 계산 능력에 초점을 맞추다가는 요점을 완전히 놓치게 된다. AI는 속도만으로 출현시킬 수 있는 것이 아니다. 엉성하게 설계된 알고리듬을 더 빠른 컴퓨터에서 돌린다고 해서 알고리듬이 더 나아지는 것이 아니다. 그저 틀린 답에 더 빨리 다다를 뿐이다. (그리고 데이터가 더 많을수록 틀린 답에 다다를 기회도 더 많아진다!) 더 빠른 기계의 주된 효과는 실험에 걸리는 시간을 더 짧게 줄인다는 것, 따라서 연구를 더 빨리 진행할 수 있다는 것이다. AI를 지체시키는 것은 하드웨어가 아니다. 소프트웨어다. 우리는 기계를 진정으로 지적으로 만드는 방법을 아직 알지 못한다. 기계가 우주만큼 크다고 해도 마찬가지이다.
- p. 65. 인간과 기계의 지능.
. 그렇다면 우리가 추구해야 하는 본질적인 인공지능은 어떤 것일까? 저자는 이에 대해 인간의 사고방식과 행동을 이해하고, 이를 통해 인간의 진정한 선호를 파악하며, 그럼으로써 인류가 선호하는 것을 최대한 실현하는 것이 인공지능 연구의 최종 목적이라고 이야기한다. 그러자면 인간 개개인은 물론, 인류 전체의 선호의 합, 그리고 양자의 충돌과 합의와 절충에 이르기까지 연구하고 고려해야 할 것이 너무나도 많고 무엇 하나 쉬운 게 없다. 단순히 디스토피아 물에서처럼 초기 벤담식 공리주의식으로 덧셈했더니 이쪽이 많으니까 저쪽은 다 쓸어버려! 하고 끝낼 문제가 아니다. 애초에 그럴거라면 인공지능이 있을 필요도 없다. 우리도 그것보단 똑똑하니까. 또한 보여지는 행동을 통해 인간의 생각을 - 긍정적이고 솔직한 생각은 물론 뒤틀리고 꼬인 본심까지도 - 추론해내야 한다. 그렇지 않고서야 그저 지시에 따라 움직이는 조금 성능 좋은 도구를 벗어날 수 없을테니까. 이렇게 책을 읽어내고 나면, 소설이나 만화에 나오는 '내가 시키는대로 지구를 파괴하고', 그러다 '말 한마디 잘못해서 나까지 파괴하는' 인공지능이라는 게 얼마나 쉽고 속편하게 만들어진 건지를 새삼 깨닫게 된다. :)
나는 비탈진 길을 내려가는 중이었다. 그때 비탈 때문에 내 걸음에 약간 변화가 생겼다는 사실을 새삼 알아차렸다. 물론 누구나 다 알고 있겠지만 말이다. 게다가 수십 년 동안 일어난 약한 지진으로 길이 울퉁불퉁해진 터라 걸음걸이에 더욱 변화가 생겨났다. 지면의 높이가 오락가락하는 탓에 발을 뗄 때 조금 더 높이 들어 올리고 더 살짝 내디뎠다. 이런 일상적인 관찰 사례를 곰곰이 생각하다가, 나는 우리가 일을 거꾸로 해왔다는 사실을 깨달았다. 강화 학습은 보상으로부터 행동을 생성하지만, 우리가 실질적으로 원하는 것은 정반대임을 알아차렸다. 우리는 주어진 행동에 어떤 보상이 이루어지는지를 알아내고 싶었다. 우리는 이미 행동을 지니고 있다. 초파리와 바퀴벌레가 하는 행동이 그것이었다. 우리는 그 행동을 통해 최적화되는 보상 신호가 무엇인지 알고 싶었다. 다시 말해, 우리한테 필요한 것은 '역강화 학습'의 알고리듬이었다. 그런 알고리듬은 동물의 행동을 설명할 수 있을 뿐 아니라, 새로운 상황에서 어떤 행동을 할지도 예측할 수 있을 터였다. 예를 들어, 바퀴벌레는 양옆으로 기울어진 울퉁불퉁한 트레드밀에서 어떻게 달릴까?
- p. 280. 증명 가능하게 이로운 AI.