brunch

You can make anything
by writing

C.S.Lewis

by monolab Oct 15. 2017

인간답다는 것

#58 인공지능과 딥러닝

#58 인공지능과 딥러닝 : 인공지능이 불러올 산업 구조의 변화와 혁신

- 마쓰오 유타카 지음 / 박기원 옮김

영화보듯이 3h




인공지능은 빠른 속도로 발전할 것이다. 왜냐하면 '딥러닝' 혹은 '특징표현 학습'이라는 영역이 새롭게 개척되었기 때문이다. 이것은 인공지능의 '큰 비약의 가능성'을 내보이는 것이다. ... 한편, 냉정하게 생각할 때 인공지능으로 가능한 일들은 아직 한정적인 것이 현실이다. 기본적으로 인공지능은 정해진 길들 안에서 치ㅗ선의 선택을 내리는 것밖에는 할 수 없고, '학습'이라고 불리는 기술도 모아진 경험(데이터) 안에서 최적의 예측값을 찾아내는 것뿐이다. 따라서 예외 상황에 취약하고 범용성이나 적용의 유연성이 부족하다는 점이 단점이라고 할 수 있다. .... 독자 여러분들은 이 점을 정확하게 이해해 주었으면 한다. 그리고 나서 인공지능의 미래에 승부를 걸어 달라는 것이며, 인공지능 기술의 발전을 응원해 주었으면 한다. 현재의 인공지능은 이 '큰 비약의 가능성'에 승부를 걸어도 좋을 단계이다. - 마쓰오 유타카 p13





인터넷은 인공지능 기술의 보고이다. 검색 엔진 안에는 '기계학습이라는 인공지능의 기술이 상당히 많이 사용되고 있다.  기계학습은 사용자가 키워드를 넣었을 때 최종적으로 클릭한 페이지의 결과를 그 웹페이지의 특성(예를 들면 내용 안에 포함된 하이퍼링크)과 함께 학습한다. 질이 낮은 페이지를 분별하거나 유해한 콘텐츠를 분별하는 것도 기계학습의 일 중 하나이다. 이렇게 학습된 정보를 바탕으로 기계학습은 사용자의 키워드에 맞는 가장 적절한 페이지를 빠르게 표시하여 준다. -p 22


인류에게 인공지능의 위협은 싱귤래리티(기술적 특이점)라는 개념으로 설명할 수 있다. 인공지능이 충분히 똑똑해져서 더욱 똑똑한 인공지능을 만들면서 빠른 스피드로 계속해서 되풀이하면 인공지능은 폭발적으로 진화한다. 그러므로 인공지능이 자신보다 똑똑한 인공지능을 만들기 시작한 순간이야말로 모두가 바뀌는 '특이점'이다. 미래학자 레이 커즈와일은 그 기술적 특이점이 2045년 정도의 가까운 미래일 것이라고 주장하고 있다. 인공지능이 초래할지도 모르는 이러한 위협을 보면서 우주물리학으로 유명한 스티븐 호킹은 "완전한 인공지능을 개발할 수 있으면 그것은 인류의 종말을 의미할지도 모른다"라며 경종을 울리고 있다. -p32


인간의 지능 원리를 해명하고 그것을 공학적으로 실현하는 인공지능은 아직 세상 어디에도 존재하지 않는다. 따라서 '인공지능을 사용한 제품'이나 '인공지능 기술을 사용한 서비스'라는 것도 사실은 거짓말이다. 거짓말이라고 단정하는 것은 조금 지나친 표현일 수도 있지만 인간의 지적 활동의 일면을 흉내 내고 있는 기술을 '인공지능'이라고 부르기 때문이다. 다시 말해, 인공지능의 역사는 인간의 지적인 활동을 열심히 흉내 내려고 해 온 역사이기도 하다. 그러나 인간이 가지는 지능은 헤아리기 어려울 정도로 깊고 멀어서 아득히 손이 닿지 않는 곳에 있고, 아직도 그 원리를 알지 못하며, 당연히 그것을 컴퓨터로 흉내 낼 수도 없다. -p40


인공지능을 만들 때 잘 비유되는 것이 비행기의 예다. 인간은 예로부터 하늘을 날고 싶다는 욕망이 있었다. 새의 흉내를 내듯 '날갯짓하는' 비행기를 몇 번이나 만들려고 했지만 실패했다. 이를 처음으로 성공한 라이트 형제의 비행기는 엔진을 실은 '날갯짓은 하지 않는' 비행기였다. 즉 생물을 흉내 내고 싶어도 반드시 생물과 똑같이 할 필요는 없다는 것을 보여주는 사례이다. 비행기의 경우 새가 날기 위한 '양력'이라는 개념을 찾고, 양력을 얻기 위한 방법(엔진으로 추진력을 얻고 날개를 양력으로 바꾼다)을 공학적으로 모색 하면 되었듯이, 인공지능에 있어서도 지능의 원리를 찾고, 그것을 컴퓨터로 실현하면 되는 것이다. 그것이 애초에 인공지능이라는 영역의 출발점이다. -p49


인공지능으로 유명한 교과서인 스튜어트 러셀의 [에이전트 어프로치]에는 정말로 입력에 의해 출력이 변하는 '에이전트'(소프트웨어 객체)롯 인공지능을 포착하고, 현명하게 행동하기 위한 인공지능의 다양한 방법을 설명하고 있다. 이 책에서는 생물에 지능이 있는 것이나 인간에게 지능이 있는 것도 '행동이 현명해지면 장수할 확률이 올라간다'라는 진화적 의미에 의한 것이기 때문에 '입력에 따라 적절히 출력을 한다(행동을 한다)'라는 것은 외부 관측자 시점에서 본 지능의 유력한 정의라고 말할 수 있을 것이다. -p53


레벨1 : 단순한 제어 프로그램을 '인공지능'이라고 칭하고 있다.
- 마케팅적으로 '인공지능' 즉 'AI'라고 지칭하는 것이며, 지극히 단순한 제어 프로그램을 탑재하고 있는 전자제품을 '인공지능 탑재' 등이라고 부르는 경우가 이에 해당한다.

레벨2 : 고전적인 인공지능
- 행동의 패턴이 지극히 다채로운 경우에서의 지능을 말한다. 장기 프로그램이나 청소 로봇 혹은 질문에 대답하는 인공지능 등이 이에 해당된다.

레벨3 : 기계학습을 받아들인 인공지능
- 검색 엔진에 내장되어 있거나 빅데이터를 바탕으로 자동적으로 판단하는 인공지능이다. 추론의 구조나 지식 베이스가 데이터를 바탕으로 학습되는 것으로 전형적으로 기계학습(제 5장)의 알고리즘이 이용되는 경우가 많다. 기계학습이라는 것은 표본이 되는 데이터를 바탕으로 규칙이나 지식을 스스로 학습하는 것이다.

레벨4 : 딥러닝을 받아들인 인공지능
- 그 위의 단계인 레벨 4로, 기계학습을 할 때의 데이터를 나타내기 위해 사용되는 입력값 자체를 학습하는 것이 있다. 제 6장에서 소개하는 딥러닝이 여기에 해당한다. 이 책에서는 '특징표현 학습'이라고 부른다.


인공지능 연구는 지금까지 '붐'과 '겨울의 시대'를 되풀이해 왔다. 제1차 AI 붐은 1950년대 후반 ~ 1960년대를 말한다. 컴퓨터로 '추론/탐색'하는 것으로 특정한 문제를 푸는 연구가 진행되었다. 그러나 소위 '토이프로블럼(단단한 문제)'은 풀려도 복잡한 현실의 문제는 풀리지 않는 것이 밝혀지면서 붐은 빠른 속도로 수그러들었고, 결국 1970년대에는 긴 겨울을 맞이해 버렸다. 제2차 붐은 1980년대이며 컴퓨터에 '지식'을 넣으면 똑똑해진다는 접근법이 전성기를 맞이하고, 익스퍼트시스템이라 불리는 실용적인 시스템이 많이 만들어졌다. ... 한편 1990년대 중반 검색 엔진 탄생 이후, 인터넷이 폭발적으로 보급되면서 2000년대에 들어서 웨ㅏㅂ이 널리 보급되면서 대량의 데이터를 이용한 '기계학습'이 조용히 퍼져 왔다. 그리고 현재 AI연구는 3번째 붐에 당도했다. 제3차 AI붐은 그림과 같이 빅데이터 시대에 널리 퍼진 기계학습과 기술적으로 크게 발전한 딥러닝(특징표현 학습) 등 2개의 큰 파도가 겹치면서 탄생했다. -p63


'인공지능'이라는 말이 처음으로 등장한 것은 1956년 여름, 미국 동부의 다트머스 대학교에서 개최된 전설적인 워크숍에서부터다. 인간과 같이 생각하는 기계를 처음으로 '인공지능'이라고 부르기로 한 것이다. ... 존 매카시, 마빈 민스키, 앨런 뉴웰, 허버트 사이먼이라는 4명의 저명한 학자들이 참가한 이 워크숍에서는 컴퓨터에 관한 최신이 연구 성과가 발표되었다. 그중에서도 뉴웰과 사이먼에 의한 세계 최초의 인공지능 프로그램, '로짓 세오리스트(Logic theorist:논리연산 이론가)'가 유명한데 이 프로그램은 자동적으로 정리를 증명하는 프로그램이다. -p67


제 1차 AI붐에서는 인공지능이 드디어 실현된다는 낙관적인 예측을 바탕으로 야심 찬 연구가 차례로 실행에 옮겨졌다. 이 시기에 중심적인 역할을 한 것이 '추론'과 '탐색'의 연구이다. '추론'은 인간의 사고 과정을 기호로 표현해 실행하는 것이지만, 처리의 측면에서는 탐색과 가까워 여기에서는 탐색을 설명하기로 하자. ... 탐색트리를 탐색하는 방법은 주로 두 가지가 존재하는데 그중 첫 번째는 어쨌든 갈 수 있는 곳까지 계속 파고들어 안 되면 다음 갈래(지엽)로 옮겨 가는 '깊이우선 탐색'이 있고, 또 다른 하나는 같은 계층을 이잡듯이 조사한 후, 다음 계층으로 나아가는 '너비우선 탐색'이 있다. -p70


탐색트리를 사용해서 로봇의 행동 계획도 만들 수 있다. ... 이렇게 미리 행동 계획을 기술해 두면 로봇은 그것에 따라서 행동한다. 모든 상황 <전제 조건>에 대해서 <행동>과 <결과>를 기술해 두면 최종적으로 로봇은 배터리를 방에서 가져올 수 있을 것이다. 플래닝 연구에서는 <전제 조건(프리 컨디션)>과 <행동>과 <결과(포스트 컨디션)>라는 3개의 조합으로 기술하는 STRIPS(stanford research institute problem solve)가 유명하다. -p73


이들 게임도 기본적으로는 탐색이라고 할 수 있다. 단지 미로나 퍼즐의 탐색과 다른 것은 함께하는 상대가 있다는 것이다. 이쪽에서 던진 수에 대하여 상대가 수를 응대하고, 다시 이쪽이 수를 던지고 하는 것을 되풀이하면서 탐색트리를 만들지 않으면 안 된다. 또한 조합의 수가 정말 많아서 순식간에 천문학적인 숫자가 되어버리므로 좀처럼 끝까지 탐색할 수 없다. ...이 정도로 조합의 수가 방대하다고 하면 최후까지 이 잡듯이 조사하는 것은 도저히 불가능하다. 그래서 현재의 돌 상태를 평가하는 스코어를 만들고, 그 스코어가 좋아질 수 있도록 다음 수를 탐색하게 하는 것이 보통이다. 그리고 그것이 현재까지 이어지는 게임 공략을 위한 인공지능의 기본적인 설계가 되고 있다. -p76


난해한 정리를 증명한다든가 체스에서 승리한다는 고도로 전문적인 내용은 컴퓨터로 실행했을 때는 의외로 간단했다. 그러나 현실의 문제는 다르고 어려웠다. 인간의 지능을 컴퓨터로 실현하는 것의 힘겨움을 알게 된 것이 제1차 AI붐의 성과라면 성과였다. -p84


여기에서 재미있는 것은 시스템의 구성 방법이 아니라 인간의 측면에 더 가깝다는 사실이다. 아무래도 인간은 단순한 룰로 기술된 말이라도 거기에 지성이 있다고 느끼는 모양이다. 청소 로봇 룸바가 이리저리 헤매고 있는 것만으로도 애착을 느껴 버리는 것이 인간이다. 트위터에서는 봇이라고 불리는 어카운트가 많이 있지만 그중에는 어떤 특정한 알고리즘(룰/순서)에 준해서 트윗하는 것도 있어서 '인공무능'이라고 부르고 있다. 근본적인 원리는 이라이자와 동일하다. - p90


익스퍼트 시스템은 잘 된 예도 있었지만 반면에 문제 상황도 있었다. 그중 하나는 지식을 컴퓨터에 저장하기 위해 전문가의 의견을 청취하면서 지식을 꺼내야 한다는 것이다. ... 따라서 컴퓨터가 인간의 신체나 생물로서의 특징에 대해서 어느 정도 파악해 둘 필요성이 있다는 과제가 나오게 된다. 인간에게는 '손'과 '발'이 2개씩 있다, '배'에는 '위, 소장, 대장' 등이 있다라는 상식적인 지식을 넣어 두어야 하는 것이다. -p94


인간이라면 누구라도 아는 지식을 어떻게 표현하면 컴퓨터가 처리하기 쉬운 형태로 될 수 있을까? 이를 위해 기본적인 연구가 진행되었는데, '지식 표현'의 연구가 바로 그것이다. '시멘틱 네트워크'는 인공지능의 초기부터 유명한 연구로 불리는데 인간이 의미를 기억할 때의 구조를 나타내기 위한 모델이다. 이것은 '개념'을 노드로 표시하고, 노드끼리 링크로 맺어 네트워크화해서 표현한다. -p95


인공지능에 있어서 프레임 문제도 어려운 문제 중 하나로 알려져 있다. 원래는 인공지능이 대가 중 한 사람인 존 매카시의 논의로부터 시작되고 있지만 철학자 대니얼은 데닛이 고안한 예를 들어 설명하기로 한다. ... 연구자들은 로봇 1호를 개량해서 로봇 2호를 만들었다.  ... 그러자 로봇2호는 배터리를 앞에 두고 생각하기 시작했다. ... 그래서 로봇 3호는 더욱 개량되었다. 이번에는 '목적을 수행하기 전에 관계없는 사항은 고려하지 않도록' 개량되었다. ... 이렇듯 프레임 문제는 어떤 태스크를 실행할 때 '관계 있는 지식만을 꺼내서 그것을 사용한다'라는 인간이라면 지극히 자연스럽고 당연히 할 수 잇는 작업이 인공지능에서는 얼마나 어려운지를 보여주고 있다. -p110


로봇 연구자 중에는 이 심볼그라운딩 문제를 지능을 실현하는 데 있어 대단히 중요한 문제라고 생각하는 사람도 있다. '말'이라는 것을 정말로 이해하기 위해서는 현실 세계에 존재하는 '신체'를 이해해야 한다. 신체가 없으면 심볼과 그것이 가리키는 것을 접지시킬(그라운드 시킨다) 수 없기 때문에 이러한 접근법을 '신체성'에 착안한 연구라고 부른다. ... '외부 세계와 상호 작용할 수 있는 신체가 없으면 개념은 전부 파악할 수 없다'라는 것이 신체성이라는 접근법의 사고방식이다. -p111


학습의 근간을 두는 것은 '분류한다'라는 처리이다(물론 '회귀' 등의 작업도 있지만 여기에선 '분류'에 초점을 맞춰 설명하도록 하겠다.). 잘 분류할 수 있으면 사물을 이해할 수도 있고, 판단해서 행동할 수도 있을 것이다. '분류한다'라는 것은 그러한 학습 과정의 가장 기본적인 단계인데, 다시 말해 'YEST냐 NO로 대답하는 문제'인 것이다. -p121


기계학습은 크게 '지도 학습'과 '비지도 학습'으로 나눌 수 있다. '지도 학습'은 '입력'과 '올바른 출력(분류 결과)'이 세트가 된 훈련 데이터를 미리 준비하고, 어떤 입력이 주어졌을 때 올바른 출력(분류 결과)이 나오도록 컴퓨터에 학습시킨다. ... '비지도 학습'은 입력용 데이터만 주고 라벨링 없이 데이터에 내재하는 구조를 파악하기 위해서 이용할 수 있다. 데이터 속에 있는 일정한 패턴이나 룰을 추출하는 것이 목적이다. -p122


1) 최근접 이웃 방법  선을 긋는다는 것보다 더 소박한 방법인데 문자 그대로 '가장 가까운 이웃의 분류를 따른다'라는 것이다. 이것은 가장 가까운 데이터의 카테고리가 맞는 확률이 높을 것이라는 가설에 근거하고 있다.

2) 나이브 베이즈법 : 확률에 관한 유명한 정리인 '베이즈의 정리'를 사용해 나누는 방법으로, 데이터의 특징마다 어느 카테고리에 꼭 들어맞는가에 대한 확률들을 곱해 가장 그럴법한 분류를 찾는다.

3) 결정트리 : 각 속성들이 포함되어 있는가 아닌가를 기반으로 분류를 수행한다. ... 결국 질문에 있는 각각의 요소에 대해 그 단어가 들어 있는지 아닌지를 가지고 가장 그럴 법한 분류 결과를 뽑아내는 것이 바로 결정트리이다.

4) 서포트 벡터 머신 : 최근 15년 정도 유행하고 있었던 방법으로 데이터를 구분 짓는 구분선과 각 데이터 그룹간의 마진(간격)을 최대로 나누는 방법이다. ... 실제로 서포트 벡터 머신의 정밀도는 꽤 높아서 잘 이용되어 왔으나, 큰 데이터를 대상으로 했을 때는 계산에 시간이 걸린다는 결점도 있다.

5) 뉴럴네트워크 : .. 뉴럴네트워크는 인간의 뇌신경 회로를 흉내 내 매우 복잡한 구조의 힘을 통해 분류하려는 것이다.


기계학습이라고 해도 특징의 설계는 오랜 지식과 경험이 말하는 장인 기법이다. 장인 기법에 의해 기계학습의 알고리즘과 특징의 설계가 조금씩 진행되면서 1년 공들여 1% 에러율이 떨어진다는 세계이다. ... 덧붙이자면 자연어처리에서도, 검색에서도 인공지능 기술을 이용해서 마지막으로 소수점 이하 몇%라는 성능의 승부 단계가 되면 반드시 이 장인 기법(혹은 휴리스틱이라고 불린다)의 덩어리로 되어 온다. ... 시리와 같은 '음성 대화 시스템'도, 왓슨과 같은 '질문 응답 시스템'도 대부분 이 단계에 들어 있고, 연구자로서는 '해도 좋지만 힘든것이 비해 별로 미래가 없다'는 생각이 들게 한다. -p149


딥러닝은 데이터를 바탕으로 컴퓨터가 스스로 특징을 만들어 낸다. 인간이 특징을 설계하는 것이 아니고 컴퓨터가 스스로 높은 차원인 특징을 획득하고, 그것을 바탕으로 이미지를 분류할 수 있게 된다. 딥러닝으로 인해 지금까지 인간이 관여해야만 했던 영역에 인공지능이 깊이 파고들 수 있게 된 것이다. -p150


딥러닝에서는 이렇게 '조금 달랐을지도 모르는 과거'의 데이터를 많이 만들어 그것을 사용한 후, 학습하는 것으로 '절대로 틀리지 않았다'는 특징을 찾아낸다. 그리고 '절대로 틀리지 않았다'는 특징이기 때문에 그 특징을 사용한 높은 차원인 특징도 찾을 수 있는 것이다. -p170


강건한 특징이나 개념을 찾는 방법이 노이즈를 더해서 '조금 다른 과거'를 만들어 내는 방식만 있는 것은 아니다. ... 그밖에 뉴럴네트워크에서는 '가혹한 환경'이 여러 가지 연구되고 있는데, 그렇게까지 단련하지 않으면 데이터의 배후에 존쟇는 '본질적인 특징'을 획득할 수 없는 것이다. -p176



인간은 언어를 이야기한다. 특히 '문법'을 사용해서 문장의 형태로 사물을 묘사하거나 글을 짓는다. 그럼 문법은 어떻게 획득할 수 있는 것일까? 유명한 언어학자인 노암 촘스키는 인간은 천성적인 문법(보편 문법)을 구비하고 있다고 말했다. -p195


지금 딥러닝에서 일어나고 있는 현상은 '세계의 특징을 찾아 특징표현을 학습한다'는 것이며, 이것 자체는 예측 능력을 올릴 때 지극히 중요하다. 이러한 내용과 인공지능이 자신의 의사를 가지거나, 인공지능을 다시 설계하는 것과는 하늘과 땅 정도의 차이라고 할 수 있다. 그 이유를 간단히 말하면 '인간=지능+생명'이기 때문이다. ... 스스로 유지하고 복제할 수 있는 생명이 생겼을 때 처음으로 보존하고 싶고 복제를 늘리고 싶은 욕구가 생길 수 있다. 그것은 '정복하고 싶다'라는 의사와도 연결된다. 생명의 이야기를 제외하고 인공지능이 멋대로 의지와 생각을 갖기 시작했다며 걱정하고 두려워하는 것은 우스운 일이다. -p204




이 시대는 다양하게 바뀌어 가지만 그것은 눈에 보이는 '물건'에 주목하고 있기 때문이다. 낡은 산업이 쇠퇴하고 새로운 산업이 생기는 것과 그것들이 본질적으로 제공하는 가치가 증대하고 생산성이 향상된다는 것은 결코 모순되지 않는다. 사람이 태어나고 죽는 것과 인간 사회가 보다 좋은 사회가 되어 간다는 것 역시 모순되지 않는다. '흐르는 강의 흐름은 끊이지 않고 본래의 물이 아니다'라는 것은 호조우키에 나오는 말로 눈에 보이는 것이 변해간다는 것은, 결국 보이는 존재 이유와 눈으로 보이지 않는 존재 이유가 분리되고, 승화하고, 다른 모양의 형태로써 재구성되어 간다는 것이다. -p214


인공지능이 실현됐을 때, 그것은 어떤 동작 원리에 의한 것일까? 인간의 지능은 어떤 구조로 이해되는 것일까? 자신이 보고 있는 이 세계나 이 인식은 도대체 무슨 방법으로 설명 가능한 것일까? 자신이 보고 있는 이외의 세계나 인식은 존재하는 것일가? 스스로의 이해 방법이 스스로의 이해의 한계를 어떻게 규정하고 있는 것일까? 자신이 보고 있는 이외의 세계나 인식은 존재하는 것일까? 스스로의 이해 방법이 스스로의 이해의 한계를 어떻게 규정하고 있는 것일까? 아직 보이지 않는 인공지능은 그것을 간단히 타파하고, 자못 당연한 것처럼 우리들에게 그 사실을 말하는 것일까? 이러한 수수께끼에 나는 언제쯤 도착할 수 있는 것일까? -p260





2017년 기준, 국내에서도 AI붐이 일고 있지만 실상은 아직 '흉내내기' 수준이다. 언제나 그렇듯 문학이나 영화의 상상은 수백년을 뛰어넘고, '블레이드 러너 2049'는 그 수백년 후의 모습을 담고 있다. 영화는 시종일관 굉장히 느린 '인간의 속도'로 스토리를 전개하고, 신경질적인 '기계음'으로 분위기를 전한다. 결말에서, 그 누구도 확실히 누가 인간이고 누가 리플리컨트인지 정의하지 않는다. 또는 '못한다'라고 표현하는 게 옳을지도 모르겠다. 


신체적 불완전성을 해소한 '인간'과 정신적 불완전성까지 학습한 '로봇(리플리컨트)'에 대해 과연 누가 더 인간적이라 표현할 수 있을까? 또는 '인간'과 '인간 아님'으로 분류할 수 있을까? 리플리컨트K의 죽음이 무척이나 성숙한 인간의 죽음처럼 보였던 까닭은...이성애적 사랑과 인류애적 사랑, 소명의식, 희생정신, 또 어떤 말들로 설명해볼 수 있을까? 

 




매거진의 이전글 신 노예 사회가 온다면
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari