brunch

You can make anything
by writing

C.S.Lewis

by 하얀늑대 May 23. 2018

과연 머신러닝은 인간을 대신할 수 있을까?

4차 산업혁명은 허구다 (6)


사람들은 인공지능에 대해서 이야기를 많이 한다. 사실 인공지능이라는 단어는 적절하지 않다. 더 정확하게는 머신러닝이라는 용어가 적절하다. 왜내하면 머신러닝은 생각하는 기술이 아니다. 판단하는 기술이다. 그리고 생각과 판단은 분명히 다르다. 헌데 그것이 세상을 얼마나 바꾸어놓을지에 대해서 이야기를 하고들은 있지만 사실 그 머신러닝이 동작하는 원리에 대해서 깊이있게 이해하면서 머신러닝이 바꾸어놓을 세상을 이야기하는 사람들은 필자는 거의 찾아보지 못했다.

뭔가 뜬구름 잡는 듯한 자신이 꿈꾸는 이상을 그리면서 "인공지능 ( 머신러닝) 이 나의 이 꿈을 이루어 줄 것이야. 이것을 따르지 않는 많은 사람들은 도태되어질 것이고 나는 새로운 세상의 중심이 되어서 이 세상에서 인정받고 잘 나가는 사람이 될 것이야" 라는 생각을 하고 있는 듯한 사람들도 꽤 보았다. 헌데 그런 생각을 갖는 것은 좋은 일이라고 생각한다. 그정도 꿈이 없다면 아무것도 못하는게 사실이니까. 하지만 그 꿈이 과연 유효할른지 아닐른지는 한번 따져 볼 필요가 있다.

머신러닝을 이야기 하면서 알파고의 이야기를 안할 수 없다. 세계 최고의 바둑기사중의 하나인 이세돌9단을 떡실신시킨 알파고... 실제로 그 바둑 대국을 보면서 많은 사람들이 충격을 먹었다. 하지만 이렇게 생각해 볼 수도 있지 않을까? "알파고가 가져온 충격은 구글의 주식을 올리기 위해 과장된 것은 혹시 아니었을까?" 필자는 솔직히 어느정도는 과장되었다고 생각한다.

사실 머신러닝은 거의 사장되어가던 기술이었다. 최신의 혁신적인 기술이 아니었다. 과거에도 존재했고 그 개념은 꽤 오래전에 정립되어 있었다. 필자가 회사생활을 했을때 필자가 소속된 부서의 부장이 인공지능으로 학위를 받은 분이었으니 ( 필자가 회사에 입사한게 96년이다 ) 그 역사는 실로 오래되었다.

하지만 필자는 그 후 20년 넘게 인공지능이 세상을 바꿀것이라는 얘기를 거의 들어보지 못했다. 왜냐하면 실제로 적용하는데 있어서 인공지능으로 생성된 코드는 올바른 판단을 내린다고 보기 어려웠기 때문이다. 고양이와 강아지를 판단하는데 그 확률이 50%선에서 왔다갔다 할 정도였으면 말 다한거다. 사람은 3-4살만 되어도 고양이와 강아지를 쉽게 구분한다. 하지만 전 세계에 존재하는 이 분야의 날고기는 석학들이 달려들어서 고양이와 강아지를 구분하는 일에 매달렸지만 3-4살 아이가 해내는 것을 인공지능은 해 내지 못했다. 그게 바로 2-3년 전의 일이다. 헌데 그것이 어떤 계기를 통해서 비약적으로 확률을 높이게 되었다. 그래서 머신러닝이 대단한 이슈를 몰고 온 것이기도 하고...

오죽했으면 인공지능이라는 명칭을 머신러닝으로 바꾸었을까. 실은 이 둘은 같은 개념이다. 인공지능이 과거 실패의 결과만을 거듭했기 때문에 그 이미지를 바꾸고자 머신러닝이라는 명칭으로 바꾸어 놓은 것이고... 헌데 이 머신러닝은 어떠한 계기를 맞아서 비약적인 발전을 이루게 되는데... 실은 이 부분은 전문가도 모르는 부분이 많다. 이게 또 사람 골치아프게 만든다.

"이렇게 하면 분명이 인식율이 엄청 올라가는데... 솔직히 왜 인식율이 이렇게 올라가는지를 묻는다면 잘 모릅니다."

이게 머신러닝분야에 깊이 파고들고 있는 한 전문가의 고백이다 ( 이 얘기를 해 준 전문가의 이름을 적지 못함을 양해 바란다. 아직 본인의 동의를 얻지 못했다 ) 여튼 아직 이 쪽은 충분히 연구가 되지 못한 부분도 많고 미지수인 부분들도 많다.

필자가 아는 한에서 ( 이 쪽의 기술은 하루가 멀다하고 발전하고 있는지라 나도 알고 있는 선에서 밖에는 이야기를 할 수 없다. 필자가 모르는 새로운 발전이 이루어지고 있다면 필자는 의견을 바꾸어야 할 것이다. ) 머신러닝의 동작원리를 가지고 그 유효성을 나름 생각해 보았다.

사실 알파고는 구글이 정말로 타겟을 잘 잡은 것이라고 생각한다. 가장 머신러닝으로 구현하기에 적합하면서 또한 인간에게 공포심을 불러오기에 적합한 분야를 선택했다고 생각한다. 해서 인간의 능력은 머신러닝 앞에 무력하고 따라서 앞으로 인간은 머신러닝을 탑재한 기계에 의해 지배당할 것이라는 공포심은 구글의 주가를 올리기에 아주 좋은 분야였다.

"나는 그저 빼앗기는 쪽 보다는 빼앗는 쪽에 서고 싶었을 뿐이야..." 영화 배틀로얄... 에서 한 등장인물의 대사이다. 그리고 이 대사는 많은 사람들의 마음을 그대로 옮긴거라고 생각한다. 앞으로 세상은 기계가 등장할 수 밖에 없고 인간은 거기에 의해 대체되어질 수 밖에 없다면 기왕이면 나는 기계를 활용하여 인간을 대체하는 쪽에 서고 싶은 마음을 통해 주식가치를 올린것이라고 생각하는 것은 지나친 상상일까?

헌데 이걸 생각할 필요가 있다. 알파고는 갑자기 하늘에서 뚝 떨어지지 않았다. 엄청난 자금과 데이터를 먹고 만들어진 개념이다. 그것을 잊어서는 안된다. 먼저 알파고는 바둑을 사람에게서 배웠다. 기본적인 것들은 사람이 직접 가르쳤다. 이 단계에서의 발전속도는 그다지 빠르지 않다. 왜냐하면 사람이 가르치는 속도, 입력하는 속도에는 한계가 있기 때문이다.

그 후에는 세상에서 구할 수 있는 기보란 기보는 죄다 읽어들였다. 그 과정에서 알파고는 비약적으로 성장했다. 그리고 난 다음에는 알파고끼리 대국을 수도 없이 진행했다. 사람은 하루에 대국을 몇번 치루지 못한다. 하지만 알파고는 하루에도 수천번 수만번의 대국이 가능하다. 그렇게 하루만에 사람 평생에 이루지 못할 경험치를 쌓았다.

그리고 난 다음에는? 전혀 새로운 알파고... 사람의 기보와 사람의 기법에 얽매이지 않는 알파고를 만들었다. 구글에서는 이것을 알파고 제로... 라고 하고 이세돌9단과 대결한 알파고를 알파고 리... 라고 했다고 한다. 알파고 제로는 그야말로 백지에서 부터 시작해서 알파고 리 에게 바둑을 배웠다. 그리고 알파고 리를 뛰어넘는 존재가 되었고 그것으로 바둑의 신이 된 케이스가 된 셈이다.

헌데 말이다... 이 스토리를 읽으면서 한번 생각을 해 보자는 말이다. 만일 이 세상의 모든 기보를 구하기 어려운 상황이었다고 하면 알파고는 과연 존재할 수 있었을까? 하는 점이다. 물론 이세돌 9단 같은 아주 탑 프로급의 기사를 고용해서 알파고를 가르칠 수 있었을른지도 모른다. 하지만 이세돌9단은 비싸다. 그렇게 비싼 사람을 데려다가 알파고를 훈련시키는 건 구글이라면 모를까 영세한 기업에서는 수지타산이 안맞는다.

기껏해야 아마츄어 몇단 정도의 기사를 데려다가 훈련시키는 것이 한계일 것이다. 그것도 하루에 3-4회 정도의 대국을 하면서 말이다. 자 여기서 충분한 기보를 구할 수 없는 상황에서 인간의 시간에 맞추어서 훈련시킨 머신러닝 컴퓨터가 과연 인간을 대신할 수 있을 정도로 파워풀 할 것인가...

필자는 자신있게 얘기할 수 있다. 그건 아니다. 훈련할 수 있는 충분한 데이터를 확보하지 못한 머신러닝 컴퓨터는 아무짝에도 쓸모가 없다. ( 사실 지금 머신러닝을 공부하고 거기에 자신의 인생을 걸고 싶어하는 청년들에게 필자는 이야기 해 준다. 너희들은 잘못하면 평생 데이터만 만들어서 기계에 먹여주는 일만 하게 될 가능성도 있어. 그러니까 그것만 파겠다고 하는 것은 미련한 짓이야 라고 ... ) 이미 그 사례가 존재한다.

삼성에서 최신형 스마트폰에 인공지능 비서 시스템을 탑재했다가 그것에 대한 소비자의 반응이 영 시원치 않자 그 책임자를 경질했던 사건이 있다. 그리고 인공지능 탑재형 비서 서비스는 거의 좋은 이야기를 듣지 못했다.해서 요즘은 그것에 대한 텔레비젼 광고를 거의 찾아볼 수 없게 되었다.

왜 그랬을까? 필자가 파악한 바로는 그 인공지능 비서 서비스를 만드는 코드에는 이상이 없었다고 하는 얘기를 들었다. 사실 인공지능 시스템을 구성하는 코드는 그다지 복잡하지 않다. 수십만줄 수백만줄 하는 코드가 아니다. 문제는 데이터이다. 데이터의 양이 부족하면 충분히 학습될 수 없다. 충분히 학습되지 않은 인공지능은 정말 깬다. 3살짜리 어린아이와 같은 좌충우돌을 계속한다고 할까? 하여간 전혀 신뢰할 수 없는 행동을 하게 된다.

데이터가 부족한 인공지능이라는 것... 전혀 신뢰할 수 없는 시스템이 된다는 것인데 헌데 지금 우리가 살아가는 세상에서 "기계가 학습하기에 충분한 데이터가 준비된 분야가 과연 얼마나 될까?" 하는 것을 생각해 보자. 얼마나 많은 분야가 컴퓨터가 학습하기 위한 데이터를 준비하고 있을까?

아마도 의료정보 정도는 가능할른지 모른다. 하지만 이것도 충분하다고 보기는 어렵다. 사실 의료정보는 데이터에 기록되지 않은 환자의 생활습관이나 직업 인간관계 등의 요소들에 영향을 받는 경우도 많으니까... 한마디로 머신러닝이 학습하기 위해서는 이런 예기치 않은 변수에 좌우되는 것이 적어야 하는데 인간사는 그렇지 않다는 것이 문제다.

필자의 친구중에 목사님이 있는데 그 목사님은 앞으로 인공지능 목회자가 나타나서 기존의 목사를 대체하게 될 것이라는 생각을 하고 있다. 필자는 절대 그럴리는 없을거라고 단언하고 있다. 왜냐하면 신앙의 문제는 너무나 변수가 많다. 어떤 정형화 된 수학적인 공식을 적용하기 불가능하다. 그리고 정형화 되어진 데이터를 구축한다는 것은 불가능하다. 데이터가 없는데 인공지능이 존재할 수 없다. 그래서 필자는 목사를 인공지능이 대신할 수 없다고 생각한다.

그리고 그와 비슷한 심리상담사 유치원교사 같은 직종도 그러하리라고 생각한다. 왜냐구? 대표적으로 예측이 불가능한 분야라고 생각한다. 데이터 수집도 불가능하고... 그리고 실은 정답도 존재하지 않는분야라고 생각한다. 머신러닝이라는 것이 생각을 하는게 아니라 데이터에 기반해서 확률이 높은 쪽으로 판단을 내리는 것인데 정답이 존재하기 어려운 분야라면 머신러닝이 과연 적절한 답이 될 수 있을까나?...

 사실 이러한 것들을 따지고 들어간다면 우리네 세상에서 머신러닝이 파고들어갈 여지가 있는 분야가 그렇게 많지는 않다. 거기에 또하나 간과하기 어려운 사실이 있는데 "머신러닝을 구축하기 위해서는 돈이 생각보다 많이 들어간다" 라는 것이다.

학습하기 위한 컴퓨터는 그 자체로도 비싸다. 하지만 더 비싼 비용은 그 컴퓨터를 학습시키는 비용이다. ( 오죽하면 컴퓨터를 학습시키는 직업이 미래의 유망직종에 꼽히겠남 ) 컴퓨터는 아무 데이터나 수집하지 않는다. 사람과 다르다. 사람은 인생을 살면서 이런 일에서 저런 데이터를 읽어내기도 한다. 컴퓨터 프로그래밍을 하면서 연애의 원리를 알아내기도 하고 그것을 가지고 자신의 판단에 적용하기도 한다. 하지만 컴퓨터는 그렇지 않다. 반드시 특정한 판단을 내리기 위해 거기에 맞추어 만들어진 정형화 된 데이터만을 취급한다. 현실에 존재하는 데이터를 특정 판단을 위해 만들어진 컴퓨터에 공급하기 위해 사용되는 기술이 빅데이터의 핵심이라고 하는 R이라는 기술인데 여기에 대해서는 뒤에 설명하고자 한다.

이렇게 따지고 보면... 대규모의 데이터를 구할 수 있어야 하고, 거기에 상당한 규모의 자본을 투입할 수 있어야 하고... 따라서 그에 상응하는 댓가를 뽑아낼 수 있어야 하고... 그런 분야를 따지고 보면 그렇게 많지는 않다. 아마도 최 우선적으로 고수익을 올리는 직장인/자영업자들을 대체하는 일에 투입이 될 수는 있겠지만 사실 대부분의 일들은 인공지능 시스템을 마련할 정도로 데이터도 준비되지 않았고 본전을 뽑아낼 정도의 돈도 안된다.

돈을 엄청나게 퍼부어서 인공지능 기반으로 병의 원인을 진단하는 시스템을 만들었는데 그것이 의사들을 데체하는 수단이 아니라 의사들이 참고할 수 있는 수단 정도의 역할밖에 할 수 없는 일이 벌어진다면? 아마도 그 인공지능을 개발하는데 투자한 투자금은 허공에 날라갈 것이고 회사는 망할 것이다. 필자가 느끼는 머신러닝의 미래는 그 정도다. 그것이 세상을 완전히 뒤엎을 수 있으리라고는 생각하지 않는다...

작가의 이전글 소수를 위한 변화에 대한 인간의 반란은 무죄(2)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari