brunch

You can make anything
by writing

C.S.Lewis

by 워타보이 phil Apr 30. 2021

'인공지능이 잘하는 일 vs 못 하는 일'

<이것이 인공지능이다> 저자 김명락 QnA

ㅈ<이것이 인공지능이다> 저자 QnA

저자와 함께하는 랜선 QnA 모임 세모람에서 지난 4월 27일 <이것이 인공지능이다> 김명락 저자와 모임을 진행했습니다. 


#진행순서

1. 저자의 오프닝 : 책 소개 및 요약

2. 참가자와 저자의 QnA 시간

3. 저자의 클로징

1.저자의 오프닝 : 책 소개 및 요약

안녕하세요. <이것이 인공지능이다>를 쓴 초록소프트 대표 김명락입니다. 초록소프트는 2015년에 창업한 인공지능 기술 개발을 전문적으로 하는 회사입니다. 인공지능 개발자들과 다양한 프로젝트를 진행하고 있어요. 그래서 이 기술을 실질적으로 많이 겪어보고 경험하는 중입니다. 

초록소프트 홈페이지

 

#책을 쓴 이유

<이것이 인공지능이다>를 쓴 이유가 있어요. 일 년 내내 하는 일이 주로 고객들과 만나서 협의하고 이 내용을 바탕으로 인공지능을 만드는 일이에요. 대화를 나누고 일을 하다 보니 인공지능에 대한 잘못된 이해와 과도한 기대가 많다는 것을 자주 느꼈어요. 그때마다 하나하나 설명하는 일에 점점 지쳐갔죠. 이래서 될 일이 아니란 생각이 들더라고요. 책을 써서 읽어보시라 권해야겠다는 마음으로 집필을 시작했어요.


책 쓰려고 마음을 먹고 회사 앞 대형서점에 자주 갔어요. 인공지능을 다룬 책들이 참 많더라고요. 조금씩 읽어봤는데 크게 두 종류였어요. 


인공지능 전문가가 인공지능 전문 개발자를 위해 쓴 책들이 많았어요. 기술을 잘 모르는 사람이 읽기에는 어렵죠. 또 다른 종류의 책들은 전문 작가인 사람들이 인공지능에 대한 사례를 잘 모으고 편집해서 알기 쉽게 쓴 책들이었어요.


접근하기도 읽기도 좋지만, 문제는 책을 쓴 사람이 인공지능을 직접 다루는 사람이 아니어서 아주 미묘하게 잘못 얘기하는 부분들이 있다는 점이었어요. 예를 들어 제가 미국에 가본 적이 없는데요. 그 동네 이야기를 이런저런 정보를 모으고 편집해서 쓰면 미묘하게 잘못 전달하는 내용들이 나타날 수 있잖아요.


여기에 문제의식을 느껴 일반 대중을 위해 인공지능을 다루는 책을 직접 써봐야겠다고 생각했습니다. 

이제 책 내용을 요약해볼게요.


#빅데이터 보다 올데이터

‘빅데이터’라고 많이 들어보셨죠? 책 속 그림을 같이 볼게요. 화면에 보이는 그림은 디에고 벨라스케스의 <시녀들(1659년)>이란 그림이에요. 

<시녀들>  출처 : 위키피디아


상당히 유명한 그림인데요. 그림을 보면 사람은 본능적으로 사람 숫자부터 세게 돼있어요. 몇 명 인지, 누가 발라스케인지..' 그러면 대답을 비슷하게 합니다. 


근데 액자가 몇 개였냐 물어보면 대답을 잘 못해요. 이런 것들은 눈에 잘 안 들어 오죠. 인간 특성이에요. 인간은 데이터를 그대로 다 못 받아들이고 중요한 걸 선별적으로 받아들입니다. 


왜 그럴까요? 우리가 객관적이란 말을 쉽게 말하는데 인간은 사실 객관적이기 힘듭니다. 선행 연구를 보면 사람이 아침에 일어나서 하루 15~18시간 동안 특별히 작정하고 공부를 안 해도 5개 감각 기관으로부터 무려 14기가 바이트 정보를 받아들인다고 해요.


그중에 3/4은 시각데이터예요. 하루에 시각데이터만 10기가 바이트를 얻는데, 당연히 다 기억 못 하죠. 쓸모 있고 중요한 것만 취사선택을 한다는 거예요. 어쩔 수 없죠. 


컴퓨터는 그렇지 않아요. 데이터를 고르지 않고 모두 수용한다는 거죠. 예를 들어 100개 데이터가 발생하면 지금까지는 중요한 인포메이션(Information)을 ‘선별’했어요. 우리도 그림을 보고 사람 숫자부터 셌잖아요. 언제나 사람이 우리에게 중요하니까요.


근데 액자가 몇 점이고 문이 몇 개이고 이건 덜 중요하죠. 그래서 이런 건 인포메이션이 아니라 데이터라고 말해요. 우리가 이야기하는 3차 산업혁명, 1980년대부터 시작한 정보 혁명 때는 전체 데이터가 발생하면 인포메이션을 선별해서 이것을 저장하고 인간 판단력으로 분석하는걸 해왔던 거예요.


이렇게 인포메이션을 선별하고 저장하고 인간 판단력으로 잘 판단하도록 도와주는 일이 인포메이션 테크놀로지(Information Technology)이고, 이것이 우리가 말하는 IT입니다. 


지금은 세상이 어떻게 바뀌어 있냐면요. 전체 데이터가 발생하면 인포메이션과 그렇지 않은 걸로 구별하지 않아요. 발생하는 데이터를 다 수용하기 때문에. 


전체 데이터를 저장하는 것이 예전보다 돈도 덜 들고 쉬워졌거든요. 이 전체 데이터가 빅데이터예요. 인포메이션으로 걸러지지 않은, 쓸모없는 것다고 생각되는 것들까지 받아들이는 전체 상황. 그래서 올 데이터(All Data)라는 표현이 더 정확하고요. 이 전체 데이터를 인공지능을 통해 분석하면 이세돌을 이긴 알파고 같은 놀라운 결과가 만들어지는 거죠.


그래서 전체 데이터를 수집, 저장하고 인공지능으로 분석하는 걸 도와주는 것을 데이터 테크놀로지(Data Technology)라고 합니다. 이것을 줄여서 DT라 말하고요. 이렇게 전체 데이터를 다루는 것을 4차 산업 혁명이라 해요. 

책 p32



#3차 산업 혁명과 4차 산업 혁명

3차 산업혁명과 4차 산업혁명, 뭐가 다른 걸까요? 크게 다르지 않다고 느낄 수 있어요. 3차 산업 혁명은 인포메이션을 주로 다루고 4차 산업 혁명은 전체 데이터를 다루는 거니까요. 그런데 다루는 데이터가 많아지는 것 이상으로 큰 차이가 있어요. 


3차 산업혁명에서는 인간이 중심이에요. 인간의 판단력으로 인포메이션을 선별하고 이것을 인간이 분석해요. 인간의 판단력이 중심이 됩니다. 근데 4차 산업 혁명은 인간이 중심이 아닙니다. 발생하는 전체 데이터를 다 가지고 있다가, 인간의 판단력이 아니라 인공지능이 데이터를 분석해서 패턴을 찾거나 어떤 것을 예측하거나 추천하는 방식으로 일이 흘러가요. 이게 4차 산업 혁명이 3차 산업 혁명의 가장 큰 차이입니다.


그래서 빅데이터와 인공지능은 서로 의존적 관계예요. 사다리의 양쪽 날개 같은 거죠.


#인공지능

본격적으로 인공지능 얘기를 해볼게요. 인공지능은 대략 15개 정도 학문이 결합한 굉장히 넓은 분야예요. 컴퓨터, 수학, 인지과학, 철학 등. 현재 인공지능을 견인하는 건 머신러닝(Machine Learning)이고 우리 말로는 기계학습입니다. 

책 p50

요즘에 인공지능을 말하면 머신러닝 이야기를 하는 거예요. 머신 러닝 안에도 100여 개 정도의 기법이 있고, 그중 하나를 딥러닝(Deep Learning)이라 합니다. 요즘 딥러닝 성과가 원체 좋아서 마치 딥러닝이 머신러닝, 인공지능 것처럼 하지만 포함 관계에 있는 거죠.


빅데이터와 인공지능을 요리에 비유해 볼게요. 마트에서 음식재료를 사 와서 조리 도구를 사용해 요리를 합니다. 똑같은 재료와 도구로 요리를 해도 백종원 씨가 하는 거랑 제가 하는 건 맛이 다릅니다. 많이 다르겠죠.


여기서 음식재료를 빅데이터라 할게요. 어디서든 가져올 수 있어요. 인터넷에서 가져오기도 하고 문서에서 가져오기도 하고 센서에서 끌어오기도 하고요. 그러고 나서 전처리라는 걸 해요. 잘못된 걸 빼내고 값 범위를 맞추는 다소 통계적인 작업입니다.


그런 다음에 파이토치(PyTorch), 텐서플로(TensorFlow), 케라스(Keras) 같은 공개된 인공지능 개발 툴이 있거든요. 조리도구라 보면 돼요. 칼, 도마, 냄비 이런 것. 현업 개발자도 이제 막 공부를 시작한 학생들도 똑같이 사용할 수 있어요. 


요리와 마찬가지로 똑같은 빅데이터, 인공지능 개발 툴을 가지고 인공지능을 만드는 거죠. 그런데 결과가 다릅니다. 전문가들은 쓸만한 결과를 만들어 내는 것이고, 경험이 적은 분들은 부실한 결과를 만들어내는 거예요.


#인공지능 모델 : 추측과 예측

여기서 만든 결과를 ‘인공지능 모델’이라 말해요. 딱 2가지 역할을 해요. 무언가를 추측하거나 예측하는 일. 내일 비가 올지 안 올지 예측하거나, 아들이 회계사 시험을 보는데 합격 확률을 알려주는 것. 우리가 매일 보는 유튜브 추천도 같은 원리고요.


인공지능 모델을 잘 만들면 추천과 예측을 잘하는 인공지능 모델이 나오는 것이고요. 그렇지 못하면 엉뚱한 인공지능이 나오기도 하죠. 요리 맛과 같은 겁니다. 이게 빅데이터와 인공지능이 하는 일입니다.


#인간의 감성적 판단을 흉내 내는 머신러닝

우리가 인공지능이란 이름 때문에 오해를 많이 해요. 이름만 들으면 인간의 지능, 이성적 판단을 흉내 내는 것 같아요. 그런데 지금의 인공지능을 견인하는 머신러닝은 인간의 이성적 판단이 아니라 감성적 판단을 흉내 내는 거예요. 조금 의아하죠? 


예를 들어 볼게요. 회사 대표가 직원들과 카페에 갑니다. 물어보겠죠. 커피 마실래, 녹차 마실래. 직원 한 명이 커피를 선택하고 이유를 말해요. 커피를 하루 3잔 마실 계획이 있는데, 오늘 2잔 마셨고 당신이 야근시킬 거니까 한 잔 더 마시겠다 라고. 이건 이성적 판단을 하는 사람이죠.


다른 사람한테 물어봤더니 녹차라고 해요. 그냥 녹차가 마시고 싶어요 하면 이 사람은 감성적인 사람인데, 사실 그냥 찍은 게 아닙니다. 


카페에 처음 온 게 아닐 것이고요. 비슷한 분위기에서 과거에 50번 100번 같이 온 거예요. 녹차 마셨을 때 좋은 일이 더 많았던 거예요. 비슷한 상황에서 커피 잘못 시켰더니 사장이 3시간 잔소리하더라. 그러면 이제 안 시키겠죠. 앞 상황보다 뒤에 상황이 좋았던 거죠.


감성적 판단이란 것은 내 기억 내에서 확률적 최선을 찾는 거예요. 보통은 남자가 이성적 판단을 하고 여자가 감성적 판단을 한다고 해요. 


남편이 집에 와서 갑자기 전세 자금 빼서 암호화폐에 넣으면 부자가 될 거라고, 논리적으로 일장연설을 해요. 아내가 말리겠죠. 절대 하면 안 된다. 그러면 남편은 나 그렇게 꽉 막힌 사람 아니니까 이성적으로 설명해봐 합니다. 아내는 논리적으로 이야기를 못할 수 있어요. 그렇지만 과거에 비슷한 상황에서 집안 말아먹은 상황을 많이 봐서 안된다고 이야기를 해요. 아내 말이 맞는 경우가 대부분이죠.


감성적 판단은 경험과 기억에서 최선의 결과를 도출하는 것입니다. 이성적 판단으로 결과를 도출한 게 아니에요. 하지만 인간의 감성적 판단은 약점이 있어요. 아까도 보셨지만 기억이 선택적이죠. 친구들과 여행을 함께 갔다 와도 기억하는 게 달라요. 관심사에 따라 다르고, 시간이 지나며 왜곡되어 달라지는 거죠. 이런 기억에서 감성적 판단을 하니까 편견에 빠지는 겁니다.


반면 컴퓨터는 모든 데이터를 다 수용할 수 있기 때문에 감성적 판단을 하지만 좀 더 정확하게 판단할 수 있죠.


머신러닝이 아내의 판단을 흉내 내고 있는 거예요. 문제도 있어요. 남편이 아내에게 말리는 이유를 설명해봐 라고 하면 말을 못 하는 경우가 생기는 것처럼, 머신러닝 결과 과정이 절대로 이성적인 건 아니기 때문에 왜 자꾸 그런 결과를 추천하고 예측하는지 납득하기가 어려워요. 이 부분을 수용하지 못해서 인공지능 쓰기가 어려운 상황이 발행하죠. 


#빅데이터 활용 레벨 1,2,3

빅데이터를 수집하고 저장하고 분석하고 활용하는 과정을 거칩니다. 여기에도 창의성이 많이 필요해요. 3가지 단계로 나눠 설명해볼게요.


레벨 1은 빅데이터를 가져와서 시각화하는 거예요. 왜 이렇게 하냐면 빅데이터 시각화가 적은 노력으로도 꽤 그럴듯한 결과를 보여주기 때문에 그래요. 가성비가 좋죠. 


문제는 빅데이터 시각화 본다고 해서 우리 생각이 바뀌지가 않아요. 좋구나 하고 끝나는 거죠. 그래서 비행기를 산속에 묻어두고 카페 인테리어로 쓰는 거라 볼 수 있어요.


좀 더 자세히 설명하면 우리나라 축구대표팀 감독이 어떤 선수를 국가대표로 뽑아야 하는지가 중요한 의사 결정이죠. 빅데이터 시각화 경우 우리나라 모든 축구선수 명 한 명 데이터를 시각화하는 거예요. 감독이 보면 다들 열심히 하는구나 생각이 들지만 결국 자기가 뽑으려고 하는 사람을 뽑아요. 그걸 봤다고 의사결정에 영향을 주지 않죠. 


레벨 2는 좀 더 나아요. 전문가 판단 지원입니다. 사람이 어떤 기준으로 의사결정을 하는지를 먼저 밝힙니다. 그리고 축구선수 데이터를 분석한 두꺼운 리포트를 대표팀 감독에게 보여줘요. 감독이 다 읽어봐요. 그래도 자기 마음대로 뽑아요. 1단계보다는 영향이 커지지만 이거는 비행기를 버스로 쓰는 거죠. 빅데이터라고 하는 비행기가 움직이지만 제한적으로 움직이는 상황.


레벨 3이 돼야 빅데이터를 제대로 쓰는 건데 독일이 그렇게 해요. 선수 데이터를 수집하고 인공지능으로 분석해서 월드컵 우승을 위해 어떤 선수를 뽑아야 하고 전술을 어떻게 가져가야 하고 훈련을 해야 하는지 인공지능이 도출해요.


이걸 감독이 실제로 활용해요. 의사결정을 인공지능이 하는 거죠. 이렇게 되면 비행기가 제대로 이륙하는 거예요. 결론적으로 인간이 의사 결정해야 한다는 사고방식을 가지면 레벨 2까지 밖에 못 가요,


근데 인공지능이 더 좋게 판단할 수 있다고 생각해서 사용하면 레벨 3에 가고,  대표적인 프로젝트로 알파고를 들 수 있죠.


기업들을 만나면 그런 질문을 사람들한테 해봐요. 너희 회사 다음 대표를 인공지능으로 뽑을 수 있겠냐? 꺼림칙하죠. 그 중요한 의사결정을 인공지능이 한다고? 달리 생각해보면 그래서 더 좋은 대표이사 뽑을 수 있다면 안 할 이유가 없는 거죠. 


대부분 회사가 이렇게 생각을 안 해서 레벨 3까지 못 가는 거죠. 그 단계에 도달한 회사는 구글, 아마존 같은 사고방식이 앞선 회사들이에요. 기술 문제가 아니라 사고방식 문제인 거죠. 


#인공지능 시대, 인간의 일

제가 이 일을 해오면서 인공지능이 하지 못하는 2가지 일을 깨달았어요. 사람이 해야 하는 일인 거죠. 가치 판단이 필요한 일, 창조적인 일. 인공지능이 제대로 못하고 한다 해도 쓸 수가 없어요. 


컨닝이 만연한 대학의 모습을 상상해보죠. 컨닝해도 잘 안 걸리고 걸려도 구두 경고받는 걸로 그칩니다. 인공지능한테 물어보면 컨닝을 하라 그래요. 왜냐하면 사례를 기반으로 판단을 하니까요. 점수도 오르고 걸리지도 않고 구두 경고만 받으니까.


근데 인간들은 옳지 않다고 믿고 있어서 하면 안 된다고 하죠. 인류 역사가 이렇게 까지 발전할 수 있었던 것은, 인간의 윤리의식과 가치 판단이 있었기 때문에 그런 것이고요. 


창조적인 일도 마찬가지입니다. 시중 음악들을 다 수집해서 표절이 아닌 수준으로 작곡하는 건 인공지능이 매우 잘해요. 그런데 퀸의 보헤미안 랩소디 같은 곡을 만드는 작곡은 못합니다. 그 당시 노래들을 아무리 조합해도 보헤미안 랩소디 같은 시대를 뛰어넘는 노래를 만들어 낼 수 없다는 의미예요.


가치판단과 창조성이 필요 없는 일들은 인공지능으로 대체할 수 있다는 말과도 같습니다. 


#유망 직업?

많은 분들이 어떤 직업은 앞으로 유망하고 아니고를 직업 단위로 얘기해요. 약사를 생각해 볼게요. 똑같은 약사여도 대형병원 약사는 인공지능으로 대체가 될 수 있어요. 처방전대로 일하면 되잖아요. 처방전대로 약 지어주는 과정에서 가치판단은 크게 필요 없죠. 창조적 대안도 필요 없고요. 오히려 인공지능이 처방도 더 정확하죠. 상당부분 업무를 대체하고 있어요.


근데 동네나 시골병원 약사는 대체가 안될 수 있겠죠. 처방전만 필요한 게 아니잖아요. 단골이 찾아왔는데 그 사람의 형편이 어려운 걸 알아요. 10만 원짜리 약인데 어려운 걸 아니까 자존심 안 상하는 선에서 비슷한 효능을 주는 3만 원의 약을 추천할 수 있겠죠. 이건 가치 판단이고요.


알코올 중독 김 씨 아저씨가 오면 위장약 주는 게 아니라 술 좀 끊으라고 권할 수 있어요. 창조적 대안이죠. 이런 식으로 일하는 약사는 계속 있을 거예요.


그래서 유망 직업을 따지기 보다, 현재의 직업 안에서도 인공지능이 못하는 일을 얼마나 잘하느냐가 중요한 것이란 생각이 들어요. 


대학 배치라는 게 있잖아요. 수능 점수 보고 어느 대학에 갈 수 있는지 볼 수 있는. 최근에 보니까 무조건 의대가 가장 위더라고요. 이름 있는 대학이든 아니든. 인공지능 시대에 역행하는 상황이라 보였어요. 


간호사보다 의사가 대체되기 쉬운 시대거든요. 모든 의사의 역할을 인공지능이 할 수는 없겠죠. 외과의사가 세밀한 손놀림으로 수술하는 건 로봇 수술에 한계가 있고요. 그런데 의사가 하는 일의 대부분이 데이터 분석인 경우가 많아요. CT, xray, 초음파를 보고 병을 예측하고 판단하는 일을 하는데 인공지능도 아주 잘하죠. 


그런데 간호사가 하는 일은 대체하기 힘들어요. 환자 마음을 살피고 교감과 소통이 필요한 일들.


#정리

앞으로는 인공지능 만드는 사람이 중요한 게 아니라, 이 기술을 잘 이해하고 활용하는 사람이 많아지느냐가 중요하고요. 


지금 인공지능 기술을 사실 20년 전 인터넷 기술이라 보면 돼요. 20년 전에 난리가 났었는데 지나고 보니 자연스럽게 다 사용하고 있죠. 10년 전 스마트폰도 같아요. 스마트폰이 세상에 처음 나왔을 때 학원도 있고 책 사서 공부하고 그랬어요. 시간이 지나면서 익숙해졌죠. 인공지능도 그런 거예요.


인공지능 기술은 사실 세상에 나온 지 70년이나 된 기술이에요. 그런데 빅데이터 환경이 구축 안돼서 그동안 밥값을 못하다가 빅데이터라 부를 수 있는 상황이 오면서 인공지능이 자기 역할을 수행하기 시작했고, 이를 보는 대중 입장에서는 신기술로 보이는 것 같기도 해요.


관건은 남들보다 빨리 기술을 이해하고 여러 가지를 시도해보는, 그런 걸 할 수 있느냐 그렇지 않느냐, 여기에서 앞으로의 차이가 만들어질 수 있다고 생각합니다. 



2. <이것이 인공지능이다> 독자와 저자의 QnA

21.04.27 진행


- 주식을 분석할 때 특정 변수를 설정해 놓는다면 이것은 빅데이터 프로젝트가 아닌 것으로 봐야 할까요??

맞아요. 빅데이터 프로젝트가 아니에요. 변수를 특정하는 순간 선택한 패턴 안에서만 결과가 나오거든요. 어떤 기업이 성장할 기업인지 아닐 기업인지 생각해보죠. 아무래도 매출액이 늘어나고 영업이익이 커지고, 시장 점유율이 높아지면 잘되는 회사라고 생각할 거예요.


그래서 매출액, 영업이익 증감, 시장점유율 변화를 특정하고 패턴을 찾으면 우리가 생각하는 범위 내에서만 답이 나와요. 이런 프로젝트가 의미 없다는 게 아니라 빅데이터 프로젝트는 아니라는 거예요. 


빅데이터 프로젝트는 의도를 가지고 변수를 측정하는 게 아니고, 기업과 관련한 모든 데이터를 다 가지고 오는 거예요. 쓸데없는 것 까지. 예를 들어 저희 회사 이름은 초록소프트 5글자인데요. 회사 이름의 글자 수가 기업 성장에 어떤 영향이 있겠나 싶지만, 이런 쓸데없어 보이는 데이터까지 가져오는 게 빅데이터 프로젝트라 볼 수 있습니다. 


그런 변수가 200개라 볼게요. 머신러닝 프로젝트를 진행하다 보면 우리가 알고 싶은 것을 예측하는데 영향력 없는 변수들은 저절로 도태합니다.


투표하듯 50개 탈락시키고 그런 게 아니고, 계속하다 보면 200개 중에 190개가 도태하고 나머지 10개가 살아남는 거예요. 10개 중에 7개는 예상할 수도 있는 거고 3개는 예상 못할 수 있는 것들도 있고요. 이런 게 빅데이터 프로젝트예요. 질문자가 말씀하신 건 통계 프로젝트라 볼 수 있겠고요.


몇 가지 사례를 말씀드릴게요. 저희 회사가 4년 전에 싱가포르 암호화폐 투자 플랫폼 회사에 의뢰를 받았는데요. 초기 단계 암호 화폐를 인공지능을 이용해서 평가하는 걸 하고 싶어 했어요. 앞으로 잘될 거라는 예측이 있으면 투자자 들께 권하기도 하고, 아니면 투자를 말라고 경고하기도 하고 그런 걸 하고 싶었던 거예요.


암호화폐에 white paper라는 ‘백서’가 있어요. 우리 암호화폐는 앞으로 이런 식으로 만들겠습니다 하는 청사진 같은 거창한 계획이에요.


고객사는 우리한테 암호화폐 백서를 잘 분석해서 이게 잘될 애인지 아닐 앤지를 찾아보라 요구했어요. 백서가 중요하다고 생각해서 6개월 정도 작업을 했는데 놀라운 건 암호화폐가 잘될 건지 말 건지랑 백서가 상관이 없었다는 거예요. 머신러닝 프로젝트해보면 이런 일들이 자주 나와요. 너무 이상해서 원인을 찾아봤어요. 2가지였어요.


첫 번째는 암호화폐 백서를 전문 업자들이 써주는 경우가 많아요. 실제로 암호화폐 만든 사람들이 아니라 써주는 사람들이 따로 있는 거예요. 두 번째는 암호화폐 백서대로 암호화폐 만드는 경우가 극히 드물다는 것이고요. 다이어트도 계획이 훌륭하다고 성공하는 거 아니잖아요. 해내는 사람들은 무식한 방법으로 6개월, 1년 해서 빼잖아요. 플랜이 좋다고 결과를 내는 게 아닌 거죠. 


이처럼 빅데이터 프로젝트 밸류는 우리 상식과는 다른 포인트를 찾아낸다는 겁니다. 그런데 통계 프로젝트는 그런 식으로 흘러가지 않아요. 가설을 세우고 그 가설이 맞는지 아닌지를 검증하는 거니까요. 


또 하나 사례를 말씀드릴게요. 빅데이터 바이블이라고도 할 수 있는 <모두 거짓말을 한다>에 나온 내용이에요. 이 책을 쓴 사람이 누구냐면 2016 미국 대선 당시 트럼프 대통령 당선을 예측한 사람이에요. 대선 직전까지 많은 전문가가 힐러리 당선을 예측했었죠. 이 사람은 빅데이터 분석을 통해 트럼프 당선을 예측한 사람이에요. 


책에 경주마 예측 프로젝트 얘기가 나와요. 태어난 지 3, 4개월 경주마가 어른 3년 4년 키우면 다 큰 말이 될 텐데요. 그때 아기 말이 경마대회 내보냈을 때 잘할 애인지 아닌 애인 지를 예측하는 게 중요하죠. 좋게 성장할수록 말의 가격이 달라질테니까요. 성과도 달라질거고.


기존에는 어린 말이 앞으로 잘 달릴 말인지 피부 윤기, 꼬리 길이, 치아가 튼튼하냐, 다리 근육이 있느냐 이런 것들. 또 유전적 혈통이 얼마나 좋으냐. 이런 걸 봤어요. 앞서 말했던 선별된 ‘인포메이션’인 거죠. 우리 상식에 중요한 데이터. 통계 모델 만들어서 예측한 거죠.


그런데 어떤 빅데이터 전문가가 일생을 받쳐서 뭘 했냐면, 남들이 다 알고 있는 변수가 아니라 남들이 볼 때 쓸모없어 보이지만 어린 말이 커서 잘 달릴 수 있는 변수를 한 평생 찾아다녔어요. 


예를 들어 말 코 평수가 크면 어른이 되어 잘 달릴 것이다 라는 괴짜스런 발상을 해요. 실험도 2년 정도 했는데 상관 없다는 결과를 받았어요. 또 심장이 크면 말이 잘 달릴 것이다 라는 기대를 가지고 연구를 했는데 한계에 봉착해요. 왜냐하면 병적으로 심장이 큰 애들이 많았던 거예요. 이런 경우가 섞여 있으니 계속 실패했죠. 그러다가 비장도 크고 심장도 크면 이건 진짜로 잘 달릴 말이라는 결과를 얻어내요.


이게 무슨 뜻이냐면 비장 자체는 말 달리는데 영향이 없는데요. 비장과 심장 둘 다 크면 오장육부가 골고루 발달해있는 상태에서 심장이 큰 거예요. 이거는 심장만 병적으로 큰 게 아닌 거죠. 비장과 심장 크기 비율을 가지고 그 비율이 큰 애들은 어른이 되어 잘 달리고, 반대 애들은 못 달린다는 상관관계를 드디어 찾아낸 거죠.


계속해서 혈통이 좋은 어린 말 이야기가 나와요. 주인이 싼 값에 말을 팔았어요. 그걸 듣고 이 빅데이터 전문가가 비장과 심장이 좋은 말을 왜 파냐고 따지죠. 주인은 무슨 얘기인가 싶으면서도 전문가 얘기를 듣고 다시 비싼 값에 말을 사 와요. 


아메리칸 파로아라는 이름의 말인데 37년 만에 미국 메이저 3개 대회를 석권해요. 무슨 사례냐면 말의 비장과 심장의 비율은 인포메이션이 아니에요. 우리 상식에는 쓸모없는 데이터죠. 하지만 거기에서 어린 말이 어른 말이 되어 잘 달릴 수 있다는 사실을 찾은 거예요. 

아메리칸 파로아의 질주

우리가 기존 방식은 전체 데이터, 빅데이터에서 인포메이션을 특정해 버리고 그 안에서만 패턴을 찾기 때문에 다행히 중요한 메시지나 패턴이 그 안에 있을 때에는 답을 찾지만, 알고 봤더니 그밖에 메시지나 패턴이 있을 경우에는 답을 찾을 수 없죠. 그런데 빅데이터 프로젝트는 그렇지 않다는 것입니다. 



-아무리 인공지능이 뛰어나다고 해도 인간만이 할 수 있는 고유영역이 있다고 말씀해주셨어요. 그런 영역은 창의적인 문제 해결 능력을 필요로 하는 것이겠죠. 이런 능력을 잃지 않기 위해서 갖기 위해서, 작가님이 하시는 개인적으로 어떤 노력을 하는지 궁금합니다.

200년 전에 기계가 산업 현장에 도입될 때 단순히 힘만 쓰는 일들은 기계가 대체했죠. 물건 옮기거나 힘이 필요한 것들. 그런데 힘을 써도 창의적 대안을 제시하며 해야 하는 건 기계가 대체 못했죠. 


데이터만 보고 결과 낼 수 있는 일은 인공지능이 할 수 있지만, 가치판단과 창의적 대안을 제시하면서 패턴을 찾아야 하는 일들은 인공지능이 대체를 못한다고 봐요. 그래서 인공지능 시대가 되면 인간다움은 무엇인지, 인간이 해야 하는 게 무엇일지 더 많은 고민을 해야 한다고 봐요.


예전에는 집안일이라고 하는 것, 빨래하고 청소하고 밥하는데 상당한 시간을 썼어요. 근데 가전제품이 나왔죠. 식기세척기, 세탁기, 건조기, 청소기 덕에 그런 것들의 시간 단축이 됐어요. 그렇다고 집안일이 시간적으로 줄지는 않았어요. 


100년 전에는 빨래하고 말리고 밥하는데 시간을 다 쓰고 애들은 자기들끼리 컸죠. 첫째가 둘째 키우고 둘째가 셋째 봐주고 이런 식으로.


이제는 그 시간만큼  부모가 애들 챙기고 이야기 들어주고 놀아주는데 더 많은 시간을 쓰잖아요. 그렇게 된다는 거죠. 


앞으로 인공지능이 우리가 데이터 분석하고 패턴 찾는데 하루 5시간 6시간씩 썼던걸 상당 부분 해주면 남는 시간이 생길 거예요. 그때 공감하고 고민 함께 나누는 이런 가치 있는 일에 더 많은 시간을 쓰게 될 거고요. 저도 그런 고민을 하는데 많은 시간을 쓰고 있습니다. 



- 발달장애인이나 치매어르신의 경우 인지능력이나 상황 예측 등에 어려움을 겪는데 인공지능이 삶의 질을 달라지게 할 수 있지 않을까 하는 가능성에 주목하게 됩니다. 혹 예상 가능한 인공지능의 역할이 있을까요?

인공지능의 도움을 받을 수 있습니다. 예를 들어 타인의 감정을 읽는 것은 굉장히 어려운 일이죠. 얼굴 보고 기분을 느낀다든지, 억양을 듣고 관심 있는지 없는지 찾거나 그런 거요. 눈치라고도 말합니다. 쉽게 되는 사람도 있지만 어려운 사람도 있어요. 인공지능은 얼굴을 보거나 목소리 억양을 듣고 감정을 읽어주는 도우미 역할을 해줄 수 있습니다.


방법은 수 억 명 사람들 표정을 다 가져와서 이건 화난 표정, 이건 기분 좋은 표정 이런 식으로 분류를 하고 인공지능 모델을 만드는 거예요. 그러면 99% 이상 확률로 기분을 맞출 수 있습니다.


일상생활에 어려움을 겪는 부분도 인공지능의 도움을 계속해서 받을 수 있을 것이고요. 그렇게 된다면 스스로 할 수 있는 일도 더 많아질 거라 생각합니다. 



-도서관 사서로 일하고 있습니다. 인공지능이 내 직업을 대체하지 않을까 라는 생각이 듭니다. 어떻게 대체되지 않는 사서가 될 수 있을지 고민해보고 있습니다. 

유망한 직업과 그렇지 않은 직업, 이렇게 ‘직업 단위’로 얘기를 많이 합니다. 그런데 직업보다 직업 안에서도 어떤 일을 하느냐, 인공지능이 못하는 일을 얼마나 잘할 수 있느냐가 중요하다고 말씀드릴 수 있습니다. 처음에 책 소개에서 말한 가치 판단을 하는 일이나 창조적인 일이 대표적이겠죠. 


예를 들어 책 찾아주는 건 인공지능이 더 잘해요. 그렇지만 도서관의 가치는 이런 거죠. A 책 찾으러 가면, 옆에 있는 B, C 책도 보게 된다든지, 새로운 분야의 책에 관심을 가지게 된다든지 하는 것이요. 


도서 검색으로는 생각했던 책만 보게 되지만 도서관에 직접 방문하면 관심 범위를 넓힐 수 있고요. 실제로 학교 도서관 가보면 책을 펼쳐보지 않고 제목만 봐도 흐름을 알 수 있는 경우가 있고요. 저도 대형 서점에 가보면은 인공지능 관련해서 어떤 것들이 언급되고 있다든지 이런 걸 알 수가 있잖아요. 이렇게 큐레이션도 새롭게 해 볼 수 있겠고요.


전시장에 가면 도슨트가 있어요. 이분들의 가치가 굉장히 크다고 생각해요. 미술관에 가도 도슨트가 없으면 좋은 작품 많네 하고 금방 나오는 경우들이 있어요. 그렇지만 도슨트에게 작품의 배경 설명과 구체적인 이야기를 들으면 달리 보이는 것들이 생기죠. 


마찬가지로 도서관 찾아온 사람들한테 원하는 걸 찾아주는 수준이 아니라 대화하고 공감할 수 있는 장을 마련하면 더 좋은 가치를 방문자들에게 줄 수 있을 거라 생각해요. 전시장처럼 책 큐레이션을 해볼 수도 있고요.


지식을 보관하고 확대하는 일은 인류 역사에서 매우 중요한 일이고 그런 의미와 과정에서 도서관 이야기를 방문자에게 소개할 수도 있겠죠. 이런 일은 인공지능이 하기 어려우니까요.



- 책을 읽으면서 생각이 막혔던 부분이 인간의 의사결정을 내려놓는 것에 대해 두려워하지 말아라 하는 부분이었어요. 인간 고유성을 빼앗겨야 한다는 것에 두려움이 앞섰거든요. 어떻게 생각해야 할까요? 

의사 결정을 인공지능이 하니까 사람이 하는 일들이 없어진다고 생각할 수 있는데 그렇지 않아요. 


회사에서 한국 도로공사와 프로젝트를 했던 적이 있어요. 톨게이트 요금을 주제로요. 지금은 모든 사람의 도로 이용 비용이 같잖아요. 그런데 인공지능 모델을 만들어 수익 극대화 방안을 찾아보면 이런 식으로 나올 수 있어요. 


예시입니다. ‘20대 남자들한테 비용을 깎아주고 임산부에게 3배를 받아라.’ 누가 봐도 이상하죠? 20대는 톨 비용이 비싸면 국도로 우회해서 가요. 도로를 잘 알고 있으니까. 임산부는 몸이 불편한 상황이니 비싸도 고속도로를 탈 확률이 높겠죠. 이렇게 해서 수익이 높아진다고 판단할 수 있다는 거예요. 


그런데 이건 우리 가치관, 윤리의식에 안 맞잖아요. 임산부에 면제를 해주면 해줘야지. 인공지능은 가치 판단을 내려놓고 오로지 데이터만 보고 이익 극대화 방법만 알려 줍니다. 마지막 단계에서 가치 판단은 사람이 할 수 있다는 거죠. 


이게 생각보다 훨씬 복잡한 문제예요. 자율 주행 자동차 분야에도 이슈가 있죠. 여러분이 자율주행 자동차 타고 있어요. 엄청 튼튼해서 사고가 나도 본인은 다치지 않는다고 가정할게요. 근데 맞은편에서 차가 넘어와 내 앞에 마주했어요.


정면충돌하면 그 차 운전자는 사망 확률이 높아요. 급정거 선택을 할 수 있겠죠. 그럼 죄 없는 뒤에 차가 피해를 봅니다. 어떤 선택을 해야 할까요? 일 년 내내 토론해도 명확한 답을 내기가 힘들 거예요. 어렵고 힘든 문제죠. 


예를 들어 도요타는 사망자를 줄이는 선택을 하고 현대자동차는 죄 없는 사람에게 피해 안주는 방향으로 인공지능을 만들어요. 혼돈 그 자체가 되겠죠. 가치판단 문제가 점점 더 복잡해지는 거예요. 결론적으로 질문자 걱정과 반대 상황에 마주하는 겁니다.


컴퓨터에게 0.1초는 4억 번은 계산할 수 있는 시간이에요. 우발적인 상황에 닥치면 인간 운전자는 어떠한 선택을 순간적으로 해야 하는데 컴퓨터는 계산해서 행동한다는 거예요. 사고가 아니라 계산적인 행동인 거죠.


연간 교통사고 사망자수가 4,000명 정도 됩니다. 이걸 살인으로 보진 않고 실수나 부주의로 보죠. 근데 모든 차가 자율 주행으로 움직이면 사망자 예측을 1,000명 이하로 봐요. 제로는 아니죠. 약 800명 정도. 그런데 이 800명 사망은 실수나 부주의가 아닌 거예요. 계산대로 행동해서 의도적인 사망 사고가 발생한 거죠. 그 가치 판단을 해야 하는 것이 얼마나 복잡한 문제 상황이겠어요.


실수가 아닌 의도가 된다는 것. 막을 수 있는 일도 취사선택을 해야 하는 상황인 거예요. 오늘 이야기 한 2가지. 결론적으로 인공지능이 잘하지 못하는, 가치 판단을 하고 창의적인 일을 하는 것에 인간이 앞으로 더 많은 시간을 쏟게 되겠죠.



- 저자는 앞으로 어떤 분야에서 활동을 이어가고 싶은가요?

저희 회사 초록소프트는 스포츠 데이터 분야, 유동 인구 데이터 분야 등에서 여러 일을 하고 있습니다. 우리 고객들이 인공지능을 적용했으면 하는 본인들의 분야가 있어서 자연스럽게 그런 일을 하고 있고요. 사실 인터넷을 적용할 수 있는 분야가 따로 있는 게 아니잖아요. 인터넷 없이 공부하고 일하는 게 상상 안 되는 것처럼, 10년 더 지나면 그렇게 되는 거예요. 


어디에는 인공지능 적용되고 안되고 가 아니라, 거의 모든 인공지능을 쓸 수 있는데요. 다만 가치 판단이 필요하고 인간 창조성이 필요한 그런 분야에는 인공지능이 쓰이지 않을 것이고요. 그런 정도의 구분이 있겠네요.



3. 저자의 클로징

인공지능기술은 20년 전 인터넷 같은 거예요. 20년 전에는 홈페이지 만드는 게 대단해 보였는데 지금은 아니잖아요. 본인이 못 만들어도 문제가 없어요. 카페 개설을 하거나 페이스북 그룹을 만들어서 쉽게 뭔가를 해볼 수 있죠.


인공지능 기술을 다뤄야 하는 사람은 그렇게 많지 않아요. 모두 인공지능 기술 다 다뤄야 하는 게 아닌 거죠. 관건은 이 기술을 어떻게 활용할 수 있는지, 이 안에 어떤 의미가 있는지 빨리 파악하는 것입니다. 그래서 관련 책을 읽고 이런 모임에 참여하는 시간도 중요하다고 봐요. 


모든 것의 시작은 관심이잖아요. 이런저런 자료를 접하다 보면 어느 순간 다른 분들보다 이 분야에 대해 아시는 게 많아지고 새로운 시도도 해볼 수 있을 거예요.


여기 계시는 분들이 현재 개별적으로 인공지능 프로젝트를 하기는 어려울 수 있어요.


그래서 정부에서 AI 바우처 지원사업, 데이터 바우처 지원 사업을 많이 만들어 놓았어요. 작은 기업이나 개인이 인공지능 전문회사에 돈을 주고 인공지능 모델을 만들도록 나라에서 개발비를 지원해주는 거예요. 정부는 인공지능 생태계를 키우고 좋은 선례를 만들고 싶은 거고요. 인터넷에 검색해보면 찾아볼 수 있을테니 꼭 활용해보시고 인공지능을 경험해보시면 좋겠어요. 



저자 김명락

서울대학교 원자핵공학과에 진학했고 동대학원에서 빅데이터, 인공지능을 활용하여 핵융합 장치를 제어하는 연구를 수행했다. 

벤처 거품이 완전히 끝난 2002년에 첫 번째 창업을 했고 4년 만에 실패를 경험했다. 10년 동안 대기업과 중견기업에서 전략기획, 신사업, 경영혁신, 정보전략, 건설IT융합 업무를 맡았으며 주말에는 경영대학원을 다니며 2015년에 다시 인공지능 회사인 〈초록소프트〉를 창업했다. 

회사의 대표로서 지난 5년 동안 인공지능이라는 기술로 시장에서 살아남기 위해 노력하면서 인공지능에 대한 시장의 기대와 오해를 가감 없이 모두 접할 수 있었다. 인공지능의 미래는 기술을 만드는 데 있지 않고 그 기술을 이해하고 활용하는 사람들에 의해 본격적으로 시작될 것이라는 믿음이 있다. 

연세대학교에서 금융 분야 인공지능을 가르쳤고 현재 한국외국어대학교에서 스포츠 분야 인공지능을 가르치는 겸임교수로 재직 중이다.




세모람 - 저자와 함께하는 랜선 QnA 모임

매주 새로운 저자를 만나 질문하세요 :)

홈페이지

인스타그램

페이스북


매거진의 이전글 <북유럽 비즈니스 산책> 저자와 Q&A
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari