: 스스로 답을 찾는 아이는 부모에게 달렸다
엄마 주도 학습의 한계는 명확하다. 인간에게 엄마(타인) 주도 학습과 자기 주도 학습이 있듯이, 인공지능 개발에도 상향식과 하향식이 있다. 하향식은 엄마가 아이에게 답을 입력하듯이, 개발자가 컴퓨터에 규칙과 정보를 입력하는 방식이다. 상향식은 아이가 스스로 답을 찾아가듯, 인공지능이 정보에서 규칙을 스스로 찾는 방식이다.
초기에는 인공지능을 하향식으로 개발했다. ‘어떻게 하면 더 정교한 규칙과 정보를 입력할 수 있을까’에만 몰두했다. 방대한 정보를 저장했다가 순식간에 꺼낼 수 있기에 퀴즈에서 인간을 압도했다. 복잡한 경우의 수를 순식간에 계산해 체스에서 인간을 넘어섰다. 하지만 고작 그 정도가 한계였다. 그 이상은 불가했다. 결국 하향식 개발 방식은 암흑기를 맞았다.
하지만 오늘날 우리가 목격하는 인공지능의 발전은 놀랍다. 알파고가 등장한 게 엊그제 같은데, 인공지능은 이미 전방위에서 침투하고 있다. 심혈관 질환 등 일부 의료 진단에서 이미 인간을 앞섰고, 후지쯔의 중국어 필기 인식률(96.7%)도 인간(96.1%)을 앞섰다. 아마존의 인공지능 로봇 키바는 물류 창고의 노동자를 집으로 보냈다. 물류 창고의 운영비는 1/5로 줄었다.
무엇이 사그라져 버린 인공지능에 새 생명을 불어넣었을까? 인공지능을 키우는 방식을 바꿨기 때문이다. 하향식 개발로는 아무리 많은 정보와 복잡한 규칙을 입력해도, 인공지능은 고양이조차 알아보지 못했다. 하향식의 한계 탓에 1980년대 후반부터 상향식 개발이 주목받았다.
인공지능 개발자는 인간을 다시 관찰했다. 아이는 3세만 되어도 인공지능이 쩔쩔맨 것을 손쉽게 해낸다. 주변을 관찰하고 유창하게 설명할 수 있다. 소파 위에 올라간 것이 고양이인지 인형인지, 어떤 물건이 식탁 위 혹은 아래에 있는지도 구분할 수 있다. 인사를 하거나 안고 업는 등의 행동도 잘 설명한다. 그래서 인공지능 개발자들은 아이가 주변을 어떻게 인식하는지를 바라봤다. 아이는 3세가 될 때까지, 초롱초롱한 두 눈으로 수억 장의 장면을 본다. 몇 페이지에 걸쳐서 구구절절 묘사된 글을 읽거나 설명을 듣는 것도 아닌 직접 보는 ‘경험’을 하는 것이다.
인공지능 개발은 상향식으로 바뀌었다. 일방적으로 규칙을 주입하는 하향식 개발에서 스스로 규칙을 만드는 상향식 개발로 전환했다. 정답을 주입하는 밖에서의 교육이 아니라, 스스로 답을 찾는 안에서의 교육으로 전환했다. 오늘날 우수한 인공지능이 출현한 이유는 자기 주도적인 경험에 있다.
미국 스탠퍼드대학 비전연구소는 상향식으로 인공지능을 개발했다. 인공지능에게 주변을 어떻게 인식해야 하는지 더는 설명하지 않았다. 아이가 직접 경험하듯이 인공지능도 경험을 하도록 했다. 어떻게 설명하는지를 담은 알고리즘을 짜는 데 초점을 맞추지 않고, 인공지능이 경험하도록 많은 데이터를 확보하기로 했다.
비전연구소는 2007년 이미지넷 프로젝트를 시작했다. 인터넷에서 사진 10억 장을 다운로드 받아서 클라우드 소싱으로 사진을 분류했다. 167개국 5만 명이 참여하는 대규모 프로젝트였다. 마침내 2009년에 1,500만 장의 사진을 2만 2천 가지로 분류했다. 고양이 사진만 6만 2천 장이었다. 이 빅데이터와 상향식 개발이 고양이를 비롯한 여러 사물을 인식할 수 있는 인공지능을 탄생시켰다.
중요한 것은 밖에서의 주입이 아니라, 안에서 쌓아 올린 경험이다. 한 가지가 더 있다. 비전연구소는 인공지능 개발에 수년의 시간과 수 만 명을 동원했다. 자기 주도적인 경험만큼이나 중요한 것은 경험을 충분히 쌓을 수 있도록 지원한 정성이다.
인공지능은 이미 일상 깊이 들어왔다. 목소리로 상품을 주문하거나 숙박을 예약하는 것은 물론 목적지에 도달하는 최적의 길을 안내한다. 의사가 놓쳐버린 병을 진단하고 변호사의 훌륭한 파트너가 되었다.
시대는 풍부한 경험에 주목한다. 빅데이터다. 어떤 비즈니스든지 더 똑똑한 인공지능을 만들어야 이길 수 있다. 더 똑똑한 인공지능의 비결은 더 많은 경험(빅데이터)이다. 모두 더 많은 데이터를 구하려고 난리다. 데이터 확보 전쟁은 이미 시작됐다.
구글의 검색엔진은 20년간 세계 최고의 자리를 지켰다. 구글은 왜 최고의 검색엔진을 만들고 나날이 다듬어 최고의 자리를 유지한 걸까? 인류가 검색하는 데 애를 먹으니, 세상을 널리 이롭게 하기 위해서일까? 그래서 뼈 빠지게 노력해 최고의 검색엔진을 만든 걸까? 절대 아니다.
구글을 창업한 래리 페이지는 말했다. “인공지능이 구글의 궁극적 버전이다.” 최고의 검색엔진을 만들어야 가장 많은 사람이 구글로 접속한다. 이용자가 입력하고 검색한 모든 데이터가 구글의 소유가 된다. 데이터의 길목을 장악한 것이다. 또한 인터넷으로 연결된 서버의 수많은 자료를 검색의 명분으로 구글 서버에 저장해서 데이터를 확보할 수 있다. 구글의 뛰어난 검색엔진은 가장 많은 데이터로 가장 똑똑한 인공지능을 만드는 수단이다.
인터넷 검색뿐만이 아니다. 아마존의 인공지능 스피커 ‘에코’를 필두로 네이버, 카카오, KT, SKT, 유플러스까지 우후죽순처럼 인공지능 스피커 사업에 뛰어들었다. 남이 하니까 나도 하자는 단순한 의도가 아니라, 인간의 목소리라는 데이터를 움켜쥐기 위해 기업의 명운을 걸고 뛰어든다. 가격 할인에 사은품까지 엮어 손해를 감수하며 전력 질주한다.
데이터의 길목을 확보하려 모두 혈안이다. 기업이 이처럼 자식(기업의 인공지능)이 스스로 자랄 수 있도록 장기적이고 전폭적인 지원을 쏟는데, 우리는 어떤가? 풍부한 경험으로 스스로 성장하도록 지원하기는커녕, 입시와 스펙을 강요한다. 정작 아이가 커서 취업할 때가 되면, 블라인드 채용이 확대되어 학위와 스펙은 중요하게 보지도 않을 텐데 말이다. 정작 기업이 중요하게 여기는 자기주도력은 시들어 버린다.
풍부한 경험이 중요하다. 의욕적인 부모는 이렇게 생각할 것이다. ‘이번 주에는 미술관을 가고, 다음 주에는 박물관을 가고, 그다음 주에는 유적지에 데리고 가야지. 아 참! 다음 달 클래식 음악 공연에도 데리고 가야지.’ 때로는 따라가기 싫어하는 아이에게 이런 말도 할 것이다. “이게 다 누굴 위해서 하는 건데! 다 널 위해서야. 그러니 잔말 말고 따라오기나 해. 나 같은 부모가 어디 있다고? 너 키우는 데 돈이 얼마나 들어가는지 알아? 감사하다고 말하지는 못할망정!”
무작정 경험의 양을 늘리는 것은 능사가 아니다. 미국 디지털 마케팅 회사인 스톤템플에서는 인공지능 비서 5개를 비교했다. 구글의 ‘스마트폰용 구글 어시스턴트’와 ‘가정용 구글 어시스턴트’, 마이크로소프트의 ‘코타나’, 애플의 ‘시리’, 아마존의 ‘알렉사’다. 총 4,952개의 질문을 했고 질문 응답률과 답변의 정확도를 측정했다. 그 결과다.
· 응답률 : 구글(스마트폰) > 구글(홈) > 코타나 > 알렉사 > 시리
· 정확도 : 구글(스마트폰) > 코타나 > 구글(홈) > 알렉사 > 시리
두 항목 모두 스마트폰용 구글 어시스턴트가 1위다. 세계 최대의 검색엔진을 보유해 PC 사용자의 데이터를 블랙홀처럼 빨아들이는 구글로서는 당연한 결과다. 데이터가 많을수록 인공지능이 더 똑똑할 거라는 우리의 믿음과도 일치한다. 하지만 애플의 시리는 두 항목 모두 꼴찌다.
애플은 스마트폰 시대를 열었다. 인공지능 비서 서비스를 가장 먼저 시작했다. 아이폰 사용자는 파워 유저가 많기에 더 가치 있는 데이터도 더 많이 확보했을 것이다. 요즘은 PC보다 스마트폰으로 검색하는 사람이 많다. 구글은 제쳐놓더라도, 적어도 마이크로소프트나 아마존보다는 더 훌륭한 인공지능이 탄생해야 했다.
시리의 부진은 말한다. 인공지능의 성능이 데이터의 양에만 의존하지 않는다고. 인공지능 비서와 마찬가지로, 아이의 역량 또한 경험만 많이 주입한다고 향상되지 않는다. 구슬이 서 말이라도 꿰어야 보배다. 자기 주도적인 경험이 바탕이 되어야만 그 경험들을 고루 꿸 수 있다. 경험을 융합하는 깊이가 곧 아이 역량의 높이다.
글로는 전하기 힘들었던 이야기를 함께 나누고자 합니다.
강의 일정 : blog.naver.com/flship/221500213506