brunch

You can make anything
by writing

C.S.Lewis

by delight Dec 12. 2017

바이두 창업자 리옌홍, 차세대 인공지능의 조건을 말하다

[북앤톡]지능혁명에 담긴 인공지능 기술의 발전 방향

딥러닝이 인공지능을 대표하는 기술로 부상했지만 현재 딥러닝 기술의 한계를 지적하는 목소리도 적지 않다. 걸림돌을 치우기위한 연구 개발도 세계 각국에서 활발하게 이뤄지고 있다.


바이두 창업자인 리옌홍이 쓴 책 지능혁명에 따르면 차세대 인공지능 개발의 키워드는 크게 2가지로 요약된다.

지금의 딥러닝은 결과가 나오게된 이유를 파악할 수 없는 블랙박스라는 것이 문제로 꼽힌다. 엔지니어 출신인 리옌홍에 따르면 이걸 푸는 것이 차세대 인공지능이 갖춰야할 첫번째 조건이다.


"기계의 진화와 고도화는 대자연보다 억배 더 빠르게 이루어진다. 이러한 생성적 적대 속에서 기계가 습득한 논리는 인류의 이해 범위를 훨씬 초월하여 블랙박스가 될 수 있다. 블랙박스를 추구할 것인가 아니면 화이트박스를 추구할 것인가. 어떻게 블랙박스에 따른 리스크를 피할 것인가하는 문제는 인류에 대한 일종의 도전으로 볼 수 있다."


딥러닝의 블랙박스화는 해결할 수 있는 문제일까? 책에 따르면 중국에서도 방향은 찾은 것 같다. 말이 좀 어렵지만 책에 있는 관련 내용을그대로 공유해 본다.


"남경대학의 저명한 기계학습 전문가 저우즈화 교수는 2017년 2월 28일 발표한 논문에서 공동 저자 펑지와 같이 창조적인 알고리즘은 딥포레스트(Deep Forest) 알고리즘을 제출했다. 딥러닝이 신경망의 층수를 강조하는 것과 달리 이 알고리즘은 전통적인 결정 트리 알고리즘을 새롭게 활용했으며, 트리의 층수를 강조했다. 다층 결정 트리의 통합을 통해 포레스트를 형성하였으며, 정교로운 알고리즘 설정을 통해 데이터와 연산 규모가 모두 작은 상황에서 이미지, 음성, 감정 인식 등에서 딥 신경망에 못지 않은 성과를 이루었다. 이러한 새로운 방법은 파라미터 설정에 예민하지 않고 논리가 뚜렷한 트리 방법에 기반했기 때문에 딥 신경망보다 더 쉽게 이론 분석을 할 수 있다. 인류가 이해하기 어려워하는 기계의 구체적인 논리의 블랙박스 문제를 피할 수 있다."

차세대 딥러닝이 갖춰야할 두번째 조건은 대규모 데이터가 없어도 딥러닝이 효과를 낼 수 있도록 하는 것이다.


현재 대다수 신경망의 훈련은 태그화된 데이터, 즉 지도학습에 의존하고 있다. 데이터에 대한 태그화는 업무량이 상당히 막중하다. 보도에 따르면 구글의 오픈소스 사진 데이터베이스에 900만장의 사진이 포함되어 있고, 유튜브-8M에 800만달락의 태그화된 동영상이 있으며, 가장 최초의 사진 데이터베이스인 이미지넷에 현재 1400만장의 분류된 사진이 포함되어 있는 것으로 알려졌다. 이러한 태그화된 데이터는 대부분 아마존 아웃소싱 플랫폼인 아마존 매커니컬 터크의 5만명 직원이 2년이란 시간에 걸쳐 완성해낸 것이다. 미래 인공지능의 발전 방향은 기계가 태그화된 데이터가 부족한 상황에서도 업무를 처리할 수 있는 것이다."


이와 관련해서도 해법이 속속 등장하고 있다.


2016년 마이크로소프트 연구원의 친타오 박사 등 전문가는 2016년 NIPS(신경정보처리시스템대회)에 제출한 논문에서 새로운 기계학습 모델인 듀얼 네트워크를 제시했다. 구체적인 내용은 다음과 같다.
많은 인공지능의 활용은 이원성 임무와 관련된다. 가령 중영 번역과 영중 번역, 음성 처리 중의 음성 인식과 음성 합성, 사진 인식 중의 사진에 기반하여 생성된 글과 글에 기반하여 생성된 사진, 응답 시스템 중 문제 응답과 문제 생성, 검색엔진 중의 검색어를 위해 찾은 사이트와 사이트를 생성한 핵심어 등은 이원성 관계를 구성했다. 이러한 관계를 가진 인공지능은 폐쇄루프를 형성하여 태그화되지 않은 데이터속에서도 학습할 수 있게 되었다. 이중 학습의 가장 핵심은 기존 원시적인 임무 모델에 대해 이원성을 가진 모델이 피드백을 제공하고 이원성을 가진 모델에 대해 원시적인 임무 모델도 피드백을 제공할 수 있는 것이다. 즉 이러한 이원성 관계를 구성한 모델은 서로 피드백을 제공하고 서로 학습하며 서로 능력을 키운다. 듀얼 네트워크는 정교로운 전략을 통해 태그화된 데이터에 대한 의존을 대대적으로 감소했는데, 그중에서 진화의 철학을 통찰할 수 있다. 진화는 일종의 자기 응답과 자기 순환 과정으로 A에서 B로, B에서 A로 서로 뚜렷하지 않은 미러링 관계를 형성하여 각자 절반의 노하우를 파악하였으며, 중재가 없지만 서로 추측, 참고를 통해 전진한다

지능혁명을 보면 인공지능에 대한 중국의 야심이 정말로 대단하다는 것을 체감할 수 있다.


직역투 번역이 많아 읽기가 만만치는 않지만 중국을 대표하는 인터넷 업체인 바이두가 인공지능이 얼마나 공격적으로 투자하고 있는지, 중국의 인공지능 수준은 어떤지, 인공지능이 관련해 중국이 가진 잠재력은 어느 정도인지를 비교적 자세하게 살펴볼 수 있다.


중국 인공지능 파워가 조만간 미국을 능가할 수 있다는 관측도 적지 않다. 데이터와 인프라, 정부 정책 측면에서도 미국에 뒤질게 없다는 것이다. 중국의 인공지능 역량을 집중적으로 조명한 MIT테크놀로지리뷰는 세계가 중국의 인공지능을 배워야할 날이 올 수 있다고 전망했을 정도다.


얼마전 중국 업체 텐센트를 접촉한 국내 모 인터넷 서비스 업체 임원도 텐센트의 인공지능을 보고 입이 쩔 벌어졌다고 한 것을 보면 중국의 인공지능 수준이 높기는 높은 모양이다.


궁금한 것은 바이두나 텐센트와 같은 중국 기업들의 인공지능 기술이 중국을 넘어 미국이나 유럽에서도 먹혀들 수 있을까하는 것이다. 중국을 호령한다고 해서 이들 기업이 구글이나 페이스북처럼 글로벌 인공지능 플랫폼으로 진화하기는 아직은 만만치 않아 보인다. 개인적인 생각은 그렇다. 고정관념과 선입견 때문인지는 모르겠지만 개인적인 생각은 그렇다.

작가의 이전글 격변의 시대, 선택과집중의 환상을 버려라
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari