인류에 한걸음 더 가까이, AI
"자비스!"
영화 <아이언맨>의 주인공인 토니 스타크가 '자비스(Jarvis)'를 연신 불러대며 마치 곁에 있는 실제 비서처럼 대하고 여러 가지 일을 지시한다. 자비스는 토니 스타크가 지시한 업무를 능숙하게 처리한다. 가끔은 토니 스타크의 썰렁한 농담도 되받아친다.
음성을 인식하고 업무를 처리하는 자비스는 전형적인 인공지능 솔루션을 탑재한 고성능 AI다. 토니 스타크가 살고 있는 말리부의 대저택 곳곳은 물론이고 외부에서도 24시간 자비스와 소통이 가능하다. '영화니까 가능한 일이겠지?'라고 생각할 수도 있겠지만 인공지능은 생각보다 더욱 가까이 와있다.
우리의 삶 주변에서 만나보는 AI
한 가지 사례로 미국의 45대 대통령 선거를 생각해보자.
잘 알다시피 지난해 11월 8일 있었던 미국 대선에서 공화당의 도널드 트럼프가 45대 미국 대통령으로 당선되었다. 여론조사, 언론사, 도박사 모두 힐러리 클린턴의 당선을 예상했다. 인공지능인 모그는 제닉 AI(Genic AI)가 개발한 로봇으로 SNS에서 약 2천만 건에 달하는 DB를 수집하고 분석해 도널드 트럼프의 당선을 예측했다. 방법은 우리가 무심코 지나친 SNS의 댓글들이나 사람들의 숨겨진 반응들을 한꺼번에 찾아냈다는 점이다. 사실 모그의 예상은 이번뿐이 아니었다. 2004년에 개발되어 올해로 13살이 된 이 로봇은 부시 전 대통령 이후로 모두 4번이나 대선 결과를 정확하게 맞췄다.
모스의 개발자인 산지브 라이(Sanjiv Rai)는 이렇게 말했다.
"편견 없이 설계된 인공지능은 절대로 함정에 빠지지 않는다. 이번 대선은 인공지능 영역의 새로운 혁명이다"
결국 우리가 흔히 봐왔던 여론조사는 한방 먹었고 여론조사가 자랑하는 신뢰도 측면에서도 빈틈을 보이게 되었다.
제닉 AI는 인도계 스타트업으로 신생 벤처기업이다. 모그라는 이름은 <정글북>이라는 동화 속 주인공 모글리(Mowgli)에서 따온 이름이다.
2016년 3월에는 이세돌 9단과 구글 딥마인드(Deepmind)가 개발한 AI, 알파고(AlphaGo)와의 세기의 대결이 있었다. 최종 전적은 4승 1패. 알파고는 예상을 깨고 현존하는 최고의 인공지능으로 등극했다. 프로 명예 단증까지 수여받은 알파고는 올해 5월 바둑 세계 랭킹 1위인 중국의 커제 9단과 한번 더 승부를 펼쳐 전세계가 주목했다. 결과는 알파고의 승리. 우리는 다시 한번 인공지능의 강력함을 두 눈으로 확인할 수 있게 되었다.
구글 딥마인드는 알파고의 알고리즘을 활용하여 헬스케어 분야와 신약개발, 기후변화 예측, 무인 자율주행차 등 사회 전분야로 확대한다고 밝혔다.
음성으로 경험하는 AI, 스피커의 경쟁!
'AI'는 4차 산업혁명에서도, 그리고 지금 업계에서도 가장 핫한 키워드다.
우리나라 대표 통신사인 SK텔레콤을 비롯해, 네이버와 카카오, 구글 등 국내외 IT기업 역시 AI 시장에 뛰어들어 사용자들을 위한 서비스에 박차를 가하고 있는 상태다.
인공지능이 탑재된 스피커의 경우, 사람과 대화를 하면서 업무를 처리해주는 개인비서의 역할을 하고 있다. 애플사의 '시리(Siri)'를 생각하면 이해가 빠를 것이다. 토니 스타크가 자비스를 부르듯, 아이폰의 '시리'를 불러내 휴대폰의 기능을 실행하도록 지시하는 행위. 우리의 목소리를 명령어로 인식해 알아서 실행해주는 서비스가 바로 음성인식 AI다.
SK텔레콤으로부터 시작한 국내 시장의 AI 스피커는 AI 업계 선점을 위한 선전포고였고 다른 업체들 역시 이 시장에서 우위를 다투기 위해 경쟁적으로 AI스피커를 제작, 개발 중이다.
SK텔레콤은 음성인식 스피커인 누구(Nugu)를 지난해 9월 국내 최초로 출시했다. 이 모델은 출시 7개월 만에 10만 대를 돌파했고 2차 모델 양산을 준비하고 있다.
SK텔레콤의 누구가 처음 세상에 나왔을 땐 다소 제한적인 서비스만 존재했다. 멜론을 통한 음악 감상이 가장 많이 쓰인 서비스였고 휴대폰과 연동하여 이불 속에 감춰진 폰을 찾는다던가, 폰에 기록해둔 일정을 읽어준다거나 하는 기능으로 쓰였다. 여기에 11번가나 Btv, T맵 등 SK의 이름표가 붙은 계열사들의 다양한 서비스도 이용할 수 있도록 했으며 피자나 치킨 배달 등 생활 편의 기능도 추가했다. 더불어 YTN이 제공하는 뉴스도 들을 수 있다.
SK텔레콤과 '통신사'로서 경쟁하고 있는 KT 역시 마찬가지. KT는 SK텔레콤보다 다소 늦긴 했지만 올해 1월 AI스피커와 인터넷 TV를 한꺼번에 결합한 셋톱박스 '기가 지니(Giga Ginie)'를 출시했다. KT의 기가 지니는 5월에 5만 대 판매량을 기록했다. KT 역시 올레 TV와 음악, 교통, 생활 정보를 제공하며 여기에 카메라까지 탑재하여 홈 CCTV로 활용이 가능해졌다. 물론 홈캠 서비스는 별도로 가입을 해야 한다.
더불어 KT는 오디오 브랜드인 하만카돈(Harman Kardon)과 콜라보하여 고품질의 사운드를 들을 수 있도록 개발되었다.
미국의 IT기업인 아마존(Amazon)의 경우는 우리나라보다 조금 더 빠른 편이다. 2014년 전 세계 최초로 음성인식이 가능한 스피커 '에코(Echo)'를 출시했는데 여기엔 아마존이 탄생시킨 AI '알렉사(Alexa)'가 탑재되어 있다. 아마존의 AI스피커 에코는 500만 대 이상 팔린 베스트셀러다.
우선 여기에 탑재된 알렉사를 짚고 넘어갈 필요가 있을 것 같다. 알렉사의 기본적인 태생은 전자상거래를 위한 AI 비서였다. 아마존은 전자상거래 업체인데 인터넷에 익숙하지 않은 사람들이 음성만을 이용해 필요한 물건을 손에 쥘 수 있도록 도움을 주는 역할을 바로 이 알렉사가 해낸 것. LG전자나 폭스바겐 등 다양한 업체들이 알렉사를 눈여겨보게 되었고 냉장고나 차량에 음성비서로서 알렉사를 탑재하기에 이르렀다.
중국의 화웨이(Huawei)는 자사의 스마트폰에도 이 기능을 넣었는데 참 신기한 것은 화웨이가 출시한 메이트 9(Mate 9)도 기본적인 운영체제는 바로 구글의 안드로이드(Android)다. 구글은 구글 홈이라는 AI 비서 서비스가 있음에도 화웨이는 알렉사를 선택했다.
알렉사는 세계 최대의 전자쇼인 2017년 CES에서 다른 업체가 생산한 제품에 탑재되어 보다 강력한 모습으로 존재감을 과시했다. 아마존의 알렉사는 자신들의 효자 노릇을 톡톡히 하게 될 기특한 서비스로 거듭나게 되었다. 글로벌 투자은행인 RBC 캐피털 마켓의(RBC Capital Markets) 보고서는 올해부터 3년 뒤인 2020년까지 알렉사는 무려 10조 원 이상의 이익을 창출할 것이라 예상하기도 했다.
미국의 디지털 마케팅 전문 조사 업체 이마케터(eMarketer)에서는 5월 말 기준으로 미국 AI 스피커 시장은 에코가 점유율 70.6%로 1위, 구글 홈이 23.8%로 2위라고 밝힌 바 있다.
구글의 AI스피커 구글 홈(Google Home)은 지난해 10월 출시한 모델이다. 구글의 AI 시스템인 '구글 어시스턴트(Google Assistant)'가 탑재된 스피커로 사람의 음성을 인식해 음악, 일정, 메시지 전송, 와이파이, 조명 등 기본적인 기능을 수행한다. 구글 어시스턴트는 2016년 5월 공개된 인공지능 비서 시스템이다.
AI 서비스에는 애플 또한 빠질 수 영역일 것이다. 애플은 자사의 AI 플랫폼인 '시리(Siri)'를 탑재한 '홈팟(Homepod)'을 선보인 바 있다.
애플의 시리는 자연어 처리를 기반으로 사용자가 질문을 하면 답변을 하고 웹 검색을 수행하는 iOS용 소프트웨어로 개발된 AI다. 본래 시리는 인공지능 프로젝트를 진행한 스타트업 SRI 인터내셔널(SRI International)이 개발한 소프트웨어였는데 2010년 4월 애플이 인수를 하게 되고 2011년 아이폰 4S가 등장하면서 세상에 알려지게 되었다. 시리의 가장 큰 장점은 언어 지원이다. 전 세계적으로 이렇게 다국어 능력이 뛰어난 플랫폼도 그리고 사람도 없으리라고 본다. 시리는 21개의 언어를 구사할 수 있는 능력을 가졌다.
애플이 내놓은 홈팟의 실체는 이미 공개되었으나 실제 출시는 2017년 말 예정인 상태다. 아마존의 에코나 구글 홈과는 달리 시리가 지원하는 음성인식 기술보다 오디오 시스템에 집중하여 퀄리티 높은 품질을 지원할 것이라고 한다. 애플의 A8 칩이 장착되고 우퍼가 탑재되어 있으며 영어, 중국어 등 약 6개 국어가 지원될 예정이다. 아마존 에코나 구글 홈이 약 180달러와 129달러인 반면 애플의 홈팟은 349달러라고 하니 가격만으로 따지면 2배 수준이다. 스피커가 없는 집에서 스피커에 대한 구매욕이 있다면 충분히 '지를'만 한 가치가 있다고 하니 눈여겨보면 좋을 것 같다.
KT의 기가 지니가 선택한 오디오 하만카돈은 최근 삼성전자가 인수한 오디오 업체이다. 하만카돈 역시 마이크로소프트의 AI를 선택해 AI 경쟁구도 안에 뛰어들었다. 마이크로소프트의 인공지능 코타나(Cortana)는 2014년 4월 발표된 AI 개인비서로서 마이크로소프트의 윈도폰용으로 제작된 것이며 게임 시리즈 <헤일로(Halo)>에 등장한 인물의 이름을 따왔다. 게임 속에서 은하계를 구해낸 영웅이자 헤일로의 히로인으로 알려져 있다. 하만카돈과 마이크로소프트가 손을 잡고 출시하게 될 AI 스피커의 명칭은 인보크(Invoke)다.
이처럼 수많은 가전업체와 통신업체들이 AI 스피커 출시에 열을 올리고 있다. 하지만 명확한 수익 모델이 없어 투자만 존재할 뿐 BEP(손익분기점)를 따질 수 있을만한 환경은 아니기에 이러한 모양새는 온전히 시장 선점을 위한 경쟁이라고 볼 수 있다.
사용하는 사람들의 비중이 낮은 시점에서 음성을 인식하고 실행하는 AI의 두뇌는 반드시 고도화가 필요하다. 일부 업체들이 AI 스피커와 AI의 주축을 이루는 모듈 개발을 일부러 늦추는 케이스도 여기에 포함된다. 후발주자일수록 보다 많은 것을 준비하고 경험해야 피 튀기는 전쟁터에서 경쟁력을 키울 수 있을 테니까.
포털업계의 AI
우리나라의 포털 업체인 네이버와 카카오 모두 AI 서비스를 위해 모듈 개발과 서비스 고도화에 착수하여 현재 진행형이다. 네이버의 경우, 클로바가 이미 세상에 나와 신고식을 했다. 지난 5월 출시된 클로바(Clova)는 별도의 애플리케이션을 탑재해야 실행이 가능하다. '나 배고파'라고 말하면 근처 음식점을 지도와 함께 보여준다. 원하는 음악을 재생하는 것은 물론이고 외국어 번역도 해준다. 물론 아직까진 베타 서비스라 정식 서비스를 위해 다듬어야 할 부분들이 분명 존재한다. 클로바는 '프로젝트 J'에서 출발한, 키워드 그대로 '프로젝트'였다. 네이버랩스와 라인의 AI연구소의 공동작업에서 기원하는 프로젝트 J는 네이버의 음성인식 AI 플랫폼인 ‘아미카(Amica)’의 업그레이드 버전과 같은 것이다. 아미카는 네이버가 개발하고 있는 현재 진행형 인공지능 대화 시스템으로 2016년 10월 24일 공개된 바 있다. 인간의 신경망을 닮은 기계학습 기술 즉 딥러닝과 음성인식 기술이 종합된 시스템으로 목소리와 텍스트로 컴퓨터와 커뮤니케이션한다.
라인 주식회사에서 내놓은 AI스피커 '웨이브'에도 클로바가 탑재되었다. 웨이브는 일본에서 이미 예약이 시작되었다. 한국에서는 계획이 없다고 말했다. 이는 뜨거운 한국 시장보다 그나마 조금 나은 일본에서 시장을 선점하기 위한 것으로 보인다. 국내 출시를 미루는 것은 그만큼 담아야 할 것들이 많기 때문인데 이 또한 경쟁력을 키우기 위함이다. 라인은 웨이브의 기본 기능에 디스플레이 화면을 탑재한 '페이스(Face)'도 출시한다고 밝혔다. 스피커를 통해 나오는 음성에 화면까지 더했으니 어쩌면 더욱 활용도가 높아질 수도 있겠다.
카카오는 인공지능 분야를 위해 카카오브레인이라는 자회사까지 설립했다. 네이버의 네이버랩스와 유사하다고 보면 쉽게 이해가 될 것이다. 카카오브레인에는 200억 원 수준의 자본이 투입되었다. 카카오를 키워낸 김범수 의장이 직접 컨트롤하는 수장의 역할을 하고 있다. 그만큼 AI 시장에 대한 욕심이 남다른 모양이다. 카카오 AI는 국민 메신저 앱인 카카오톡, 포털 다음 등과 연동하여 사용할 수 있도록 만들어지고 있다.
카카오는 카카오 미니(Kakao Mini)라는 스피커를 저렴한 가격에 만나볼 수 있도록 출시할 계획을 갖고 있다. 카카오 AI는 카카오 스피커를 '일부'라고 말한다. 일종의 소프트웨어 개발도구인 SDK(Software Development Kit)를 만들어 카카오의 여러 서비스에 접목시켜 보다 많은 사용자들이 이용할 수 있도록 개발 중이다.
이에 앞서, 카카오의 인공지능은 '카카오아이(Kakao i)'라는 기술로 현대.기아차와 손을 잡았다. 음성인식과 자연어 처리 기술 등 멀티미디어 처리 기술이 함축된 기술력으로 오는 9월에 출시되는 제네시스 G70에 적용된다. 스티어링 휠, 즉 핸들에 탑재된 음성인식 버튼을 통해 길안내나 주변 맛집, 정비소 등을 검색할 수 있도록 구축했다. 얼마나 유용할지는 지켜봐야 할 것 같지만 포털업계의 AI를 외부 서비스에 처음 적용한 케이스가 되었으니 커넥티드 카의 상용화와 실제 체험도 머지 않은 이야기가 되었다.
중국의 IT 기업인 바이두(Baidu)는 자체적으로 인공지능 로봇인 샤오두(Xiaodu)를 개발했다. 샤오두는 인공지능을 탑재한 로봇으로 얼굴 식별과 이미지 검색, 음성 식별까지 가능한 중국 기술력의 산물이다. 올해 초 중국 예능프로그램에 깜짝 등장해 인간보다 월등한 능력을 선보여 화제가 되기도 했다. 중국은 구글의 알파고를 뛰어넘을 각오와 인력, 예산 모두 충분해 보인다. AI 분야에서 출원한 특허로만 보면 미국에 이어 세계 2위 자리를 차지하고 있다.
이처럼 인공지능은 사람들과 어색하지 않을 정도로 대화가 가능하고 우리가 원하는 것을 읽어주거나 실행해준다. 심지어 어제 있었던 야구경기에 대한 기사도 쓰고 암 환자를 위해 어떠한 치료가 가능한지 추천도 해준다.
생각해보면 우리가 소파에 앉아 굳이 움직이지 않아도 사용할 수 있도록 굉장히 편리한 점을 제공한다. 또 다른 측면에서는 우려의 목소리도 존재한다. 과하게 말하면, 인간이니까 할 수 있었던 영역에 인공지능이나 로봇이 '침범'한다는 의미로도 해석해볼 수 있겠다. 결과적으로 4차 산업혁명에서 우려했던 일자리에 대한 고민이라던지, 인간이 만들어낸 인공지능을 인간이 이길 수 없다는 아이러니는 '인간은 만물의 영장'이라는 고유한 의미를 퇴색시키는 듯한 느낌마저 든다.
"말도 안되는 소리!", 쓸데없는 걱정이라 할 만큼 완벽한 시기상조겠지만, AI가 안착하는 그 언젠가 영화 <터미네이터>나 <엑스 마키나>와 같은 디스토피아는 없길 바란다.
그저 우리 삶에 무궁무진한 편리함을 부여하는 親 AI가 되어주길.
※ 위키피디아, 구글 딥마인드, SK텔레콤, 네이버 클로바, 카카오, 이마케터, RBC캐피털마켓 등의 자료를 참고했습니다.
※ 이 글은 월간 <디아이투데이>에 실릴 예정입니다.