brunch

You can make anything
by writing

C.S.Lewis

by 백군 Apr 08. 2018

내 차 안의 AI비서 중국은 AI, 음성인식 경쟁 중

음성인식 기능 그리고 인공지능(AI) 기능

내 자동차 안에 AI 기능



  요즘 젊은 세대들이라면 카카오 미니 또는 기가 지니 등과 같은 AI스피커를 본 적 있거나, 사용을 해본 적이 있을 것이다. 조금 과장을 보탠다면, 아이언맨 시리즈를 보았던 사람들은 한 번쯤 자비스라는 프로그램을 사용하고 싶었을지도 모른다. 아직까지 자비스와 같은 기능을 가진 AI는 없겠지만, 지금 추세대로라면 언젠가는 1가구 1 자비스가 보편화되어있을지도 모른다.


  개인적으로 AI스피커가 어떤지 궁금하여, 카카오 미니를 구매해서 사용하고 있다. 물론 핸드폰도 갤럭시 시리즈를 이용하고 있어서 빅스비 기능도 같이 사용하면서 AI에 대해서 조금씩 체험하고 있다. 카카오 미니를 지난 몇 주 동안 사용을 해보니 아직까지는 정말 디테일한 범위까지 기능을 구현하지는 못하지만, 원하는 노래 듣기나 날씨 묻기 등 검색하려면 막상 귀찮은 항목들을 편리하게 사용할 수 있게 해 준다. 대화를 계속 주고받는 시스템은 아니고, 일방적인 질문은 대부분 알아듣는다. "헤이 카카오 재미있는 노래 틀어줘"라거나 집을 나서기 전에 "헤이 카카오 오늘 날씨는 어때?"라고 질문을 하거나 간단한 것들을 말로 하면 되는 것 자체로는 좋은 기능이라고 생각이 된다.


  이러한 기능들이 자동차 안에서 접목이 되면, 운전을 하면서 각종 기능들을 구동할 수 있다는 점에서 많이 편리해진다. 실제로 중국의 많은 브랜드들은 "선루프를 열어줘"라던가 "에어컨을 켜줘", "음악을 틀어줘" 등과 같은 단순한 명령어 인식이 가능하다. 심지어 중국의 사투리조차도 알아듣는다고 하니 기술이 얼마나 빨리 발전했는가 생각해 보게 되는 대목이라고 생각이 된다. 이러한 기능들을 보았을 때, 개인적으로는 음성 활용도 부분에 있어서는 자동차 안에 음성인식 시스템보다는 집에 있는 AI 스피커가 더 많은 기능들을 소화할 수 있지 않을까? 생각을 하곤 한다. 물론 향후에는 자동차와 집이 iot 형태로 연결이 될 수밖에 없다. 매년 미국의 라스베이거스에서 열리는 CES(국제전자제품박람회) 에서 자동차와 관련된 기술들을 보면, 각 브랜드별로 IT업체 또는 통신업체들과 협업을 하여 새로운 기술들을 선보이고 있다.

 

  우리나라의 삼성전자 같은 경우에도 2018년 자사의 인공지능(AI)과 음성인식, 디스플레이 기술과 하만의 전장부품 기술을 집약시킨 "디지털 콕핏"을 FCA의 마세라티 차량에 탑재하여 공개를 한 바 있다. 파나 소식 또한 홍채인식 기술로 자동차가 열리고, 나에게 맞는 조명 그리고 공기청정 기능을 자동으로 켜주는 기술들을 보여준 바 있다. AI와 음성인식에 대한 기술은 비단 중국뿐만 아니라 글로벌적으로 많은 자동차 브랜드, 제조업, 통신업체, IT업체 등이 앞다투어서 개발을 하고 있는 상황이다. 점점 자동차도 운전자 중심으로 엔터테인먼트 부분을 강조하여 성장을 할 수밖에 없게 된 것이다. 단순히 자동차 안의 AI 기술뿐만 아니라 현재 IT기업들은 서로 막대한 자금을 AI에 투자하고 있고, 인재들을 영입하기 위해서 노력하고 있다. 삼성전자의 이재용 부회장이 출소를 한 후 프랑스 또는 캐나다로 AI 관련 출장을 가는 것도 이러한 모습을 잘 보여주는 예라고 생각이 된다.


  그렇다면 중국의 시장 같은 경우에는 어떻게 성장을 하고 있을까? 보통 음성인식 기술이라고 하면 상대적으로 중국 소비자들에게 친숙한 브랜드는 상하이자동차 그리고 지리자동차의 음성인식 기능들이다. 이런 브랜드들 그리고 대표적인 음성인식 기능을 보유한 회사를 보면 뉘앙스(NUANCE), IFLYTEK(科大讯飞), 알리바바(Aligenie) 등을 찾아볼 수 있다.



1. 아이플라이텍 IFLYTEK(科大讯飞) - http://www.iflytek.com/  


  

 아이플라이텍(IFLYTEK)은 중국 최대 음성인식 기술을 제공하는 회사로, 1999년 12월 30일 처음 설립이 되었고, 2014년 4월 18일에 이르러서 <科大讯飞股份有限公司>로 이름을 바꾸었다. 또한 중국의 유일한 음성기술 산업화의 "국가 863 계획 성과 산업화 기지" 이기도 하다. 중국은 차세대 인공지능 생태계 개발을 위해서 알리바바, 바이두, 텐센트와 같은 3대 IT 기업과 더불어 아이 플라이 텍을 을 협력사로 지정을 하였다.


※ 국가 고급 기술 연구 발전계획(863 계획)은 1986년 3월 처음 실시된 중국 국가사업으로 중화인민공화국의 고급 기술발전계획이다. 정부가 주도적으로 해서 제한적인 영역의 연구를 목표로 하는 기초연구의 국가성 계획이다. 2016년 2월에 과기부(科技部)에서 발표를 한 국가 중점 연구 발전계획(国家重点研发计划)에 대한 연구 지침 또한 국가 863 계획의 연장선 상으로 불리기도 한다.


  이 외에도 다양한 역할을 차지하는 기업으로 중국 내에서 없어서는 안 될 기업으로 자리를 잡고 있다. 바이두 백과사전에 따르면 아이플라이텍은 중국어 음성인식 시장에서 70% 이상의 시장 점유율을 갖고 있다고 한다. 지리자동차의 자동차에 들어가는 음성인식 기능 또는 샤오미의 핸드폰에 들어가는 음성기술 모두 아이플라이텍의 기술이라고 볼 수 있다. 실제로 중국의 사투리들도 인식을 할 수 있고, 중국어 특유의 성조들 조차도 인식이 가능하기 때문에 중국 내부에서는 상당히 우위를 가진 음성인식 기술 회사라고 할 수 있다. 이러한 기술력을 바탕으로 아이플라이텍은 많은 국가의 4차 산업혁명에 지원들을 받아내고 있다.


# 아이플라이텍 선정 항목들(2018년 기준)

국가 스마트 음성인식 기술 산업화 기지 (国家智能语音高新技术产业化基地)
음성 및 음성인식 처리 국가 공정 실험실(语音及语言信息处理国家工程实验室)
국가 규획 구성 중점 소프트웨어 기업(国家规划布局内重点软件企业)
국가혁신형 기업(国家创新型企业)
국가급기업기술센터(国家级企业技术中心)
국가 고급 기술 산업화 시범 공정(国家高技术产业化示范工程)
중국 음성인식 산업연맹 이사장 기관 (中国语音产业联盟理事长单位)



2. Aligenie - https://open.bot.tmall.com/


  Aligenie는 알리바바의 인공지능 실험실에서 2017년 발표한 플랫폼이다. 영문명으로 하면 Aligenie Voice open platform으로, 오픈 플랫폼 형식으로 운영이 된다.  자연언어 인식, 오픈 플랫폼, 딥러닝 등 AI 기술들을 활용하고 있다. 오픈 플랫폼에는 개인 개발자(Personal Kit), 응용 개발자(Developer Kit), 스마트홈 개발상(Home Control Kit), 하드웨어 생산(Manufactory Kit) 등 주요 4가지 개발자들이 참여하는 음성인식 플랫폼이다. 이미 음성인식 부분에서는 아이플라이텍이 70%가 넘는 시장점유율을 갖고 있는 상황에서, 플랫폼을 구축하여 AI를 대응하려고 하는 것 같다.


  2018년 3월 알리바바 인공지능 실험실은 춘계 발표회에서 Aligenie 2.0에 대해서 발표를 하였다. 그림 인식, 안면인식, 물체 검사 등. 다양한 기능이 구현되고 음성인식, 그림 인식, 터치 등 다양한 융합을 통해서 기계와 사람의 교류가 사람과 사람의 교류처럼 보일 수 있도록 하려고 하였다. 동시에 향후 명령어를 인식하는 것뿐만 아니라, 감정을 이해할 수 있도록 만들어질 것이라고 한다. 과연 AI의 음성인식 능력과, 안면인식 능력 등을 통해서 감정까지 분석을 해낼 수 있을지는 조금 더 지켜봐야 할 것 같다.  이미 상하이자동차와 다양한 협력을 하고 있는 알리바바의 AI 기술은 점차 자동차 시장 안에 깊숙이 들어올 것이라는 것도 먼 미래는 아니라고 생각이 된다.




3. Nuance - https://www.nuance.com/zh-cn



  아이플라이텍이 중국에서 점유율이 70% 이상이 된다면, NUANCE는 세계 1위 기업으로 글로벌에서 60% 정도의 점유율을 갖고 있는 음성인식 관련 회사이다. 2005년 Scansoft와 Nuance의 합병 이후 NUANCE Communication이라는 이름으로 회사를 운영해 왔다. 70여 개의 언어들을 지원하고 있으며, 삼성, LG, 노키아, 하이얼 등의 기업들에 사용되고 있다고 한다. 영어 인식률의 경우에는 99%에 달할 정도로 상당한 음성인식 기술들을 보유하고 있는 기업이다.


  뉘앙스 커뮤니케이션이라고 하면 낯설다고 생각할 수 있겠는데, 음성인식은 사람의 말을 글자로 바꾸는 과정을 말하면서, 쉽게 말하자면 애플의 아이폰 음성인식 기술인 시리(SIRI) 또는 구글의 음성인식 기능이 바로 뉘앙스의 기술이다. 또한 자동차 분야에서는 CES 2018년 메르세데스 벤츠가 공개하였던 인포테인먼트 시스템 MBUX에 뉘앙스의 음성인식 기능이 들어가 있다. 뉘앙스 커뮤니케이션은 세계 1위 자리를 지켜내기 위해서 다양한 투자를 지속하면서 점유율을 높여가려고 하고 있다.


  처음 삼성 갤럭시의 빅스비 기능을 사용할 때는 막상 완성적이지 않은 기능을 왜 써야 하는지 모르다가도 자연스럽게 전화번호를 검색할 때 손으로 검색을 하는 것이 아니라 빅스비에게 이야기를 하는 모습, 음악을 들을 때 카카오미니에게 이야기 하고 있는 모습들을 보면서 AI기능은 순식간에 우리의 주변으로 다가올 수 있다고 생각된다.

 


출처 : 언론 기사 및 바이두 백과사전

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari