brunch

You can make anything
by writing

C.S.Lewis

by 유재석 Nov 05. 2017

글로벌 1위 자연어 분석 中기업의 야심

AI 인재 플랫폼 만드는 커다쉰페이

커다쉰페이(IFlytek; 科大讯飞)는 지난 1999년 안후이성 허페이(현재 중국 빅데이터의 도시로 선정)에서 설립된 중국 자연어 분석 기술 전문 기업입니다. 이후 9년 뒤 선전증권거래소에 상장했습니다. 아주경제의 보도​에 따르면 이 회사는 중국 증시에서 음성인식과 인공지능(AI) 분야의 유일한 상장사입니다.


2010년 세계 최초로 만든 ‘쉰페이 음성클라우드’를 기반으로 쉰페이 음성입력기 ‘쉰페이팅젠’, 음성인식 동시통역기 ‘샤오이(曉譯) 통역기’ 등을 잇달아 선보인 커다쉰페이는 오늘날 중국어 음성인식 시장에서 70%의 점유율을 차지하며 기술을 선도하고 있다.  중국 화웨이, 샤오미, 오포, 비보 등 중국 스마트폰 입력기에는 모두 쉰페이 음성인식 기술이 사용되는 등 1만여개 업체와 협력하고 있다. 커다쉰페이는 금융·의료·교육·교통·전력·스마트도시 등 각 분야로 AI 음성인식 기술 응용범위를 넓혀갔다. - 아주경제 보도


커다쉰페이는 자사가 보유한 자연어 분석, 음성 식별에 기반한 AI 관련 기술을 계속해서 오픈했습니다. 제휴 기업과 기술 인력을 확보하려는 목적에서죠. 과거엔 ‘인공지능 플러스’라는 플랫폼을 통해 온, 오프라인 기업들이 무료로 커다쉰페이의 언어 분석 기술을 활용하고자 했죠.

그 결과, 음성인식 분야에서 중국 및 글로벌 시장에서 최고의 위치에 오른 것은 물론, 생활 각 영역으로 파고들기에 이르렀습니다.


지난 3월 베이징어언대에서 만난 저우지아펑 커다쉰페이 베이징 총괄은 “현재 벤츠, BMW, 아우디, 토요타 등 글로벌 차량 기업들이 커다쉰페이의 음성 식별 시스템을 적용한 상황”이라며 “2년 전 음성인식 기술 정확도 테스트에서 타 서비스들에 비해 정확도가 10% 이상 높다는 평가를 받았다”고 말했습니다.

커다쉰페이의 AI 생태계 구축은 현재진행형입니다. 10월 24일, 커다쉰페이 총재 후위(胡郁, 사진)는 ‘1024 계획’을 발표했는데요.


왜 1024이느냐 질문에 대해 커다쉰페이 측은 “2의 10승을 의미하는 동시에 개발자들의 자주 사용하는 가장 기본 단위로 1024Kb는 1M이고, 1024M는 1G”라며 “개발자의 날이므로 이들에게 친숙한 숫자를 사용하고 싶었다”고 설명했습니다.


‘1024 계획’은 AI 생태계, 교육, 공익 영역 등, 세 영역을 겨냥했습니다. 앞으로 대세가 될 AI 영역의 기반을 먼저 장악함으로써 미래 산업의 주도권을 쥐겠다는 것입니다. 다음은 후위가 1024 계획 발표 행사에서 한 발언을 정리한 내용입니다. 중국 대표격 테크미디어인 36커​와 인터넷 미디어인 소후닷컴​의 현장 보도를 참고했습니다.



1. AI 생태계 계획

AI 영역의 지식과 기술이 오가는 ‘살롱(沙龙)’을 만드는 것이 생태계 계획의 핵심입니다. 자사가 보유한 AI 기술을 필요로 하는 기업과, 개발자들에게 오픈해 이들의 제품과 서비스에 반영하겠다는 그림인데요. 예를 들면 장춘 지역의 차량이나 충칭 지역의 O2O 서비스를 개발하는 개발자들이 현지의 데이터와 커다쉰페이의 AI 기술을 결합하게끔 한다는 것입니다.

단순히 인터넷에서 기술을 이용할 수 있는 페이지만을 오픈하는 것은 아닙니다. 커다쉰페이는 매년 6회에 걸친 오프라인 모임을 전국 6곳의 도시에서 열어서 ‘도시의 주요 기술+솔루션+AI 기술과의 결합 사례’를 공유할 예정입니다. 이뿐만이 아니라 허페이와 장춘 등의 지역에서 AI 기술을 중심으로 한 창업공간을 구축하고 초기 기업의 개발자들에게 기술을 제공할 청사진도 마련하고 있습니다.

커다쉰페이 측의 발표에 따르면 이들의 오픈 플랫폼을 이용하는 개발자의 숫자는 46만 명에 이르렀습니다. 앞으로는 이 플랫폼에서 VIP 등급을 부여하여 커뮤니티 기반의 기술과 콘텐츠 관리 체계를 마련하고자 합니다.

투자 계획도 밝혔습니다. 10억 2400만 위안(약 1725억 원)의 ‘쉰페이 기금’을 조성해 두 가지 영역에 투자할 계획을 공개했습니다. 우선 비즈니스 모델을 갖추지 못했지만 핵심 기술을 보유한 스타트업이 해당됩니다. 이 기금은 핵심 기술과 개발자에 초점이 맞춰져 있으며, 이들이 자신의 기술로 비즈니스 모델을 구축할 수 있도록 돕는 것이 목표입니다. 예를 들어 쉰페이가 최근 동베이대학의 번역 기술랩과 상하이 중국 과학원 산하의 조직에 투자를 한 것은 컴퓨팅 시각 기술에 대한 투자였죠.

다음은 커다쉰페이의 인공지능 기술 고도화를 위한 투자입니다. 예를 들어 유비테크(UBTECH) 로보틱스에 투자를 한 것이 대표적인데, 이는 인공지능의 컨텍스트와 응용 분야에 대한 투자라고 할 수 있습니다. 자사의 플랫폼과 투자를 통해 AI의 기술 개발의 인프라를 장악하는 것이죠.


2. AI 대학 계획


현재 중국의 AI 인재 공급이 매년 100만 명에 가깝게 부족하다는 게 커다쉰페이 측의 입장입니다. 현재 오픈 플랫폼에 46만 명의 개발자들이 있는데요. 이들 중 3분의 1은 200명 이상의 기업, 3분의 1은 50명 이하 스타트업,그리고 나머지 3분의 1은 약 1000여곳 대학의 학생들입니다. 그리고 AI 영역 개발자는 약 10만 명에 이릅니다.


이들은 중국의 빠른 성장과 함께 하고 있습니다. 최근 중국 대학 졸업생들의 창업 비중은 3%로 선진국(1.6%)를 넘어섰습니다.

커다쉰페이는 AI 영역의 주요 연구자들과 기업들과 합작해 AI 대학을 추진하고자 합니다. 이 대학에서는 온라인 수업과 토론, 우수 강사 선정 및 성공사례 공유 등으로 구성될 예정입니다. 대학생과 개발자들의 학습환경을 만드는 것이 목표입니다.

커다쉰페이가 만들고자 하는 AI 대학은 텐센트가 세운 칭텅 대학이나 알리바바의 후반 대학과는 다릅니다. 쉰페이는 BAT와 같은 거대 기업과는 같은 전략을 펼칠 수 없기 때문에, 이들은 기술 기반의 생태계를 만드는 데에서 차별점을 확보하는 것입니다.


3. AI 공익 계획


커다쉰페이가 2014년 발표한 산동성 방언 식별 기술 홍보 포스터


문화와 IT의 결합된 모델을 만드는 것 역시 커다쉰페이의 주요 목표중 하나입니다. 그중 사회 환원(공익)의 영역을 공략하는 것은 사회의 합의를 이끌기 위한 방법 중 하나입니다. 현재 전세계 방언의 종류는 6000개에 달합니다.


커다쉰페이는 이 영역을 AI로 해결하면서 자사의 기술에 대한 사회적 지지를 받고자 합니다. 더욱 많은 이용자의 데이터를 확보할 수 있는 방법이기도 합니다.

이를 위해 약 100여곳의 정부기관, 기업, 뉴미디어와 합작해 커다쉰페이의 중국어 방언 음성 입력 시스템을 도입하고, 이를 위한 DB를 구축하고 있습니다. 현재 커다쉰페이의 음성 식별 시스템이 반영하는 지역 언어는 광동어, 사천어, 상해어 등 22종입니다. 커다쉰페이는 약 1024만 가지의 방언 패턴을 인식해 2018년 초에 구체적인 방안을 내놓을 계획입니다.



기술 기업이 이러한 AI 플랫폼을 만들고, 거액을 투자하며, 학교를 세우고, 공익 사업을 벌이는 이유가 뭘까요. 미래의 AI 구도는 생태계의 대결이기 때문일 것입니다. 몇년 전 알리바바그룹의 창업주 마윈은 미래의 에너지원은 전기나 물이 아니라 데이터라고 했습니다. 그래서 알리바바, 텐센트, 바이두 모두 이 데이터를 얻고자 온라인과 오프라인의 경계를 넘어서고 있는 것이죠. 커다쉰페이는 그 이면의 데이터를 다루는 기술 인력을 모으고 있습니다. 그리고 그들이 만들어내는 플랫폼에 자사의 AI 기술을 쓰도록 유도하고 있죠. 보이지 않는 구역에서 이를 장악하기 위한 경쟁이 치열하게 진행되고 있는 셈입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari