brunch

You can make anything
by writing

C.S.Lewis

by 라인하트 Dec 21. 2019

실제 비즈니스의 인공지능 (2/5) - 회의록 AI

   하버드 비즈니스 리뷰의 인공지능 관련 글들을 읽으면서 AI가 우리 주변에서 널리 사용되고 있다는 것을 느꼈습니다. 그래서, 필자가 몸담고 있는 비즈니스 업계에서 인공지능 기술이 어디까지 왔고 얼마나 활용되고 있는 지를 정리합니다. 필자가 가장 잘 아는 시스코 웹엑스 서비스가 인공지능을 어떻게 적용하는 지를 살펴보겠습니다.  



2019년 시스코는 회의록 작성 AI 기업 보이시아를 인수하다

   보이시아(VOICEA)는 2016년 캘리포니아 산호세에서 오마르 타와콜이 설립한 음성 인식 인공지능 스타트업입니다. 보이시아의 인공지능 서비스 이름은 에바 (EVA, Enterprise Voice Assistant)입니다. 에바는 회의를 스크립트로 기록하거나 녹화 파일에 스크립트를 만들어 주는 인공 지능 서비스입니다. 특히, 에바는 기업에서 자주 사용하는 용어들을 이해할 수 있는 알고리즘으로 설계되어 기업에 적합합니다. 사람들은 회의를 시작하기 전 영상회의 단말이나 스마트폰 앱으로 에바를 초대하는 것만으로 바로 사용할 수 있습니다.  




   2019년 8월 시스코는 보이시아를 전격적으로 인수하였습니다. 시스코는 회의를 기록하는 기능 (트랜스크립트, Transcript)을 독자적으로 유지하기보다는 시스코 웹엑스 미팅 솔루션과 결합하였습니다. 시스코 웹엑스 회의에 트랜스크립트와 자막을 추가합니다. 


   



보이시아 (Voicea)의 설립자, 오마르 타와콜

       보이시아의 설립자이자 CEO인 오마르 타와콜(Omar Tawakol)은 정통 빅데이터와 AI의 선두 주자입니다. 그는 보이시아를 설립하기 전에 블루카이 (Blue Kai) 스타트업의 공동설립자입니다. 블루카이는 빅데이터 분야에서 두각을 나타낸 스타트업으로 2014년 오라클이 인수하였습니다. 




   오마르 타와콜은 현재 시스코에서  시스코 컨택센터 사업부의 총괄 사장 (Vice President & General Manager of the Cisco Contact Center BU)입니다. 협업 솔루션 총괄 책임자인 에이미 청이 그를 컨택센터의 수장으로 앉힌 이유는 단 한 가지 빅데이터와 AI 전문가이기 때문입니다. 지금도 수많은 스타트업들이 컨택센터의 생산성을 향상할 수 있는 대화형 AI, 트랜스크립트 AI, 상담원 조언 AI 등을 만들고 판매합니다. 컨택센터는 인공지능에 의해 한 두 가지 업무가 성공적으로 대체된다면, 엄청난 비용절감과 생산성 향상이 기대되는 곳입니다. 또한, 고객 관련 데이터와 음성이 빅데이터로 쌓여 있는 곳입니다. 비즈니스에 대한 이해를 바탕으로 인공지능과 빅데이터를 잘 알고 있는 오마르 타와콜이 컨택센터 분야에서 어떤 성과를 보여줄지 지켜볼 필요가 있습니다. 



회의록 작성 AI, EVA가 보여줄 미팅의 미래 

   많은 기업들이 회의 내용을 스크립트로 만들거나 회의록을 작성하길 원합니다. 회의록 작성은 생각보다 많은 시간을 소비하는 작업입니다. 현재 회의를 스크립트를 만드는 인공지능의 기술은 상당한 수준에 올라와 있지만, 누가 무엇을 이야기 하는 지를 파악하는 것과 스크립트의 맥락을 이해하고 회의록을 만드는 인공지능은 아직 진화가 더 필요합니다. 


   우선, 인공지능이 화자를 인지하는 과정은 매우 복잡한 기술로 여러 가지 인공지능이 결합되어야 합니다. 회의 중에 목소리를 인식하여 참가자를 확인하는 것보다 얼굴을 인식하여 참가자를 확인하는 것이 더욱 효과적입니다. 따라서, 얼굴 인식 기술, 화자를 찾아내는 기술, 회의 스크립트를 만드는 기술, 맥락을 이해하고 스크립트를 축약하는 기술 등이 결합된다면, 영상회의에 대한 완벽한 회의록 작성이 가능합니다. 현재 영상회의 중 얼굴 인식과 화자 추적, 트랜스크립트 기능은 현실화되어 사용 중입니다. 따라서, 누가 어떤 이야기를 하고 있는 지를 추적하여 회의록을 만드는 것은 근시일 내에 가능합니다. 현재 시스코 웹엑스 미팅은 사람들의 얼굴 밑에 이름표 (Name Tag)를 붙이는 것이 가능합니다. 언젠가는 Voice Tag를 붙여서 화자를 인지할 수 있을 것입니다. 그렇게 되면 영상회의가 아닌 일반 회의에서도 회의록 작성이 가능해집니다. 

 

   회의록을 단순히 회의 스크립트를 화자 별로 축약하는 것으로 생각하기 쉽습니다. 그러나, 효율적인 회의록은 회의 참가자에 대한 외부 정보를 바탕으로 작성되어야 합니다. 참가자의 배경을 인지하여 스크립트의 맥락을 파악해야 하니다. 이런 맥락을 파악하거나 참가자의 외부 정보를 수집하는 인공지능을 가진 어컴파니(Accompany)라는 회사를 시스코가 오래전에 인수하였습니다. 근 시일 내에 회의록 작성이 가능해질 것입니다. 


   그리고, 영상회의에서 많은 수요는 실시간 자동 번역입니다. 보이시아의 에바가 실시간으로 스크립트를 만들고, 자동 번역 인공 지능을 연계 자막을 만드는 것입니다. 아직까지는 사람들이 만족할 만한 수준의 실시간 번역 인공지능은 존재하지 않습니다. 인공지능의 발달 속도로 볼 때 영상회의에서 이 분야는 크게 급성장할 것입니다. 

매거진의 이전글 실제 비즈니스의 인공지능 (1/5) - 대화형 AI
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari