요즘 핫한 인공지능 음성 비서 이야기
요즘 스마트 스피커 전쟁이라고 해도 과언이 아니다. (물론 내가 속한 업계, 혹은 내가 맡은 업무에 한정된 이야기 일 수 있으나 그건 스포츠든 패션이든 어디나 마찬가지니까 일단 그렇다고 치자)
Amazon은 Alexa라는 강력한 브랜드를 만들어 Echo, Echo Tap, Echo Dot을 출시했고, 이제 카메라를 장착한 버전인 Echo show, Echo look 까지 출시했다. 구글도 질세라 Google Assistant(구글 어시스턴트)를 담은 Google Home을 선보였고, 올해 말이 되면 애플도 Siri(시리)를 탑재한 Apple HomePod을 출시한다. (참고: http://www.businessinsider.com/best-smart-speaker-amazon-echo)
국내 역시 SKT가 NUGU를 만들고 KT가 기가 지니를 출시했다. 이제 네이버, 카카오, 삼성도 스마트 스피커 시장에 도전장을 내고 국내 시장에서 각축전을 벌일 예정이다. (참고: http://biopan.hankyung.com/article/2017050961721)
결론부터 말하자면 되긴 될 거 같다. 이렇게 생각하는 이유는, 써보면 확실히 편하기 때문이다. 에코닷과 구글홈을 써보고 확실히 편하다고 느꼈다. 사용자에게 주는 가치가 있고, 그 가치가 보편적으로 받아들여질 정도로 보이므로 기술이 더 발전하면 (지금은 제한적이고 좀 답답한 면이 있다) 충분히 널리 쓰일 것처럼 보인다.
Workflow(Apple이 인수함) 같은 앱을 유용하게 사용하는 이유는 단계별로 밟아야 하는 복잡한 과정을 한 번에 수행해주기 때문이다. 스마트 스피커는 말 한마디로 그것을 바로 해줄 수 있다. 음악을 듣기 위해 음악 앱을 켜고 원하는 곡명이나 가수를 검색하고 재생 버튼을 눌러야 하지만, 스마트 스피커가 있으면 "OOO 노래 틀어줘" 한마디면 바로 수행이 가능하다. 일단 같은 환경에서도 눈으로 보고 손으로 눌러야 하는 수고로움을 덜 수 있는데, 운전이나 설거지를 하는 중이라면 그 효용은 더 커진다.
'된다'라는데 저마다 기준이 다르겠지만 내가 생각하는 수준은 집마다 1대씩 있는 수준을 말한다. 80% 이상 가구에 스마트 스피커가 보급되는 수준. 당장 이번 게임에서 그 수준까지 도달할 수 있을지는 미지수다.
에코닷과 구글홈은 회사 기기를 대여해서 일정 기간 동안 사용해본 것이고, 지금은 반납했다. 반납한 후에 내 돈 주고 에코닷과 구글홈을 샀을까? 안 샀다. 이걸 보면 내가 내 지갑을 열어 구매할 수준은 아니었고, 다른 사람에게 사라고 추천할 수준은 안 되었단 뜻이다. (이는 둘 다 영어만 지원하기 때문이기도 하다. 구글홈은 곧 한국어를 지원할 예정이다.)
PDA 생각이 스친다. 스마트폰과 한 끗 차이인데 PDA는 저물고 스마트폰은 새 세상을 열었다. 스마트 스피커 제품을 어떻게 기획해서 고객에게 어필하느냐가 초기 시장 점유율에 영향을 미칠 수 있다. 어떻게 고객을 유혹하여 지갑을 열게 할 것인가?
사용자의 페인 포인트(pain point)를 찾아내고, 그 가려움을 확실히 긁어 줄 수 있는 제품을 만들고, 그 부분을 강력히 어필하여, 지갑을 열게 하고, 사용자를 만족시켜 입소문을 나게 해야 한다.
기술이 중요하지 않다는 뜻이 아니다. 다만, 사용자들에게 더 매력적인 것은 얼마나 뛰어난 기술을 사용했는가 보다 얼마나 큰 효용(가치)을 가져다줄 수 있느냐 라는데 있다는 것이다. 사용자들은 모든 서비스를 동시에 써보지 않고서는 어떤 기기가 wake up(음성 트리거로 기기를 활성화시키는 것)이 더 잘되는지, 음성 인식을 더 잘하는지(음성을 텍스트로 변환), 사용자의 의도를 더 잘 파악하는지, 많은 기능을 수행할 수 있는지, 조목조목 비교하고 실험한 뒤 구매하지 않는다. 기술이 중요한 이유는 이러한 이유로 물건을 구매한 사용자에게 높은 만족을 통해 재구매와 입소문을 유도하기 위함이다. (멋들어지게 홍보해서 고객의 기대치를 높여놓고 제품의 품질이 그에 미치지 못해 실망과 분노만 안겨준다면 홍보하지 않으니만 못하다)
SKT NUGU가 실제 판매 가격이 팔 때마다 손해임에도 불구하고(생산단가보다 실제 판매 가격이 더 낮다는 뜻) 그렇게 판매하는 이유는 초기 품질 향상을 위해 꾸준히 데이터를 확보하기 위함이란 이야기를 들은 적이 있다. 지금 많은 회사들이 이 음성인터페이스 시장에 뛰어드는 이유 중 하나도 바로 여기에 있다고 본다. 초기에 고객과의 접점을 가질 기회를 잡지 못하면 데이터 기근에 시달리게 되고 그 격차가 커져서 도저히 따라잡을 수 없는 수준까지 벌어지기 때문이다.
음성 인식도 결국 많은 발화 데이터가 쌓여야 품질 향상이 가능한 것이고, 사용자들이 어떤 의도를 가진 발화를 하는지 수집되어야 그에 맞게 서비스를 향상할 수 있다. 고객과의 접점을 갖지 못하면 고객이 무엇을 원하는지 알 수 없을 뿐만 아니라 서비스 향상을 위한 데이터를 수집할 수 없게 된다. 나아가 사용자와의 접점을 잃을수록 비즈니스 기회도 잃게 된다. 사용자들이 검색창에 검색어를 입력하거나 모바일 앱을 사용하기보다 음성 인터페이스를 이용하게 되면 그만큼 사용자의 활동 데이터와 수익 창출의 플랫폼 기회를 갖지 못하게 되는 것을 의미한다.
현재로선 Apple HomePod을 살 예정이다. 이 홈페이지(https://www.apple.com/homepod/)를 한 번 보고 결정했다. '어머 이건 사야 해!' 평소 아이폰, 아이패드, 맥북, 에어팟 등 애플 제품을 사용하면서 생긴 브랜드에 대한 애정과 믿음도 한몫했다. 또한, 스피커에서 가장 중요한 기능 중 하나가 음악 재생인데 현재 Apple Music을 쓰고 있기 때문에 가장 편리하게 음악 서비스를 이용할 수 있는 하드웨어일 것이란 생각도 든다. 디자인도 쌔끈하고, 퀄리티에 대한 기대와 믿음이 있기에 설레는 마음으로 제품을 기다리고 있다.
네이버 챔프(Champ)도 구매를 고려중이다. (아직 출시 안 함, 12월 출시 예정) 사고 싶은 2가지 이유가 있는데 하나는 라인 프렌즈 캐릭터 때문이다. 최애 캐릭터인 브라운 모양으로 스피커가 출시될 예정이라 귀여워서 사고 싶은 생각이 있고, 다른 이유 하나는 일본어가 지원되기 때문이다.(WAVE를 일본 먼저 출시한 것으로 보아 Champ도 그럴 것 같다) 에코닷과 구글홈을 쓰다 보면 영어를 써야 해서 자연스럽게 영어 대화 상대가 생긴 듯한 느낌이 들었었다. 지금은 일본어 공부를 하고 있기 때문에 일본어로 말할 기회도 만들고, 내 말을 알아듣는지 확인할 수 있도록 일본어 대화 상대로서의 가치가 있다. (지금도 종종 일본어 시리에 말을 걸곤 한다)
IT 업계에서 음성 인터페이스 관련 업무를 하고 있는 사람으로 한 번 정도 정리하는 글을 쓰고 싶었다. 음성 인터페이스는 분명 편리하기에 널리 퍼지게 될 것이다. 지금은 스피커로 한정되어 있지만 스마트폰, 자동차, 집, 가전기기 등 다양한 플랫폼을 통해 서비스될 것이다. 다만 누가 언제 어떻게 그 시장을 차지하게 될지는 지켜볼 일이다. 그 시장을 차지하기 위해 내일 또 출근해서 열심히 일해야겠지!
* 표지 및 본문 이미지 출처: Unsplash.com