brunch

You can make anything
by writing

C.S.Lewis

by 정신욱 Oct 29. 2017

보이스는 퍼스트 플랫폼이 될 수 있을까?

결국 당신의 마음을 어디까지 읽어낼 것인 지에 달려있다

아마존의 에코가 나왔을 때만 해도, 아니 최근까지도 큰 감흥은 없었다. "와, 신기하다" 정도의 감탄이랄까? 워낙 여기저기서 매년 신박한 제품들이 쏟아져 나오고 있는 데다, 또 그만큼 빨리들 사라지고 있어 많은 경우 감탄 이상의 에너지를 쏟기는 아까운 경우가 많다. 불과 작년까지만 해도 혁명적인 디바이스로 여겨지던 3D 프린터와 VR기기 등은 도대체 지금 어디 있는가. 반짝거리는 관심만 받고 소리 소문 없이 사라진 디바이스는 수도 없다.


그러나 나는 확신한다. 아마 향후 수년간 가장 많이 회자되는 영화는 <HER>가 될 것이다. 이 영화를 이미 보신 분은 감을 잡으셨을 것이고, 아직 보지 못한 분은 얼른 보기를 추천드린다. 왜냐하면 이 영화가 그린 미래는 개봉 당시에는 멀어 보였지만 이젠 머지않아 성큼성큼 다가올 것이기 때문이다. <HER>은 한 남자가 보이스 플랫폼의 AI(인공지능)와 사랑에 빠지게 되는 이야기를 그린 영화이다. (재미도 있다)


보이스가 중요한 플랫폼이 된다고 보는 이유는 이미 생태계가 만들어지고 있기 때문이다. 2014년에 처음 출시된 보이스 인공지능 기기의 누적 판매량은 2017년에 3천만 대를 넘어설 것으로 예상된다. 그리고 알렉사의 스킬(휴대폰의 앱에 해당)은 작년 6천여 개에서 올해는 15천 개로 급증하고 있다. 단순한 정보 알림과 스마트홈의 제어 기능 정도로만 활용되던 보이스 기기는 본격적으로 업무, 거래, 주문, SNS, 교육, 그리고 엔터테인먼트까지 아우르는 다양한 스킬들이 본격적으로 추가되고 있는 상황이다. 앱의 폭발적인 확장이 스마트폰을 가치 있게 만들었듯이 이제 탑재되는 스킬의 증가는 보이스 플랫폼의 가치를 증가시키고 있다.


1. 보이스 플랫폼 기기로 할 수 있는 것들


강정수 외 9인의 <보이스 퍼스트 패러다임>에서는 보이스로 할 수 있는 일들을 크게 6가지로 구분한다.


1) 기본 기능 : 시간 묻기, 쇼핑리스트 적기, 메시지 보내고 받기, 날씨 묻기, 길 찾기, 타이머 맞추기, 스케줄 예약, 인터넷 검색, 음악 듣기 등

2) 사물 제어 : 자동차, 냉장고, 보안장치, 조명, TV, 로봇 인형 등의 작동 및 상태 체크

3) 거래 : 쇼핑, 주문, 이체와 결제

4) 콘텐츠 소비 : 음악, 뉴스, 책 읽기, 레시피 제공, 명상, 요가, 스트레칭 디렉션, 퀴즈 게임, 스토리 게임 등

5) 생산적 작업 : 글을 작성하고 편집, 비즈니스 업무 처리

6) 소셜 네트워크, 커뮤니케이션 : 전화 걸기, 메시지 보내기 외 다자 커뮤니케이션도 가능


위의 6개 기능 중 1)의 기본 기능은 기 출시된 제품들 대부분이 수행 가능한 기능이며, 2)의 사물 제어 또한 가능하나 최근에서야 각종 전자기기에 IoT 기능이 탑재되어 있어 변화는 서서히 진행될 것으로 보인다. 3)과 4)는 최근 스킬들이 많이 추가되면서 점점 이용 가능한 폭이 넓어지고 있고, 5)와 6)은 가능성은 있지만 아직은 활용방법을 고민하는 초기단계에 있다.


2. 보이스 플랫폼을 부정적으로 본 이유


본인은 사실 보이스 플랫폼에 부정적이었다. 일단 100% 퍼스널 하지 않기 때문이다. 우리가 현재 쓰고 있는 휴대폰은 기본적으로 텍스트와 터치로 이루어진 퍼스널 기기다. 아무리 사람이 많은 곳에서도 나의 프라이버시는 유지된다. (가끔 지하철 옆자리에 앉은 사람이 훔쳐보기는 하지만 화면을 살짝 돌리면 된다) 회사에서도 업무 중간중간 상사의 감시를 피해 간단한 개인적인 업무를 처리할 수도 있다.


그러나 보이스 플랫폼은 퍼스널 하지 않다. 아웃풋은 이어폰으로 듣는다고 하더라도 인풋은 본인의 목소리를 내야 한다. 공간적 제약이 발생할 수밖에 없다. 회사는 물론이고 사람이 많은 공간에서는 사용하기 어렵다. 집에서도 마찬가지다. 가족과 같이 사는 경우, 공통의 필요나 관심사에 대해서는 보이스 플랫폼을 이용할 수 있지만, 개인적인 용도로 사용하기 위해서는 적어도 독립된 공간에서 각자의 기기를 이용해야만 한다.


뿐만 아니라 보이스 플랫폼은 선택을 제약한다. 일반적으로 우리가 궁금하거나 원하는 것을 입력했을 때 모바일이나 PC에서는 다양한 검색 결과를 시각적으로 보여주고 우리가 그 옵션들을 검토하고 가장 선호하는 것을 선택하게 한다. 그러나 보이스로는 그게 불가능하다. 가능한 옵션들을 하나하나 불러줄 수는 없다. 말하는 사람이 무엇을 원하는 지를 정확히 분석해서 단 하나의 대답을 내어 놓아야 한다. 질문에 대답 가능한 수많은 옵션 중에서 'One Answer'로 대답해야 하는데, 팩트에 기반한 질문이 아니라면 질문에 적합한 하나의 대안을 제시하는 일은 현재로서는 어려운 것이 사실이다.


3. 그러나 단점은 장점이 되기도 한다


위에서 언급한 보이스 플랫폼의 '개인적이지 못한' 특성으로 환경적 제약을 받을 수밖에 없지만, 반대로 환경적 제약만 충족된다면 더욱 편리하게 사용할 수 있다는 의미도 된다. 날씨를 알기 위해 굳이 휴대폰을 찾고, 암호화를 해제하고, 날씨 앱에 접속할 필요는 없다. 그저 알렉사에게 "내일 날씨 어때?"라고만 물어보면 되는 것이다.


즉, 커뮤니케이션의 방식이 빠를 뿐 아니라, 기존 인간의 방식에 가까워 자연스럽다. 환경적으로 독립적인 공간에 있는 경우, 또는 혼자 있지만 이동 중이거나 작업 중이라 휴대폰을 사용하기 어려운 환경에서는 보이스가 훨씬 유용하다. 공간적으로는 집안의 자기만의 방과 자동차 안이 최적이고, 환경적으로는 아이를 돌보거나 설거지를 하는 등의 제약이 있는 경우 유용하게 사용될 것이다.


굳이 보이스 AI 기기를 개인적 용도로만 볼 필요도 없다. 가족과 함께 거실에 있으면서 최근에 나온 아이유의 신곡을 들려달라고 할 수도 있고, 식사 준비를 하기 전에 냉장고에 반찬 재고가 얼마나 남았는지 물어볼 수도 있다. 떨어진 세제를 주문하기도 하고, 자기 전에 조명을 끄고, 수면중 실내온도를 20도에 맞춰달라고 하면 된다. 

  

회사에서도 마찬가지다. 스마트홈의 기능을 회사에도 그대로 옮겨올 수 있는 데다, 업무회의 중 체크할 팩트가 있는 경우, 도는 과거 회의 내용 점검, 그리고 회의 결과에 따른 출장 스케줄 조정 또는 예약이 필요할 경우도 즉시 액션이 가능하다. 


결과적으로 휴대폰은 혼자 있을 때나 함께 있을 때나 개인적으로 사용되어야 하나, 보이스 기기는 혼자 있을 때는 개인기기로, 또 함께 있을 때는 공동의 용도로 활용될 수 있다. 환경적 제약은 있지만, 그 제약 하에서는 보다 편리하고 적합한 용도로 사용될 수 있는 것이 큰 장점이다.


4. One Answer는 우리를 얼마나 만족시킬 수 있을까


팩트를 물어보거나, 명확한 지시를 내릴 경우라면 인터넷 검색과 보이스 플랫폼의 근본적인 차이는 없다. 그 상황에서 무엇이 더 적합하고 편리한 지의 차이일 뿐이다. 그러나 특정한 니즈는 있지만 그 니즈를 만족시킬 구체적 대상이 명확하지 않은 경우라면 상황은 완전히 달라진다. 인터넷 검색은 가능한 대안을 나열해 보여줄 수 있지만, 보이스 기기는 가능한 대안을 모두 나열할 수는 없다. 최적의 대안 하나만을 골라 말해야만 한다. 오직 'One Answer' 만이 가능하다.


예를 들어 노트북 구매를 고려하고 있는 사람의 경우, '노트북'이라는 텍스트로 인터넷 검색을 한다면 브랜드별, 가격대별, 성능별로 나열된 리스트가 있고 그 정보들을 검토한 후 최종 구매 결정을 할 것이다. 그러나 보이스는 다르다. "알렉사, 내가 살만한 노트북 뭐가 있을까?"라고 하면 최소한의 과정을 통해 근접한 대답을 내놓아야 한다. 그리고 그 대답이 사용자의 니즈에 상당히 부합해야만 한다. (물론 최근에는 인터넷 검색에서도 개인화된 검색 결과를 제공하기도 한다) 원하는 결과를 얻기 위해 수많은 과정을  거쳐야 하는 일은 인터넷으로도 버거운데, 보이스는 말할 필요도 없다. 마치 분통 터지는 카드사 ARS를 듣는 기분일 것이다. 


One Answer에 보이스의 위기와 기회가 있다. 사용자의 모호한 니즈를 듣고서 최소한의 단계로 만족스러운 대답을 제시할 수 있다면 그것은 기회다. 하지만 그 과정이 지나치게 오래 걸리고 효율적이지 못하다면, 인터넷 검색에 밀릴 수밖에 없다. '사용자가 만족스러운 하나의 대답'을 빨리 찾아낼 수 있는지는 보이스 플랫폼이 단순한 지시 수행의 역할을 하는지, 아니면 우리의 중요한 의사결정에 도움을 주는 존재로 발전할지를 결정한다. 


이는 결국 수집 가능한 데이터의 양과 AI의 능력이 중요할 것이다. 우리가 원하는 하나의 대답을 효율적으로 얻기 위해서 우리는 우리에 관한 더 많은 정보를 AI에 제공해야 하는 한편, 이를 처리하는 AI 성능의 발전도 필요하다. 이미 아마존에서는 개인화된 추천 기능을 활용한 매출이 전체의 35%를 차지할 정도이고, 페이스북을 비롯한 SNS도 빅데이터를 이용한 개인화된 광고를 제시하고 있다. 그런데 보이스는 항상 'On' 모드로 있기 때문에 스마트폰으로는 한계가 있는 우리의 라이프스타일, 실시간 기분과 감정상태까지 수집 가능한 장점이 있다. 시간이 필요하지만 언젠간 우리보다 우리를 잘 아는 존재가 탄생할 가능성이 높다. 그리고 그때가 되면 보이스 플랫폼은 우리 삶에서 강력한 존재로 위력을 발휘할 것이다.


5. 보이스 플랫폼의 본격 확산은 킬러 콘텐츠와 함께


누군가는 편리함만으로 보이스 기기를 활용할 수도 있겠지만, 본격적인 확산은 기존의 스마트폰과 차별화된 가치를 제공하는 순간부터일 것이다. 그리고 그 시기는 보이스 플랫폼의 강점을 극대화할 수 있는 킬러 콘텐츠가 등장한 순간일 가능성이 높다. 킬러 콘텐츠는 어학이나 자녀교육과 관련될 가능성이 높다.


인터넷 시대에서는 동영상 강의가 대세가 되었다. 그러나 그것은 오프라인의 제약을 극복한 것이지, 쌍방향 지도 학습은 사실상 어렵다. 앱을 통한 1:1 어학교육이나 전화영어도 있지만, 그것은 역시 이용방식의 변화일 뿐이다. 그런데 고성능의 AI가 탑재된 보이스 기기를 이용해 언어를 배우면 어떨까? 단순히 강의가 아니라 내가 말하는 문장의 문법과 발음 등을 실시간으로 교정해줄 수 있을 것이다. 같은 문장을 인도식, 호주식, 영국식 등으로 응용해서 들어볼 수도 있겠다. 외국어 회화에서 획기적인 진보가 있을 수 있다. 구글이 이미 실시간 번역이 가능한 이어폰을 내놓은 상황에서 이를 구현하는 일은 그리 어렵지 않을 것 같다.


자녀교육과 관련된 콘텐츠도 기대된다. 태블릿 PC가 출시되면서 요즘 아이들은 동화책도 태블릿으로 보고, 게임을 즐기며 학습하는 형태로 진화했다. 그러나 태블릿은 역시 화면의 제약을 가진 디바이스다. 보이스 플랫폼을 이용한다면 시각적인 제약을 벗어나 아이들과 역할극을 할 수도, 아니면 스무고개를 할 수도, 퀴즈게임을 할 수도 있고, 필요하다면 TV나 태블릿과 연결해 시각적 콘텐츠를 동시에 보여줄 수도 있다. 말만 떼면 '이거 뭐야, 저거 뭐야'라고 묻는 아이들이 앞으로는 부모가 아니라 알렉사에게 먼저 물어보는 때가 곧 올지도 모른다.


정보를 얻고, 사물을 제어하는 용도로는 편리하지만 보안과 개인정보 문제로 보이스 기기를 꺼려하는 사람은 꽤 많을 것이다. 그러나 이들 또한 이런 킬러 콘텐츠들이 속속 탑재되면서 일상생활에 필수 불가결한 기기로 자리 잡는 다면 그 유혹을 이겨낼 수는 없을 것이다. 그리고 더 나아가 보이스 기기가 당신보다 당신을 더 잘 아는 시기가 온다면, 그것이 사랑하는 사람의 위치에까지 오르는 것도 영화에서만 일어나는 일은 아닐지도 모른다.


6. 보이스 시대는 온다


애플이 스마트폰을 출시한 지 10년이 지났고 우리는 스마트폰이 없는 세상을 상상할 수 없다. 그러나 이미 세상을 떠난 스티브 잡스 마저도 스마트폰의 위력이 이렇게까지 커져있을 줄은 상상하지 못했을 것 같다. 아마 10년 뒤의 보이스 플랫폼도 이와 비슷하지 않을까 싶다.


보이스 플랫폼은 아직 여러 면에서 초보적 단계이고 제약도 있지만, 커뮤니케이션을 위한 마찰이 적어 하나의 중요한 플랫폼으로 등장할 것이다. 스마트폰은 스마트폰대로 퍼스널 한 기기로, 보이스 기기는 그 나름대로의 존재가치를 증명하며 공존하는 시대가 올 것으로 본다. 편리함을 시작으로 해서, 킬러 콘텐츠와 함께 성장하고, 궁극적으로는 사용자에 최적의 One Answer를 제공할 수 있는 플랫폼이 될 것이다. 


보이스 플랫폼이 제시하는 One Answer에 의존하게 될 것이냐 아니냐는 결국은 AI의 의사결정을 충분히 신뢰할 수 있느냐 없느냐에 달려있다. 초기에는 시행착오와 여러 번의 검증을 거치겠지만 결국 개개인에게 상당히 합리적이고 최선에 가까운 설루션을 제시할 것이다. 그리고 이 편리함과 효율을 철저히 거부할 수 있는 이는 거의 없을 것이다.


마지막으로 보이스 플랫폼을 차지한 기업들은 사실상 신의 위치에 오른다고 봐도 무방하다. 지금의 플랫폼 기업보다 더 많은 정보를 통해 우리를 더 잘 이해하고 필요한 것을 알아서 제시할 것이다. 이 흐름은 필연적일 수밖에 없는데, 빅브라더가 되어버릴 IT기업들을 어떻게 통제할 것인가가 앞으로도 끊임없이 제기될 이슈임에 분명하다. <사피엔스>의 마지막 장에서처럼 우리가 해야 할 질문은 '우리가 원하는 것은 무엇인가?' 가 아니라 '우리는 무엇을 원할 것인가?'인지도 모르겠다.






작가의 이전글 저도 교토에 다녀왔습니다.
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari