brunch

You can make anything
by writing

C.S.Lewis

by 강코치 Nov 26. 2018

9편. UX 관점에서 본 챗봇과 음성봇

지난 13편에서 챗봇과 음성봇이 공통적인 영역이 존재하여 매우 밀접한 관련이 있음을 구조적으로 설명 드렸습니다. 음성인식 기반의 AI서비스를 제공하는데 있어서 챗봇은 핵심적인 역할을 하고 있는 것이죠. 그러므로 둘을 별도로 떼어놓고 볼 필요가 없다고 생각합니다. 그래서 이번 글에서는 챗봇과 음성봇을 기반으로 서비스를 구현할 경우 UX관점에서 고려해야 할 몇 가지 체크포인트를 써보겠습니다.



UX 체크포인트 1. 인공지능 기술도 중요하지만 대화맥락을 구현해야 합니다. 


인공지능(AI)기술에 대한 기대가 높아지고 실제 높은 수준의 AI기술이 제공되면서 챗봇이나 음성봇의 제공에 있어서 생긴 오해 중의 하나가 서비스를 구현할 때 음성인식이나 자연어처리 기술만 있으면 된다라는 오해가 존재합니다. 물론 음성인식과 자연어처리는 당연히 높은 수준으로 제공되어야 우리가 기대하는 많은 지능형서비스가 구현될 수 있습니다. 



그런데 챗봇과 음성봇 서비스에서 주의할 점은 바로 대화맥락을 구현하는 것도 매우 중요합니다. 한 예를 들어 AI스피커에게 “올해 한글날이 무슨 요일이야?”라고 물으면 AI는 자체 보유한 DB에서 “화요일입니다”라고 대답을 들려줍니다. Q&A의 전형적인 모델이죠. 그런데 사람의 대화는 이것보다 더 복잡하게 전개됩니다. 더 궁금해서 “그럼 내년은? 내후년은? 10년 후는?”이라는 조건을 물어볼 수 있죠. 물론 이 또한 알고리즘을 구현하여 요일을 쉽게 답변할 수도 있습니다. 



그런데 직장인이라면 더 복잡한 “그럼 징검다리 연휴야?”라는 우발적인 질문을 던지게 됩니다. 이때 이러한 대화맥락 시나리오가 구현되어 있지 않으면 “ 죄송해요…”라는 사과의 말을 내뱉게 됩니다. AI스피커를 통해 이뤄지는 사용자들의 수많은 대화 맥락을 AI스피커 제공사업자들이 모두 서비스로 구현할 수 없기에 소비자 불만족이라는 기사들이 쏟아지게 되는 이유이기도 하죠. 


물론 복잡한 대화맥락을 촘촘히 설계하여 구현할 수도 있을 것입니다. 그런데 사용자는 대화의 흐름에 있어서 복합 조건을 동시에 발화하거나 대화를 이어나가는 도중 우발적인 질문으로 넘어가는 경우가 있습니다. 예를 들어 까페에서도 바닐라 커피를 주문하려다가 모바일 기프트콘의 유효기간을 물어볼 수도 있고, 영업 시간이 몇 시까지인지 묻는 경우도 있죠.   


이렇게 복잡한 대화맥락을 기획자가 모두 고려하여 구현할 수 있다면 좋겠지만 기대가 큰 만큼 실망도 클 수밖에 없기에 대대적으로 홍보를 했던 AI서비스들이 실패(?)라는 오명을 쓰게 된 것도 이런 구조적인 이유 때문입니다. 



UX 체크포인트 2. 의도지향적 서비스일수록 대화맥락을 구성하기가 쉬워집니다. 


그렇다고 해서 모든 챗봇 서비스가 동일한 상황에 놓인 것은 아니죠. 필자의 판단으로는 이용자들이 서비스를 이용하는데 있어서 얼마나 의도지향적인가에 따라 서비스 구현의 승패가 결정된다고 생각됩니다. 주문을 하려거나 요금제를 변경하려는 것과 같이 사용자가 반드시 해결(?)해야 할 목적성을 가진 봇일수록 예상할 수 있는 충분한 대화맥락을 사전에 기획할 수 있고 이를 서비스를 제공하면서 지속적으로 정확도를 개선할 수 있는 것이죠. 이렇게 의도지향적인 서비스를 타로챗봇과 같이 기능형 봇(Function bot)이라고 보시면 될 듯 합니다.



그런 면에서 볼 때 가정에 보급된 AI스피커는 의도가 상당히 분산되어 있는 서비스이죠. 일기예보에서 뉴스까지 컨텐츠의 범위도 폭넓을 뿐 더러 사용자 층도 매우 상이하여 그들이 의도하는 바를 특정 사업자가 모두 처리해준다는 것은 사실상 어불성설에 가깝다고 봅니다. AI스피커 사업자도 모든 것을 다 해주는 인공지능 스피커로 마케팅을 하는 것 보다 특정한 의도를 잘 처리할 수 있는 기능형 AI스피커로 포지션을 옮겨야 비즈니스가 제대로 될 것이라 개인적으로 생각됩니다.



UX 체크포인트 3. 음성은 구조적으로 되물을 수 밖에 없습니다.


라디오 광고를 들어보면 TV광고와 다르게 “경리에요. 제가 이번에..”와 같이 광고모델의 이름을 먼저 거론하는 게 나옵니다. 오로지 음성만으로 이뤄지는 라디오 광고 모델은 음성AI서비스를 제공하는 데 있어서 시사하는 점이 많습니다. 바로 육성 만으로는 광고 모델이 누구인지 쉽게 알 수 없어서 제품과 모델의 신뢰성을 위해 실명을 언급하는 것이죠.


음성봇은 이런 측면에서 시각적으로 제공되는 챗봇에 대비해 한계를 가질 수 밖에 없습니다. 사용자들이 귀담아듣지 않으면 전혀 기억을 못하게 될 수 있어서 다시 되물어보는 상황이 생기게 되죠. 또한, 아직은 음성인식 기술이 완벽하지 않아 음성에서 텍스트로 변환되는 과정(Speech-to-Text)과 자연의 의도이해(Natural Language Understanding) 과정에서 오차가 생길 가능성이 존재합니다. 그래서 기계가 잘 인식했는지 사용자에게 컨펌(Confirm)받는 과정이 부득이하게 생길 수 밖에 없죠.



그런데 문제는 이렇게 매번 컨펌(confirm)을 받다 보면 사용자가 원하는 바를 정확하게 처리할 수 있지만 단계가 너무 늘어나는 문제가 발생하게 됩니다. 그러다 보면 음성인식서비스로서의 강점을 발휘하지 못하게 되죠. 그런 문제를 해결하기 위해 AI스피커 사업자들은 음성주문 서비스를 제공할 때 배송지 정보나 결제정보를 미리 지정해둔 기본정보로 처리하게 해두었죠. 주문 가능한 상품에 대한 제약을 두는 경우도 있습니다. 이 또한 사용자가 해당 정보를 음성으로 쉽게 변경하기 어렵고 특정 결제 수단만 써야 하는 제약으로 인해 서비스 이용에 있어서 큰 제약으로 작용하고 있습니다.   


음성봇은 STT 및 NLU 과정에서의 오차로 인해 사용자 선택을 되물어보는 컨펌을 거치는 한계를 가지고 있다.


UX 체크포인트 4. 비동기화의 문제는 음성봇이 해결해야 할 기술적 난제이다.

 

비동기화의 의미를 이해하려면 우리의 대화를 살펴볼 필요가 있습니다. 친구나 가족과 대화할 때 상대방이 말을 한 후 대화를 이어가는 경우도 있지만 상대방이 말을 하는 동시에 자신도 말을 할 수 있죠. 상대방의 말을 들으면서 말을 해도 우리는 대화를 이해하게 됩니다. 그렇지만 현재의 음성AI는 화자와 청자가 명확하게 비동기화되는 기술적 한계를 보유하고 있습니다. 아무래도 상대의 말을 소음으로 인식하게 되어 정확한 인식이 되지 않기 때문에 별도의 청각 모드(Listen mode)를 제공하여 정확하게 인식시키기 위한 것이죠.


그런데 실제 연속적인 대화를 할 경우 이 청각 모드(Listen mode)가 UX를 방해하는 느낌을 받게 됩니다. 1~2초의 짧은 대기 상태도 길게 느껴져 답답함을 주게 되죠. 하드웨어의 성능이 높아지고 망 속도가 빨라지면 이러한 대기 상태의 시간은 사람이 느끼지 못할 정도로 줄어들게 되겠지만 여전히 말하는 것과 동시에 듣는 것은 당분간은 사람만이 가능하지 않을까 생각됩니다.



UX 체크포인트 5. 음성봇은 정말 사람과의 대화처럼 만들 수 있다.


그럼에도 음성봇은 챗봇에 대비해서 우월한 요소가 존재하죠. 바로 음성합성(TTS) 기술의 발전입니다. 최근 들어 네이버나 구글과 같은 AI사업자는 특정인의 목소리나 운율로 음성을 재생할 수 있는 인공지능 기술을 내놓고 있습니다. 마치 실제 사람과 대화하듯 목소리나 톤이 자연스럽게 나오는 기술이 나날이 발전되고 있는 것이죠. 이러한 음성합성의 기술 진화는 감정의 전달이 가능하게 만들어 정서적인 서비스를 제공하게 할 것입니다. 


챗봇 기술과 음성봇 기술은 구조적으로 닮은 점도 많을 뿐더러 UX적으로 상호보완될 수 있습니다. 그래서 AI스피커 사업자들이 점차 음성만 지원되던 스피커에서 디스플레이를 갖춘 스피커를 도입하고 있는 것이죠. 최근에 여러분들이 광고를 통해 접하시는 구글 어시스턴트는 시각적인 챗봇과 음성의 보이스봇이 잘 융합된 서비스라고 볼 수 있습니다.


더불어 홀로그램을 통해 등장하는 AI를 갖춘 아바타와의 일상적인 대화도 가능하겠죠. AI 인식기술과 AR 기술, 홀로그램 기술의 결합은 현실에서 한계를 갖춘 로봇을 사이버 공간에서 무한한 능력을 갖춘 아바타로 재탄생시키지 않을까 생각합니다.

작가의 이전글 챗봇을 넘어 음성봇으로

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari