brunch

매거진 AI 봇

You can make anything
by writing

C.S.Lewis

by 젠틀파이 제이미 Aug 27. 2018

컨버세이션 디자인: 봇의 좋은 대화는 어떻게 만들어질까

컨버세이션 디자인, 젠틀파이, 대화 디자인, 챗봇, 음성봇

리서치에 따르면 대부분의 사람들은 새로운 기술을 대할때 마치 인간을 대하듯 한다고 한다. 아무말없이 하루종일 집안을 돌아다니는 로봇청소기를 보고, 구석에 끼여있다며 안타까워 하는 우리네 사람들, 사람들은 기계에게도 인정이 넘쳐난다. 생소한 대화상대인 봇과 사람들은 어떤 대화를 기대할까? 사람들의 대화습관에서 그 실마리를 찾을 수 있다.


인간과 인간의 대화에서도 잘되는 대화가 있다. 백화점에 가도 말이 잘 통하는 세일즈 매니저가 있고, 참 물건 못파네 싶은 쪽도 있다. 말을 잘하는 봇은 어떨까? 봇이 말을 하는 하나의 대화상대라고 상정한다면, 우리는 인간과 인간의 효율적인 커뮤니케이션을 이해할 필요가 있다.


인간은 협동 원리(cooperative principle)에 의해 대화를 한다고 한다. 

협동 원리는 언어에 의한 의사소통이 원활하게 진행되기 위한 몇 가지 제약으로, 화자와 청자가 원활한 의사소통을 하기 위해서는 상호 협동적이어야 한다는 원리이다. 다음 4가지 룰로 이해될 수 있다.


1. 질(Maxim of quality): 사실이라고 생각하는 것을 말한다. 

2. 양(Maxim of quantity): 상대방이 필요한 만큼 정보를 전달한다.

3. 관련성(Maxim of relation): 진행되고 있는 대화와 관련된 내용을 말한다.

4. 매너(Maxim of manner): 가능한 한 간단하고 명료하게 표현한다.


인간이 협동원리로 대화를 할 때, 인간에 의해 설계된 봇들은 막바로 문제에 부딪히게 된다.



유저가 더 많은 정보를 한꺼번에 줄 걸 예상하라

사람들은 기본적으로 대화에 협조적이기 때문에, 봇이 요구하는 것보다 더 많은 정보를 주곤 한다. 다음 그림과 같은 경우는 아주 자주 벌어진다. 

대부분의 봇은 하나씩 질문하고 그에 따른 답을 하나씩 저장하는 형태로 구성되어 있다. 개발상의 이슈이기도 하고, 자연어 엔진의 문제이기도 하다. 그렇지만 사람들은 내가 가진 정보를 한꺼번에 쏟아내는 경우가 많다. 피자주문하러 전화할때 한번에 하나씩 말하지 않는다. 한 질문에 하나씩 대답하는 것은 '사람'다운 대화가 아니다. "여기 래미안 345동인데요. 슈퍼수프림 하나하고 콜라하나 갖다주세요."가 우리네 대화에 가깝다. 항상 유저가 더 많은 정보를 줄 수 있다고 생각하고 봇을 디자인해야 한다. 


차선을 제시하라

당신이 봇의 대화를 디자인 한다고 생각해 보자. 다음의 답변을 만들어보라. 

만일 당신의 대답이 아주 정중하게 , 

"죄송합니다. 라지는 준비되어 있지 않습니다. 다른 제품을 검색해 보세요"

라면 당신의 대화법은 약간 문제가 있다. 이 대화에서 봇은 유저를 만족시킬 다른 옵션을 찾지 않는다. 나쁜 소식만 전해주고 떠나 버렸다. 

당신이 자주가는 샵의 정말 능력있는 세일즈 매니저들을 떠올려보자.

"지금 이 옷은 사이즈가 없네요. 그럼 라지사이즈가 준비된  AAA, BBB는 어떠실까요? 요즘 인기 있는 제품이랍니다"

그 매니저는 유저의 만족시킬 다른 옵션을 찾는 노력을 한다. 매력적인 말상대는 부정적인 상황에서도 대화를 긍정적으로 이어간다. 협조적인 제스처는 대화를 진전시키기 마련이다. 너무 솔직하게 단답형 답만 하지 말자. 우리에게는 다른 옵션이 분명히 있다.



표현을 다양화하라

다양한 표현은 대화를 풍부하게 한다. 유저는 무언가 더 있을 때 관심을 갖는다. 다양한 표현은 봇이 단조로와 보이는 것을 막아준다. 그러기 위해서는 답변을 랜덤화해라. 몇가지의 다른 대꾸만 해줘도 대화가 살아난다. 유저가 자주하는 질문의 답변에 변화를 줘라. 


이 청바지 얼마야? 라는 질문의 다양한 대답

이 제품에 관심이 있으시군요. 34,500원입니다.
지금 고르신 제품은 34,500원입니다.
34,500원입니다!
김주영님이 선택하신 청바지의 가격은 34,500원입니다. 
정가 44,850원인 제품을 현재 할인하여 34,500원으로 판매하고 있습니다.
가을 맞이 특가 제품을 고르셨군요. 34,500원입니다. 


인간은 똑같은 표현을 하지 않는다. 즐겨쓰는 말투가 있을수는 있겠지만. 



맥락(Context)을 저장하라

대부분의 문장들은 문장 하나만 떼어내, 고립된 곳에서는 이해하기 어렵다. 동일한 문장도 맥락에 따라서 전혀 다른 의미를 갖기도 하며, 어떤 문장은 컨텍스트(맥락)에 의해서만 이해되곤 한다. 

"야, 그거 있잖아. 아니 그거 말고 아까 얘기했던 거!!!" 

이쯤 되면, 아무리 자연어처리가 발전한다 해도 사람의 의도를 봇이 판단하기는 어려운 일이다. 그렇지만 적절하게 컨텍스트를 저장하면 대화의 퀄리티가 급상승한다. 


"이 제품은 가나다 생수입니다"
"이거 얼마야?"
"어느 것의 가격을 알려드릴까요?"
"???"

1) 대명사 : 아까 그거, 이거, 저거 

대부분의 자연어 처리 엔진은 컨텍스트를 지원한다. 봇은 유저의 말을 이해하기 위해 맥락을 트래킹해야한다.  따라서 하나의 주제에 대해서 이야기 하고 있다면 두번째 턴의 대화에서도 대명사를 통해 대화가 이어지게 해야한다. 


2) 팔로업 퀘스천 (추가 질의)

대화를 이어가기 위해서는 이전 대화의 인텐트를 기억하고 있어야한다. 대부분의 대화는 한번만으로 이뤄지지 않는다. 하나의 태스크를 해결하기 위해서는 대부분 몇가지 턴의 문답이 필요하다. 노래를 틀어달라는 요건만 해도, 누구꺼인지, 최신곡인지 특정곡인지, 앨범인지 한곡인지, 유저가 원하는 그 대답을 얻기위한 팔로업 인텐트들이 구성되어야 한다.


3) 스크린(멀티모달 일때) : 왼쪽꺼, 오른쪽 꺼, 두번째, 세번째, 마지막꺼, 

스크린의 환경도 당연히 컨텍스트가 된다. 같이 보고 있는 이미지, 아이콘, 버튼 모두가 컨택스트이다. 이런 것들도 기획단에서 설계가 되어야 한다. 보이스 스피커의 경우는 스크린이 컨텍스트가 되기 어렵지만, 봇과 유저가 같은 스크린을 보고 있는 챗봇, 에코쇼같은 스마트스피커는 당연히 스크린도 컨텍스트에 함께 자리한다. 



적당한 사람을 떠올려 보라

사람과의 대화를 생각해보면 명쾌해지는 대화가, 기계로 치환되는 순간 머리가 굳어진다. 가능한 옵션을 생각해서, 가능한 것만 설계하기 때문이다. 그럴때일수록 깊은 숨을 내 쉰다음에 이 봇이 특정한 사람이라고 생각해 보면 좋겠다. 만약 그 사람이라면 어떻게 답변했을까? 바비브라운 매장 매니저라면 어떻게 했을까? 피트니스센터 매니저라면 어떻게 했을까? 호텔 리셉셔니스트였으면 어떻게 대답했을까? 답을 이렇게만 하고 끝냈을까? 다른 대화를 이어갔을까.


기술적 한계만 생각한다면, 기획이라는게 필요없을지도 모른다. 기술의 한계를 챌린지하고, 한계를 보완해주는 것이 컨버세이션 디자이너의 역할일 것이다. 






젠틀파이에서 챗봇 기획자(컨버세이션 디자이너)를 찾고 있습니다. 챗봇 구조에서부터 UX, 시나리오, 페르소나 개발까지, 기존 챗봇 전문 기획자들과 함께 배우고 나아갈 분들은 지원해주세요. 

신입/경력 모두 채용 기획자 채용공고 



젠틀파이는 텍스트봇, 보이스봇 등의 다양한 챗봇을 제작하고 컨설팅하는 챗봇 제작 전문 그룹입니다.  

경험이 다른 봇을 만들고 싶으시다면, 젠틀파이 hello@gentlepie.com 에 문의 주세요.



제이미의 글과 챗봇 소식을 계속 보고 싶으시다면,

페이스북 챗봇 그룹

제이미 트위터 @jamiepark

이 브런치는 챗봇에 대한 다양한 소식이 업데이트됩니다. 브런치 구독




매거진의 이전글 2018년 스마트 스피커 이용 현황 분석
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari