brunch

You can make anything
by writing

C.S.Lewis

by Pizza Kim Aug 27. 2017

대화 디자인: 같은 언어로 말하기 (번역)

VUI 디자인에 혁명을 가져올 수 있는 인간 대화의 여섯 가지 원칙


이 아티클은 디자인 및 영어 공부 겸 Google’s Conversation Design Team의 Creative Lead인 James Giangola가 작성한 ‘Conversation Design: Speaking the Same Language를 원작자의 동의하에 번역 및 게시한 글입니다. 약간의 초월 번역과 문맥에 맞게 의역한 것, 심히 거슬리는 오역들이 있을 수 있습니다.

읽어주셔서 감사합니다 ☻






기존의 스와이프, 탭, 클릭 등의 한계를 뛰어넘은 차세대 인터페이스는 훨씬 더 자연스러운 시그널과 미묘한 뉘앙스를 내포한 '인간의 언어'일 것입니다. 새로운 음성 인터렉티브 시대에는 기존의 메타포와 GUI 설계 기법이 단순하게 적용되기는 어려울 것입니다. Voice UI 디자인의 새로운 흐름은 우리에게 가장 익숙하고 잘 알고 있는 커뮤니케이션 시스템인 '대화'로 시작해야 합니다.


대화는 매우 복잡하고 체계적인 매개체로, 그 대화 원리를 정의하는 것은 훨씬 더 미묘하고 흥미진진합니다. 우리는 다른 사람들과 대화할 때 대화의 복잡성을 당연하게 여깁니다. 그건 이미 습관이죠. 하지만 대화 내용을 설계 시, 숨은 의미와 문맥을 이해하지 못하는 대화는 실망스러운 사용자 경험을 만들 것입니다. 그리고 음성은 사회적 정체성의 개인적인 지표라서, 그 관련성은 상당히 높습니다. 사용자들은 제대로 설계되지 않은 VUI에 대해 '바보 같거나 멍청한' 느낌을 받고, 다시 말을 걸어보는 것을 피하게 됩니다.


이제 더 이상 그럴 필요가 없습니다. 제대로 진행되고 있는 대화 내용을 유지하거나, VUI디자이너가 새로운 시대의 손쉬운 인간 중심 UI를 처리하는데 도움이 되는, 일상의 대화 원칙에 기반한 6가지 규칙을 소개합니다.




1. Give your VUI a personality

VUI에 개성(성격)을 부여하자



단순한 음성 기술 프로그램에 개성이 필요치 않다고 생각할 수 있습니다. 하지만 이건 '필요'에 관한 문제가 아닙니다. 아래의 첫 번째는 정체불명의 어시스턴트 캐릭터가, 두 번째는 디자인을 통해 만들어진 자아를 가지고 있는 두 개의 달력 앱을 비교해 보세요. 


이 VUI의 퍼소나는 정체불명의 캐릭터 (Siri..? 제일 익숙한.. 느낌적인 느낌)



이 VUI의 퍼소나는 뭔가의 자아가 디자인 되있음



우리가 계획하던 말던 모든 목소리는 퍼소나를 반영합니다. 첫 번째 예시 영상과 같이, 특별한 퍼소나 없이 디자인된 VUI는 '친절함'과 '도움이 되는' 등의 성격 특성에서 일관되게 낮은 점수를 얻었으며 '지루한' 항목에서는 높은 점수를 받았습니다. 


수십만 년의 진화 덕분에 인간은 성격적 특성면에서 언어를 평가할 수밖에 없습니다. 심지어 스마트 워치나 GPS 시스템이라 할지라도 말입니다. 이것은 저의 개인적인 의견이 아닙니다. Labov(1964)등의 사회 언어학자들은 최소한의 음성 샘플만으로도 연사의 성격에 대한 인상을 연출할 수 있다는 사실을 잘 설명해줍니다. 우리는 사람들이 내는 소리에 따라 어떤 사람인지 판단하는 전문가로 진화해 왔습니다.


Giles와 Powesland(1975)의 주목할 만한 연구에서, 선생님들은 세 가지 자료만을 가지고 8명의 학생들을 가늠해보도록 부탁을 받았습니다. 세 가지 자료는 '필기 샘플, 사진 한 장, 녹음된 목소리 샘플'이었습니다. 결과는 아주 놀라웠는데, 학생의 필기 샘플과 사진에서 안 좋은 인상을 받은 것보다 목소리 샘플에서 받은 호감을 갖게 하는 인상이 더 중요하다는 것이었습니다. 반대로, 목소리 샘플에서 부정적인 인상은 필기 샘플과 사진에서 긍정적인 인상을 무시했습니다. 


다른 연구에 따르면, 우리는 친절함, 정직, 신뢰감, 지능, 교육 수준, 시간 엄수, 관용, 낭만적이고, '특권 의식'이 있음, 취업 적합성 등에 관하여 말하는 것에 의존한다는 것을 보여주었습니다. 즉, 말하기는 매우 강력하고 효과적입니다.


시사점: 

VUI의 퍼소나를 정체불명 상태로 두지 마세요. 맨 처음부터 브랜드를 대표하는 이상적인 직원을 만듭니다. 그들이 뭘 좋아하니? 그들이 어떻게 소리를 내야 합니까? 가장 중요한 것은 어떻게 행동하는가? 이 개인 성격을 앵커로 사용하여 사용자 경험을 쌓고 친숙한 일관성을 부여하십시오. 퍼소나 디자인에 대한 자세한 내용은 'Actions on Google'을 방문해보고, 'Crafting a Character'에서이 코드 랩을 확인하십시오.





2. Move the conversation forward

대화를 진전시키자



일상적인 대화에서도 '응' 또는 '아니'로 단순한 대답을 요구하는 질문이 많이 있습니다. 그러나 그 질문들은 실제로 더 많은 정보를 요구하고 있습니다. 다음은 두 가지 예입니다.


"누가 파티에 오는지 알아?"라는 질문에, 단순한 "예쓰" 또는"놉"는 대답이 아닙니다



"노래를 불러 줄 수 있어?"라는 질문에 '응' 또는 '아니'라는 말은 대화의 내 기대에 맞지 않습니다



왜 이 화자들이 비협조적인 것처럼 보이는지 궁금할 것입니다. 이 이유는 Maxim of Quantity라는 대화의 핵심 룰을 어겼기 때문입니다. 이 Maxim of Quantity의 원리에 따르면, 화자는 상호 작용의 목적을 위해 필요한 만큼의 정보를 청취자에게 제공합니다. 따라서 화자의 질문의 문자 그대로의 의도를 다룬다고 해도, 대화를 진전하지 않으면 상호 작용은 만족스럽지 않을 것입니다. 위의 예시들에서, 우리는 누가 파티에 오는지 절대 알지 못하며, 나에게 노래를 불러주지 않는 충분한 이유를 들을 수 없습니다. 


이 화자들이 우리에게 더 많은 것을 원하는 것과 같이, 가상의 어시스턴트도 마찬가지 일 수 있습니다. 사용자가 만족하지 않는 가격의 급등에 대한 상황을 대처하는 두 가지 다른 방법을 비교해보세요. 



이 VUI는 대화를 진전시키지 못하게 하면서 상호 작용을 중단시키죠



이 VUI는 사용자에게 더 많은 옵션을 제공하며, 대화는 자연스러운 대화처럼 진행됩니다



확실하게 두 번째 VUI의 퍼소나가 더 능숙한 느낌이 들며 호감이 갑니다. 하지만 단순히 대화를 진전시킬 만큼 사회적으로 지능적인 충분한 어시스턴트는 아닙니다. 그리고 이런 본능은 숨길 수 없습니다. 예로 대화를 진행하고자 하는 사용자의 대화의 예를 들어보겠습니다. 마치 한 사람과 대화를 나누고 있는 것처럼요.



이 사용자는 일부 개인 정보에서 수치를 추론할 수 있는 부분을 예상할 수 있다



인식 문법이 오직 "2"와 같은 숫자만을 예측하도록 설계되었다면, 이 사용자는 정보를 얻기 위해 오류 프롬프트에 빠질 것입니다. 이 같은 응답이 인식기에서 처리할 수 없는 경우 "(상승하는 억양으로)죄송합니다만, 몇 분이신가요?"와 같은 쉬운 대화 재송신으로 대화를 다시 시작하는 것을 고려해야 합니다. 연구에 따르면, 오류의 경우 사용자는 간단한 재송신만 하면 됩니다. "제가 이해를 못해서 죄송합니다. 당신의 파티에 몇 분이 오시는지 말씀해주세요. 예시로 "2명''이라고 말할 수 있습니다."라는 로봇의 시끄러운 소리에 주의를 기울일 필요가 없습니다. 


시사점: 

대화 흐름을 설계할 때, 글자 그대로를 넘어 의미를 보세요. 당신의 VUI가 사용자로부터 얻을 수 있는 자세한 정보를 제공함으로써 대화를 계속할 수 있는 순간을 예측하십시오. 또한 이 업계에서 '인식 오류'로 생각하는 것은 실제로 협력적이고 유익한 기여를 제공하는 우리의 인간적인 충동의 여파임을 깨닫습니다.





3. Be brief, be relevant

관련성을 만들자



말하기는 글쓰기와 달리 시간의 흐름에 불가분의 구속을 받습니다. 듣는 사람을 더 길게 붙잡아 둘 수록, 그 사람은 말을 받아들이는 것에 머리를 쓰는 일이 늘어납니다. 우리는 단기 기억에 과도한 부담이 될 때까지 정신적으로만 많은 정보를 처리할 수 있습니다. 듣기는 종종 능동적이고 생산적이라고 여겨지는 말하기와 대조적으로 '수동적인' 기술로 간주됩니다. 실제로 듣기는 많은 노력이 생깁니다. 따라서 VUI가 청자에게 듣기를 잠시 멈추고 자신의 차례를 갖도록 하는 것이 중요합니다. 아래의 두 가지 예를 비교하자면, 첫 번째의 VUI는 청자를 압도시키고 두 번째 VUI는 분명하고 간결합니다:


이 VUI는 비행 정보로 청자를 압도합니다;;



이 VUI는 자연스럽고 기분 좋은 인터렉션을 활용해 짧고 간결합니다

 


글쓰기의 '영구성'과 다르게 말은 일시적이며 즉각적입니다. 또한 음성 신호는 선형적이며 GUI처럼 화면을 훑어볼 방법이 없기 때문에, VUI에는 애매하게 관련성 없는 정보는 지루합니다. 친절한 사용자에게 유익하지 못한 정보를 알려줌으로써, 잘 설계되지 않은 VUI는 사용자의 소중한 시간을 낭비하게 됩니다. 나는 무관한 수다는 고객 서비스 앱을 혐오하게 하는 가장 큰 이유라고 주장합니다. 많은 VUI 디자이너와 개발자들은 프로모션 메시지와 구매를 설득할 때와 지시를 내릴 때 사람들에게 부적절한 메시지를 속여 팝니다. '지역 번호를 포함하는 10자리 전화번호를 입력하는 것'과 같은 명확한 지침에 대해서 완전히 잘 알고 있을 것입니다.


사용자의 이익에 대한 통찰은 핵심입니다. 사람들은 추가 시간이 사용되거나 물건을 찾거나 일을 끝내는 것을 위해 시키는 대로 하는 것으로 고마워하지 않습니다. 연구에 따르면 VUI가 같은 일을 완료하는데 대안이 되는 명확한 이익을 제공하지 않으면, 사용자는 이 방식을 피할 것입니다. 결국, 요점이 무엇이냐 하면! 성공적인 VUI 디자인은 관련성과 편의성 등의 혜택을 제공해야 합니다.


시사점:

메시지를 짧고 관련성 있게 유지하십시오. 사용자가 순서를 바꿀 수 있게 하십시오. 사용자가 확실하게 혜택을 받을 수 있을 때까지 필요 이상의 세부 사항들을 넣지 마십시오.




4. Leverage context

컨텍스트를 활용하자



우리는 컨텍스트에 관심을 기울여야 합니다. 좋은 대화 참가자는 대화를 계속 진행하고, 이전 순서가 상호작용에 기억하며, 사용자의 환경에 대한 인식을 보여줍니다. 예를 들어, 사용자가 외국에 있을 때, 심한 폭풍우가 몰아치고 있거나, 오늘 몇 가지 설정을 바꾸기 위해 이미 세 번의 시도를 했는지를 아는 것입니다. 


이와 같이, VUI 디자인은 가능한 한 많이 사용자의 컨텍스트를 활용해야 합니다. 사용자가 그들의 정보를 가진 인터페이스를 맡긴다면, 그것은 예로 사용자 이미 수행한 작업, 사용자가 이미 알고 있는 것, 대화 상자에 담겨 있는 먼저 대화한 내용에 근거하여 반응해야 합니다. 문맥에 주의를 기울이지 않으면, 지능형 어시스턴트의 효화를 매우 떨어질 것입니다. 보통 널리 알려져 있는, 가장 싫은 예는 "메뉴 옵션이 최근에 변경됨에 따라 주의 깊게 들어주십시오"와 같은 VUI의 요청입니다. 다음에 다른 예도 있습니다:


도울 마음이 있다면, 이 메세지는 시간이 많이 걸리고 부적절하다



'키치한 VUI'라고 불리는 이런 종류의 메시지는 사용자의 컨텍스트를 무시하기 때문에 완전 짜증 납니다. 인정할 수 있는 모든 예시를 생각해보세요. 사용자는 몇 개월 전에 전화를 걸었었고, 다른 옵션의 VUI 디자인을 들어 본 적이 있었다고 가정합시다. 추가로 그전에 들은 다른 VUI를 기억한다고도 가정합시다. 프롬프트가 사용자의 컨텍스트를 무시하기 때문에 그것은 결국 듣는 모든 사용자들과 관련이 없고, VUI에서 '부적절함'이 사용자에게 처벌받는 느낌을 주는 방법과 이유에 대해서는 이미 이야기했습니다. 


시사점:

우리는 개인화, 인공 지능 및 데이터 기반 혁신에 관해이 업계에서 많이 이야기합니다. 그러나 대화의 흐름을 지속적으로 추적하고 사용자의 컨텍스트를 파악하는 것은 인간 지능에 대한 인식을 효과적으로 향상할 것입니다. 





5. Direct the user’s focus through word order and stress

단어 순서와 강세의 배치를 활용해, 사용자의 기대치를 겨냥하자



VUI가 말한 내용에 대한 인식은 개별 메시지를 구성하는 방법을 결정하는데 중요합니다. 그렇지 않은 경우, '추적 관리'에 실패하면 청취자의 이해 과정에 부담을 주어 모호한 불편함을 유발할 수 있습니다. 존재하지 않는 날짜에 항공편을 예약하려는 사용자의 요청에 응답하는 여러 가지 VUI의 두 가지 예를 들어보십시오:


이 기록은 이전에 새로운 정보를 공개하면서, 일반적인 대화의 장을 깹니다.



이 기록은 새로운 정보를 문장의 '맨 끝에' 알려줍니다.



왜 첫 번째 녹음은 이상하고 로봇의 말처럼 들리는 반면, 두 번째 녹음은 대화식으로 보입니까? 이것은 End-Focus 원리입니다. 이 규칙에 따르면, 상당히 단순화된 규칙을 쓰는 사용자들은 정보가 어떻게 표현되는지에 대한 정보에 무의식적인 기대를 가지고 있습니다. '새로운' 정보는 기본적으로 문장의 끝에 또는 그 근처에 오며 '오래된' 정보 앞에 옵니다. 예를 들어 방금 들었던 예에서 '새로운' 정보는 "30일"이라는 느낌이 들고 느껴지고 적절하게 강조되었습니다. 이상하게 들리는 버전에서, 오래된 정보 즉 '6월'이라는 주제는 청취자에게 새로운 정보인 것처럼 잘못 전달되었습니다. 자연스럽게 들리기 위해서는, 문장의 끝에서 강조하거나 말아야 합니다. 


End-Focus 원리의 위반은 상호 작용과정에서 과도한 마찰을 일으킵니다. 그러나 정보가 어떻게 구성되어야 하는지에 대한 사용자의 기대를 존중함으로써, 사용자 경험이 보다 직관적으로 느끼게 만들고, VUI가 정보를 정확하게 들은 것을 확인시켜주는 추가 이점을 제공합니다. 


알려진 정보를 사용자가 올바르게 듣고 있다는 사실을 인지하고, 기술에 대한 신뢰를 강화할 수 있다


이 예시는 오래된 정보(인도의 PM)를 먼저 넣음으로써 사용자가 '인도의 PM'이라는 말을 '이탈리아의 PM'이 아니라 '인도의 PM'이라고 바로 들었음을 알 수 있습니다. 뒤에 오는 (잘못된) 이름에 주의를 기울일 필요는 없습니다. 


시사점:

중요한 내용에 사용자의 주의를 집중시키려면 단어 순서 및 강세의 배치에 대한 기대치를 활용하세요.  VUI의 인물이 Star Wars의 Yoda를 기반으로 하지 않는 한 가능하면 새로운 정보 앞에 알려진 정보를 넣으십시오.





6. Don’t teach 'commands' — speaking is intuitive

'명령'을 가르치지 말자 — 말하기는 직관적이다



제가 생각하는 전형적인 아마추어 VUI의 극혐 포인트 중 하나는 사용자에게 말하는 방법을 '명령하는' 것입니다. 아래 두 가지 예가 있습니다:


사용자에게 커뮤니케이션 방법을 가르치며, 이러한 터치 스크린 인터페이스의 전형적인 메세지 설명을 모델링한다



이러한 메시지들은 사용자가 영어 사용법을 배워야 한다는 것을 암시합니다. 그렇지 않다면 VUI는 이러한 지시를 주지 않을 것입니다. '동사 말하기, XX 명령', '명사, YY 말하기 또는 ZZ 하기' 등과 같은 이런 스타일의 프롬프트는 누름단추식 고객 서비스 응용 프로그램의 흔적입니다. "기술 지원은 1을 누르십시오. 지불 및 청구서 수신은 2를 누르십시오...." 억지스러운 예전의 음성 서비스 세계에선 이 메시지는 유익할 수 있습니다. 왜냐하면 '1'이 '기술 지원'을 의미한다는 것을 알지 못했기 때문입니다. 사용자는 개발자나 디자이너가 해시 키에 어떤 의미를 할당한 지에 대한 직관력이 없습니다. 그러나 VUI의 관점에서 볼 때, 이러한 요구는 터무니없는 것처럼 들립니다. 사용자에게 VUI를 제공하는 전체적인 포인트, 실질적인 이점은 '말하기'가 직관적이라는 것입니다. 그것은 배울 필요가 없습니다. 


이러한 누름단추식 프롬프트와 대화형 대안을 비교해 보세요.


이 프롬프트는 친숙하고, 편안하며 자연스러움을 전달하기 위해 대화형 구조를 활용한다



간단하고 직관적인 프롬프트에서 어려움을 겪는 사람을 상상하기는 어렵습니다. 만약 사용자들이 어려움을 겪는다면, 프롬프트의 재전송으로 문제를 해결할 수 있습니다. 우리는 이미 간략하고, 관련성이 있으며, 컨텍스트를 활용하는 것에 대해 이야기했습니다. 다시 한번, 필요한 경우에만 오류를 처리하십시오.


시사점: 

VUI에서 '가르치는 명령'을 피하세요. 만약 명령을 설명해야 한다거나 무언가 잘못된 것이 있다면, 처음부터 다시 시작하세요. 명령어를 넣는 대신, 질문을 하고 사용자가 친숙한 음성을 사용할 수 있는지 확인해 보는 게 어떨까요? 바로 그게 '대화'니까요!



채팅 봇, 어시스턴트 앱이 대중의 눈길을 사로잡았으므로 이제는 대화가 성공적인 사용자 경험의 열쇠라고 널리 알릴 수 있는 기회가 왔습니다. 그것은 단순히 'you are' 대신에 'you're'이라고 말하고, 'oh'나 'Thanks'라고 말하거나 아이스크림에 대한 의견을 말하는 것을 뜻하는 게 아닙니다. 대화는 자연의 가장 위한 걸작들 중 하나이며 소리를 통해 의사소통하는 가장 강력한 수단입니다. 우리는 인간의 인종 자체만큼이나 오래된 규칙들을 본떠서 우리의 상호작용을 모델링하지 않을 것입니다. 엄밀히 말하자면, 그 첫 단계는 궁극적으로 가장 중요한 '대화가 무엇인지'를 깨닫는 것입니다. 


원문의 자료 및 추천 도서 ›››

Voice User Interface Design by Michael Cohen, James P. Giangola and Jennifer Balogh
The Social Stratification of English in New York City by William Labov (PDF)
Speech Style and Social Evaluation by Howard Giles and Peter PoweslandThe Media Equation: How People Treat Computers, Television, and New Media Like Real People and Places by Clifford Nass and Byron Reeves“Logic and Conversation” by H. P. Grice (PDF)
A Concise Grammar of Contemporary English by Randolph Quirk and Sidney Greenbaum






본문 내용을 바탕으로 좋은 VUI를 만들기 위한 6가지 원칙을 요약하면,

1. Give your VUI a personality (VUI에 성격을 부여하자)

2. Move the conversation forward (대화를 진전시키자)

3. Be brief, be relevant (관련성을 만들자)

4. Leverage context (컨텍스트를 활용하자)

5. Direct the user's focus through word order and stress (단어 순서와 강세의 배치를 활용해, 사용자의 기대치를 겨냥하자)

6. Don’t teach 'commands' — speaking is intuitive ('명령'을 가르치지 말자 — 말하기는 직관적이다)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari