brunch

You can make anything
by writing

C.S.Lewis

by 바다김 Dec 11. 2020

목소리만 들리는 음성 비서를 그려보면 어떤 모습일까?

디자인 톺아보기 (4)

CHI 2019 Late-Breaking Work에 실린  “What does your Agent look like?” A Drawing Study to Understand Users’ Perceived Persona of Conversational Agent 논문입니다. 같은 연구실 이선옥 박사과정님이 1 저자로, 제가 2 저자로 참여하였습니다.


알렉사, 시리, 구글 어시스턴트와 같은 대화형 에이전트는 이제 우리 일상에 스며들었습니다. 물리 버튼과 기계식 조작이 필요한 다른 제품과 달리 이들은 '인간의 목소리'를 통해 사용자와 소통을 합니다. 그러므로 사람들은 기계의 조작을 학습하는 것 같은 귀찮음을 덜고 자연스럽게 원래 그들이 주변 사람들과 하던 것처럼 대화를 할 수 있습니다. 사람들은 에이전트의 음성을 들으면 무의식적으로 정체성, 나이, 젠더, 학습 수준, 심지어는 사회적 위치까지 상상하게 됩니다.


그러므로 이들의 페르소나를 어떻게 만드는지는 사용자 경험에 큰 영향을 미칩니다.  이들을 단순히 <AI 비서>라고 부르기에는 이들은 비서의 영역을 넘어서 감정 공유나 일상 대화 등 친구의 역할도 일부 수행하고 있습니다. 그래서 에이전트의 형태나 사용하는 사람들에 따라 누군가는 단순한 기계처럼, 몇몇 사람들은 친구나 동반자처럼 생각하기도 합니다. 그리고 아직은 그 수가 적긴 하지만 일부는 영화 'Her'처럼 사랑한다며 감정 고백을 하거나, 아니면 심한 욕을 하며 강한 감정이입을 하기도 합니다. 사람들은 어떻게 에이전트를 받아들이고 있는 걸까요?


우리는 사람들이 에이전트를 느끼는 방식을 시각화하면 어떨까? 하는 궁금증을 가지고 에이전트의 페르소나와 사용자가 느끼는 이미지 사이의 연관성을 찾아보고자 했습니다. 사람들을 모으고, 그들이 생각하고 인지하는 에이전트를 직접 종이 위에 그려보게 한 것이죠. 이는 그림을 통한 분석이 단순히 '헤이 카카오가 친절하다고 느껴요.'라고 말하는 것보다 더 깊은 수준의 사용자 인식을 끌어낼 수 있다는 기대가 있었기 때문입니다. 우리는 아마존 알렉사, 혹은 구글 어시스턴트를 사용하는 31명의 참가자를 모집했습니다. 가장 어린 사람은 만 4세였으며, 가장 나이가 많은 사람은 51세였습니다. 그리고 그들에게 자유롭게 그들이 느끼는 에이전트의 모습을 그려달라고 요청했고, 우리는 이들의 그림을 그림 검사 기법으로 분석 및 추가 인터뷰를 통해 네 가지의 발견점을 찾을 수 있었습니다.




첫 번째로, 에이전트의 목소리는 원래 그들이 말하는 대사 그 자체보다 사용자 인식에 더 큰 영향을 미친다는 것입니다. 


참가자 13명은 그들의 에이전트를 마치 사람처럼 그렸습니다. 위 그림처럼 뾰족구두에, 긴 머리, 치마를 입은 여성이 가장 많이 묘사되었습니다. 그들의 음성 비서가 세련된 여성의 목소리를 내기 때문이죠. 그러나 구글 어시스턴트에게 "너는 남자니 , 여자니?'라고 물어보면 "저는 중립을 유지하려고 노력합니다."라고 대답합니다. 그들이 스스로 어떻게 규정하는지와 상관없이, 사용자들은 목소리를 통해 그 정체를 이미지에 넣는 것이죠. 한 참가자는 "제 구글 어시스턴트는 지적이고, 똑똑한 여자 목소리를 가졌어요. 뭔가 아름다운 여자의 느낌을 줘요."라고 말하기도 했습니다.


두 번째로, 스마트 스피커의 겉모습이 에이전트가 사람이 아니라 그저 스피커뿐임을 인지하게 만듭니다.

8명의 참가자는 자신이 사용하는 기기의 외관과 비슷하게 그림을 그렸습니다. 그리고 그 생김새 위에 의인화된 모습이 덧그려져 있습니다. 목소리에서 느껴지는 사람 같음과 겉으로 보이는 외관의 느낌이 합쳐져서 사람들에게 영향을 미치고 있는 것입니다. 한 참가자는 "가장 눈에 띄는 거실에 스피커를 놓기 때문에, 그 겉모습에 영향을 받지 않을 수 없어요."라고 말했습니다.  현재는 똑같은 목소리에, 똑같은 방식으로 대답을 하는 에이전트라 할지라도 서로 다른 케이스에 씌워져 사용되고 있습니다. 대부분 업계는 목소리의 주인공이 어떻게 대답할지에 많은 신경을 쓰고 있지만, 앞으로 디자이너와 개발진들은 사실은 기기의 외관 또한 사용자에 인식에 큰 영향을 미친다는 것을  기억해야 합니다.


세 번째로, 사용자의 기술에 대한 이해도가 높으면 그들의 음성 비서를 하나의 시스템으로 간주할 수 있습니다. 

개발, 기술에 대한 지식이 높은 참가자들의 그림(왼쪽)과 아이들이 그린 그림(오른쪽)


왼쪽의 그림처럼, 4명의 참가자는 에이전트를 하나의 컴퓨터, 혹은 시스템처럼 그렸습니다. 그들은 알렉사나 구글 어시스턴트를 사람처럼 생각하기보다는 단순히 사람에 의해 설계된 정교한 기계처럼 여겼습니다. 엔지니어로 일했던 한 참가자는 "저는 이미 충분한 배경 지식을 가지고 있기 때문에, 구글의 어시스턴트가 본사 서버실을 통해 저와 소통하는 장면을 생각했습니다."라고 말했습니다. 그들은 자신의 배경 지식을 통해 이미 이들이 어떻게 작동하는지 이해하고 있기 때문에 그들이 사람처럼 행동하는 게 때로는 불편하게 느꼈습니다. 즉, 사용자의 기대에 따라 다른 페르소나의 형태가 필요합니다. 재밌는 로봇 친구 정도로 그림을 그린 15세 이하의 아이들과 기술적 이해도가 높은 어른이 에이전트에 기대하는 바가 너무 다르기 때문입니다.



네 번째로, 딱딱하고 미리 준비한 듯한 대답은 사용자 자신뿐 아니라 모든 사람과 에이전트를 공유하는 듯한 기분을 들게 만듭니다. 

7명의 참가자는 그들의 에이전트가 항상 같은 자리를 유지하는 모습으로 그림을 그렸습니다. 그림 속 에이전트는 같은 대답을 자신과 연결된 모든 사람에게 반복하는 모습을 보여주고 있습니다. 구름과 같은 모양으로 묘사되는 점이 흥미로운데, 마치 에이전트가 높은 곳에서 사용자들을 내려다보는 것처럼 묘사됩니다. 한 참가자는 "저는 구글이 날씨를 비롯해 대부분의 정보를 이미 알고 있다는 사실을 알아요. 그래서 마치 우주에서 저를 돕는 것처럼 느껴집니다."라고 말했습니다.  즉, 에이전트 대답의 다양성 혹은 개인화 정도에 따라 사용자가 에이전트를 자신의 것처럼 느끼는지, 아니면 모두의 것을 공유하는 것처럼 느끼는지 그 정도에 영향을 미칠 수 있습니다.




우리는 이 연구를 통해 대화형 에이전트의 페르소나를 사람들이 어떻게 인지하는지 알아보고자 했습니다. 참가자들이 그린 그림과 디브리핑 인터뷰를 통해 그들이 인지하는 에이전트에 영향을 미치는 요소들을 밝혔습니다. 4가지 발견점을 토대로, 앞으로 디자이너가 사용자에게 적합한 페르소나를 만드는 데 도움이 되기를 희망합니다.

작가의 이전글 자율주행 상태를 보행자에게 알려도 될까?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari