brunch

You can make anything
by writing

C.S.Lewis

by 손톱을 먹은 쥐 Jan 16. 2022

차량 내 음성 인터페이스 사용자의 특징

인공저능 디자이너

'범주화하기'는 항상 조심스럽습니다. 인간 뇌는 어디서든 패턴을 찾아내려고 하고, 두세 번 정도의 사례만 보고도 어디선가 끌어온 원인까지도 만들어내고는 합니다. 서로 상관없는 위치에 있는 별들을 이어 별자리를 만들어내고 이야기까지 붙이는 것처럼요.

하지만 별자리는 분명히 유용합니다. 재미있기도 하고요. 서로 생각하는 방법이 비슷하니 이런 방식의 중간지점을 만들어내는 것은 세상을 이해하기 위한 이정표로서 충분히 의미 있는 것이겠지요. 잘못된 결론은 경계해야 하겠지만 현업 종사자가 그것을 우려해 아무것도 하지 않는 것은 신중함보다는 게으름으로 이해될 것입니다.

당연한 소리일 수도 있겠지만 여기에서 시작해보려고 합니다.

사용 맥락

운전자는 어떤 맥락에서 음성 인터페이스를 사용할까요? 먼저 기본적인 사용 환경을 살펴봅니다.

사용자의 위치와 방향

연료 주입구는 왼쪽에 있어요

가장 큰 특징은 사용자가 고정된 위치에 있다는 것입니다. 항상 같은 위치와 방향에 있는 상태로 시스템을 사용한다는 것은 지향성 마이크나 빔포밍 기술 등 하드웨어적인 대응을 용이하게 만들어주기도 하지만 대화에서도 유용하게 사용할 수 있습니다. 방향을 기준으로 정보를 줄 수 있는 것이죠. 다른 디바이스에서 대화하는 것과 가장 큰 차이를 만들어냅니다.

목적지가 있는 사용자

낯선 나라의 풍요한 집에서 산다 해도 고향 땅과 부모보다 달콤한 것은 아무것도 없는 법이라오.
- 오디세우스

차량에 탑승한 사람은 운전자가 아니더라도 공통된 목적을 가지고 있습니다. 어딘가로 이동하는 것이죠. 그리고 시트 뒤에 지도책을 하나씩 두고 다니던 과거와는 달리, 아는 길이라도 내비게이션은 대부분 켜 놓은 상태로 운전을 합니다. 그래서 차에게 목적지를 알려주는 과정이 거의 필수적이게 되었지요.

당연히 운전 중이라면 음성 입력은 목적지를 검색할 때 매우 유용합니다. MIT 보고서에 따르면 이 과정이 상당한 인지 부하를 일으킨다고는 하지만, 다른 방식도 부하를 일으키는 것은 마찬가지이며, 인식 모델의 발전에 따라 음성 입력은 더 쉬워질 여지가 있습니다.

그런데 조사해보면 많은 사람들이 운전을 시작하기 전 목적지를 입력한다고 답합니다. 그렇지만 차에서 사용하는 스크린은 아무리 크더라도 사용자 한쪽으로 치우쳐 있어, 입력이 불편합니다. 필기인식, 초성 검색 등 다양한 입력방식도 음성으로 검색하는 것(인식이 잘 된다는 전제 하에서는)에 비하면 너무나도 불편한 방식입니다.

이미 충분한 편의성

사용자의 위치와 방향이 고정되어 있다는 것은 음성 인터페이스를 적용하려는 입장에서 장벽이 되기도 합니다. 많은 기능들이 이미 쉽게 사용 가능하거든요. 운전대의 버튼은 점점 늘어나더니 전투기 조종석처럼 되었습니다. 이미 훌륭한 분들이 고민해 만들어낸 이런 사용자 인터페이스는 간단한 기능들을 버튼 누르기(손끝의 감각만을 이용한) 만으로 쉽게 수행하도록 도와줍니다. 노래 재생/정지, 다음 곡 재생, 음량 조절 등 기능들은 음성으로 동작하도록 만들기는 하지만 버튼에 비해 효용성이 떨어지게 되지요. 그래서 음성 인터페이스가 마음대로 동작하지 않으면 사용자는 버튼으로 하면 되지 않냐고 불평하고는 합니다. 그래서 음성으로 동작하는 기능은 간단한 제스처로 전달할 수 없는 정보를 다루는 데에 집중해야 합니다. 전화를 건다면 '누구'에게, 어딘가로 간다면 '어디'인지 처럼요

말하기도 귀찮은 사람

말하는 것이 어려운 것은 아니지만, 맥락 이해를 기반으로 하는 인터페이스를 디자인하다 보면 이걸 굳이 말해서 요청할 필요가 있는지 의문이 생기는 경우가 있습니다. 다른 디바이스에서도 생기는 문제지만, 차량의 특성상, 위치 정보와 운전자라는 제한사항은 시스템이 '알아서' 할 수 있는 영역을 더 많이 만들어 줍니다. 예를 들어 회사에서 저녁에 차를 탔다면 내비게이션을 집으로 설정하는 것은 사람이 아닌 시스템이어야 할 것입니다. 시스템은 음성으로 상용자의 확인을 받는 식이어야 하지요. 시스템 쪽에서 먼저 말을 거는 시나리오가 필요한 부분입니다.

사실들

Voicebot.ai에서 발표한 자료 중 차량용 음성 비서에 대한 보고서가 있습니다. 주요 내용은 다음과 같습니다. (2020년 미국 기준)

자동차 음성 어시스턴트는 스마트 스피커보다 더 널리 보급되어 있음

운전 중 가장 많이 사용하는 음성 비서 기능은 음악을 듣거나 질문을 하는 것이 아니라 전화를 걸거나 목적지를 탐색하는 것임

차량 내 음성 비서 사용자는 증가 추세이며, 사용량도 늘고 있음

블루투스 연결, 자동차 제조업체의 내장기능, Apple CarPlay가 주도적으로 경쟁 중

여성 운전자가 남성보다 조금 더 많이 사용함

음성 비서 사용 가능성이 가장 낮은 연령대는 가장 어린 집단이며 음성 기능이 없는 저렴한 모델을 소유한 것이 이유

스마트 스피커 소유자가 차량의 음성 기능도 많이 사용함

주요 사용 기능은 말하기, 이동하기, 재생하기 세 가지

음성 비서의 기능에 대해 전부 알지는 못한다고 생각함

튜토리얼이 있었으면 좋겠다고 생각하는 사용자가 다수

음성 기능이 개선되고 있다고 생각함

신차 구매 시 음성 비서를 고려함

브랜드 서비스 외 Apple, Google 등 다른 서비스 교차 이용 가능성 선호

경험에 의하면, 튜토리얼에 대해서는 조심해서 받아들여야 한다고 생각합니다. 사용자가 원하는 것은 '기능을 많은 상태'가 되는 결과이지 튜토리얼을 견디는 과정은 싫어합니다. 비슷하게 뭐라고 말할 수 있는지 도움말을 제공하는 것은 여러 사용성 평가에서 효과적이지 않음이 확인되었습니다. 음성 인터페이스에서 사용자가 능동적(Active)으로 사용해야 하는 도움말은 실패가 예정되어 있습니다. 그럼에도 불구하고 도움말은 있어야 하지만 최후의 수단으로 생각해야 합니다. 기능 별 명령어 예시 리스트를 보여주는 것은 디자이너의 책임 회피입니다.

초기 음성 인터페이스에서는 화면에 예시를 보여주며 '재인' 효과를 겸한 사용자 가이드를 제공하지만, 화면을 보기 힘든 차량 내 인터페이스에서는 이마저도 주요 가이드가 될 수는 없습니다. 결과적으로 차량 내 음성 인터페이스의 도움말은 수동적(Passive)이어야 하는데 문제가 생겼을 때 맥락에 맞게 가이드를 주고 오류에서 복구해나가는 대화를 진행해야 합니다. 시스템이 복잡성을 최대한 끌어안도록 해야지요.

keyword

손톱을 먹은 쥐

VUI 디자이너, 기계와 사람의 대화를 디자인합니다.

구독자 6

작가의 이전글 나 자신을 바꾼다는 것 더 나은 음성 서비스를 위해 필요한 것 작가의 다음글

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari