brunch

You can make anything
by writing

- C.S.Lewis -

by 김선우 Oct 09. 2017

음성 인터랙션에 대한 세 가지 의문 (2017년 현재)

당신은 시스템과 진짜로 대화할 수 있나요?

    바야흐로 "음성-AI-스피커" 전쟁의 판이 형성됐다. 아마존의 에코를 시발점으로 구글 홈, 애플 홈팟에 이어 국내에는 SK NUGU, KT 기가지니, 네이버 웨이브, 카카오 미니가 합류하면서 춘추전국시대를 맞이했다. 개인적인 의견으로는 해외는 아마존 에코와 구글 홈의 2강 체제가 형성되고, 국내는 네이버 웨이브와 카카오 미니의 2강 체제로 좁혀질 것 같다. (이유는 오프라인에서 만나면 논의해 보아요~)

    그런데...이러한 음성 인터랙션에 대해 근본적인 의문점이 발생하여 글을 써 보고자 한다. (꽤 오랜 시간 Voice User Interface를 설계해온 사람의 시각에서…^^)

<요즘 이 바닥이 전쟁이긴 하다...>

첫 번째 의문,

당신은 시스템을 인격적으로 받아들이고 대화할 수 있는가?


    음성 인터랙션의 대명사는 언제나 아이언맨의 '자비스'와 영화 Her의 사만다이다. 주인공은 시스템과 자연스럽게 대화하고 농담하며, 시스템에게 배우거나 혼을 내기도 한다. 그러나 현실을 보자. ‘T맵-NUGU’와 ‘KT기가지니’ TV 광고를 보자면 손발이 오그라든다. (제품 개발, 광고 기획하신 분께는 죄송합니다)

TV광고뿐 아니라 시스템에서 보여지는 안내 가이드도 좀 억지스러운 느낌이 있는데, 그 사례와 시스템 안내는 하나같이 이렇다.

“A야, 홍길동에게 전화해줘.”
“B야, 비오는 날 듣기 좋은 노래 재생해 줄래?”

    시스템을 처음 구매해서 사용하면 위와 같이 말해볼 것이고, 별 문제 없이 실행될 것이다. 그러나 계속해서  “~해 줄래?”, “~해 줘”라고 말하는 사용자를 본 적은 없다.

<정말 죄송하지만, AI-스피커 광고 볼 때마다 민망하다...>

    “~해 줄래?”, “~해 줘” 라고 말하는 것은 상대방에게  무엇인가 부탁하는 것이다. 얼핏 보면 굉장히 자연스럽고 예의있어 보이지만, 한국어의 저 표현은 상대방이 나와 '동등한 위치의 인격체일 때' 가능한 표현이다. 여기에 첫 번째 의문을 제기한다. 과연 당신은 음성-AI-스피커를 인격체로 받아들이 수 있는가? 이것은 영어와 한국어의 차이에서 비롯된 것인데 다음의 사례를 보자.

1) Call Hong-Gildong = 홍길동에게 전화
2) Please, Call Hong-Gildong = 홍길동에게 전화해줘
3) Can you call to Hong-Gildong = 홍길동에게 전화해줄래?

    여기에 가장 적합한 영어는 1번인 “Call Hong-Gildong” 이며, 한국어로는 “홍길동에게 전화”가 맞다. 그런데 한국인 정서상 이렇게 하면 왠지 친근하지도 않고, 건방져 보이고, 너무 딱딱한 느낌적인 느낌이 있다. 결국 수정된 대화 방식이 부탁하는 형태인데 무생물에게 부탁하기엔 아직은 어색하지 않을까?


두 번째 의문,

당신은 근처에 사람이 있을 때에도, 시스템에게 대화형으로 말할 자신이 있는가?


    현실적인 상황을 가정해 보자. 집에 이성 친구를 초대했고 조금 어색한 분위기가 흐르고 있다. 이 때 음성-AI-스피커에게 “B야, 재즈랑 피아노곡 재생해 줄래?” 라고 말할 수 있는가? 상상해보자면 꽤나 민망한 상황이다. 옆에 제 3자가 있는 상황에서 무생물(시스템)에게 인격적인 대화나 명령을 한다는 것이 아직 정서상 어색하다.

<그런 것이다..>

    이 모든 어색함을 해결하는 방법은 한가지다. 다음과 같이 ‘검색어 방식의 명령조’로 하면 된다. 제발 억지로 대화형을 만들지 말아줬으면 한다.

“B, 비오는 날 듣기 좋은 노래”
“B, 오늘 오후 날씨”



세 번째 의문,

당신은 진정, 당신의 모든 것을 꿰뚫어 행동하는 비서 시스템을 원하는가?


    많은 사람들이 음성-AI-스피커에 대해 ‘내가 말하면 한 번에 알아듣는 비서’ 수준의 높은 AI를 원하고 그렇게 광고하고 있다(물론 현실은...). 여기서 ‘한 번에 알아 듣는’이란 ‘나의 의도까지 파악하는’ 것을 의미한다. 이제 세 번째 의문이 제기된다. ‘진정 당신의 의도까지  파악하는 시스템을 원하는가?’.

<당신의 의도가 완벽히 파악된다면, 이미 트루먼쇼의 주인공이다>

    많은 사람들이 빅브라더를 경계하면서 빅브라더의 수준의 서비스를 원하는 모순된 상황이 벌어지고 있는 것이다. 만약 그 수준을 원하지 않는다면, 확인을 위해 계속해서 질문하고 답변하는 불편함을 감수해야만 하는데, 그 절차는 현실과 똑같다는 사실을 기억해야 한다. 결코 시스템은 한 번에 해결해 주지 않는다. (일정 부분의 자동화는 해 줄 수 있다)


일상의 대화

나: 철수야. 나 핸폰 두고 나와서 그러는데 길동이한테 전화 좀 해 주라.

철수: 아 그래? 잠깐만...그런데 홍길동 말하는거냐 고길동 말하는거냐?

나: 아, 홍길동이

철수: 알았어. 근데 길동이가 핸폰 2개 갖고 있나보다. 어디로 걸어야 하냐?

나: 아, 아무데나 걸면 돼.

철수: 알았어.


시스템과의 대화

나: A(시스템 이름), 길동이한테 전화.

시스템: 홍길동, 고길동 2명이 있습니다. 어느 분께 전화를 걸까요?

나: 홍길동

시스템: 홍길동 님에게 2개의 휴대폰 번호가 있습니다. 어떤 번호로 전화를 걸까요?

나: 아무데나.

시스템: 홍길동 님에게 전화를 연결합니다.


일상의 대화와 시스템과이 대화의 단계를 결과적으로 동일하다.


어떻게 접근할 것인가?


    분명 음성 인터랙션은 유용하고 편리한 방식이다. 그러나 어떠한 인터랙션도 실제 인간이 느끼는 감각과 통념의 범주를 벗어나기 어렵다는 사실을 기억해야만 한다.

    사람의 대화는 수많은 커뮤니케이션 오류가 존재한다. 간단하게는 잘못된 언어 전달부터 복잡하게는 언어는 정확하게 전달되었으나 의미가 왜곡되는 경우 등이 있다. 또한 음성정보는 휘발성이 강하여 쉽게 잊혀지고 왜곡되기 쉬운 특성을 지닌다. 따라서 실생활에서도 중요한 것은 기록을 남기고, 물리적으로나 시스템적으로 보관하도록 권장된다.

<많이들 알지만...대화에서 언어의 역할은 생각보다 적다>

    대화를 기록으로 남길 때에는 여러가지 감각을 동시적으로 사용하게 된다. 누군가의 요청을 음성으로 받아들이는 청각, 그것을 손으로 쓰거나 키보드를 두드릴 때 사용하는 촉각, 그것이 정확히 기록/입력 되었는지 확인하는 시각. 총 3가지 감각을 통해 반복적으로 확인하는 것이 인간이다.

    따라서 음성 인터랙션이 단일 채널로 존재한다면 완벽할 수 없고, 완벽을 기대해서도 안된다. 그러나 많은 영화와 광고가 마치 음성 인터랙션을 사용하면 완벽할 것 같다는 착각을 불러일으키게 한다. 그래서는 안된다.

    진짜는 시각과 촉각이며, 음성은 보조적인 수단일 뿐이다. 여기에 ‘보조적인 수단’은 시각과 촉각이 최종으로 확인하기 전에, 귀찮은 절차들은 간소화 해주는 역할만 수행한다는 의미이다. 음성은 그 불확실성으로 인해 결코 최종 결정과 확인을 할 수 없는 방식이다.


현 시점(2017년) 음성 인터랙션의 역할은 다음과 같이 정의하고자 한다.

    1) 검색 입력 단계 감소: 음악 검색, 내비게이션 목적지 검색

    2) 타이핑 단계 감소: 음성을 통한 문자 입력

    3) 패턴이 정형화 되어 있는 정보 검색: 날씨, 온도, 시간, 스케줄 등

    4) 설정이 완료된 복합 동작: 홈IoT, 특정 대상 컨텐츠(유아), 특정 대상 쇼핑 등


서비스는 계속 확장 되겠지만, 결국 설정은 스마트폰에서 하게 될 것이다.


그래도 이 정도 기대는 해 본다.


    나와 공존하는 다음 세대에게는 음성 인터랙션이 과연 일상적인 인터페이스로 자리매김할 수 있을까? 지금과 같은 기술의 흐름이라면 가능할 것으로 보여진다. 나조차도 국내 AI-스피커인 네이버 웨이브나 카카오 미니를 구매할 의향이 있고, 내 아이들은 그 사용에 익숙해 지고, "~해 줄래", "~해 봐" 등의 언어를 사용할 수도 있다. 도한 많은 정보를 음성으로 검색하거나 음악을 듣고 시스템에게 질문할 것이다.

    그러나 인간의 감각을 되돌아보면 음성은 여전히 보조적인 수단으로 남을 것이며, 중요한 판단의 결정은 시각과 촉각을 통해서 이루어질 것이라 믿고 있다.


※ Post Script!!

분명 이 글을 여기까지 읽지 않고 Facebook에서 "좋아요"를 눌러주시는 분들도 있을 것이다.

공감하신다면, 응원의 댓글과 공유 하나가 작가에게는 큰 힘이 됩니다.


Facebook : https://www.facebook.com/anitooni

E-Mail : anitooni@gmail.com

매거진의 이전글 네이버 AWAY의 등장과 나의 생각 #2

매거진 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari