brunch

You can make anything
by writing

C.S.Lewis

by X PLEAT Apr 04. 2017

매끄러운 경험을 주길 바랬던 음성인식 AI뱅킹 기획

서비스 디자인랩 김현경 선임


2017년 UX 핫 트렌드로 대화형 인터페이스(Chatbot)와 인공지능(AI)을 뽑을 수 있다. 영화 <아이언맨> 자비스, 그녀 <Her>의 사만다는 인공지능 기술을 통해 인간과 어려움 없이 대화를 나눴다. 인간이 필요한 정보와 요구를 음성을 통해 인식하고 해결해줬다. 이 영화 같은 이야기는 국내 금융권에서도 시작되었으며, 그 시작에 우리은행 음성인식 AI뱅킹 소리(SORi)가 앞장섰다.


영화의 이야기를 현실 서비스에 녹이는 과정은 결코 순탄하지 않았다. UX 디자이너가 사용자들에게 아주 매끄러운 음성인식 AI뱅킹 경험을 전달하기 위해 어떠한 부분에 집중하였는지 우리은행 음성인식 AI뱅킹 소리(SORi) 사례로 함께 살펴보려고 한다.

약 2달간 야근요정으로서 최선을 다하여 야근을 수행하였습니다.



배경 : 음성 기반 서비스 구현 요소

우리은행 음성인식 AI뱅킹 소리(SORi)는 시나리오 기반 단순화된 대화형 서비스이다. 

음성을 기반의 서비스기 때문에 음성-문자 자동변환(STT, TTS) 시스템과 텍스트 분석(TA) 시스템을 이용한 음성인식 기술을 적용해 고객과 인공지능 비서가 대화하듯 구현하는 것이 핵심 목표였다.

· 음성 입력:STT(Speech To Text) ▶  사용자 발화를 텍스트로 인식하여 화면 출력
· 음성 출력:TTS(Text To Speech) ▶  시스템에서 출력된 텍스트를 음성으로 읽어줌
· TA(Technical Architecture): 텍스트 분석으로 사용자의 문장에서 ‘~에게’, ‘~을’, ‘~를’, ‘~해줘’, ‘~요청해’등의 어미 제외 DB에 저장된 Keyword Mapping 사용자 발화 내용을 분석함




1.    Flow의 중요성

우리은행 음성인식 AI뱅킹 소리(SORi)는 대화형 인터페이스(Chatbot) 형태로 이루어져 있어 사용자의 패턴이나 의식 흐름에 대한 파악이 핵심이었다. 때문에, Flow에 가장 먼저 집중하여 서비스의 이야기, 서비스와 사용자가 만나는 이야기를 잘 풀어 신서비스를 이용하는 사용자에게 긍정적인 경험을 주려고 하였다.


1-1. Service Flow 

Service Flow 작업을 프로젝트 최초에 선행 작업하여 사용자 서비스 진입 상황, 동기, 경험을 예측하여 맥락적인 시나리오를 작성하였다. 사용자가 첫 진입부터 난관에 부딪치지 않도록 서비스 이용방법에 대하여 가이드하였다. 또한 서비스 사용 중 발생할 수 있는 실수나 실패에 고객이 당황하지 않고 끝까지 원하는 목적을 달성할 수 있도록 가이드하여 신서비스를 이용하는 사용자의 입장을 이해하고 접근하려고 노력하였다.


1-2. Task Flow

Task별 Flow를 구체화하여 서비스를 어떻게 이용하고 문제점을 대면하는지에 대하여 집중하였다. 각 금융거래(Task) 별 프로세스를 나열하여 등록사항을 입력하도록 유도하였다. 이 과정에서 등록사항이 많은 업무는 사용자의 이탈 가능성이 높아지기 때문에 제외하였다. 그중 환전이 대표적인 사례였다.

ex) 송금: 3번 Process(수취인+금액 입력 ▶ 인증  ▶송금정보 확인)
ex) 환전: 13번 Process (외화 신청 안내/ 우대율 안내/ 매매한도 안내/ 외화수령 및 기타 사항 안내  ▶ 신청인 E-mail  ▶ 휴대전화 번호 확인  ▶ 환전 용도  ▶ 여행국가  ▶ 여행자보험가입 여부  ▶ 통화종류 입력  ▶ 환전금액 입력  ▶ 원화 환전금액  ▶ 적용환율 고시  ▶ 적용 우대환율 고시  ▶ 외화수령예정일 지정 입력 ▶ 외화수령점 선택)                                                                 ※  우리은행 원터치 개인 기준

환전의 경우 아쉽지만 사용자가 업무 진행을 요청하면 발화 시, 링크를 통하여 서비스를 진행하도록 유도하였다.




2. 시나리오 작성 규칙

우리은행 음성인식 AI뱅킹 소리(SORi)는 대화형 서비스이기 때문에 프로젝트를 진행하면서 가장 많은 시간과 공을 들인 작업은 시나리오였다. 시나리오는 제공자의 질문과 사용자의 발화될 예상 답변으로 구성하였으며 질문과 답변은 몇 가지 규칙을 통해 작성되었다.


2-1. 질문의 원칙

질문의 경우 구어체를 사용하여 대화 상대가 앞에 앉아 말하는 것처럼 느껴지도록 하였다. 질문 시, 제공자가 사용자에게 정보를 설명하는 케이스는 “~다.”로 출력하였다. 제공자가 사용자에게 정보를 요청하는 케이스는 “~요?”로 출력하여 사용자에게 입력을 요청하였다.

ex) 정보 설명: “이체가 완료되었습니다.” / 정보 요청: “이체정보를 등록하시겠어요?”


2-2. 답변의 원칙

제공자의 질문에 대하여 사용자의 답변은 예측 불가능할 뿐만 아니라 시스템이 이해하기 매우 난해한 답변이 나올 수 있다. 때문에 질문에 대한 오류 답변과 예외 답변에 대하여 원칙을 정해 사용자에게 답변하였다. 

<오류 케이스>
1. 부정 답변 케이스- 부정 답변을 선택할 시, 다음 행동을 유도한다.
ex) 사용자: “송금 안 할래.”/ 소리: “더 필요한 금융업무가 있으시면 말씀해 주세요”
2. 필수 답변 미 입력 케이스- 사용자가 인풋 영역에 입력 행동을 진행할 수 있도록 안내한다. 
ex) 사용자: “십만 원 송금해줘”/ 소리: “고객님 수취인을 입력해 주세요.”
3. 인식 불가 답변 케이스- 사용자에게 인식 불가 답변임을 알리고, 가능하면 대안을 제시한다. 
ex) 사용자: “삼백 불 환전해줘”/ 소리: “달러, 엔화, 유로의 단위로 환전을 요청해 주세요.”
4. 대안을 제시할 수 없는 케이스에- 화면상에서 선택하도록 안내한다. 
ex) 사용자: “엄마의 이체정보 수정해줘”/ 소리: “전체 메뉴 설정을 통하여 수정이 가능합니다.”
5. 다중의 선택 요소 케이스- 선택 대상이 다중인 케이스임을 알리고, 선택하도록 안내한다. 
<예외 케이스>
1. 정보 미등록 케이스 – 미등록 정보 작업 요청 시, 정보 등록을 유도한다.
ex) 사용자: “아빠에게 송금해줘”/ 소리: “아빠에게 이체해드리고 싶은데 결과가 없습니다. 이체정보를 등록해 보시겠어요?”
2. 결과가 없는 케이스 - 다음 행동을 유도한다.
ex) 사용자: “공과금 납부해줘” / 소리: “아직 납부하실 공과금 내역이 없습니다. 다른 업무를 말씀해주시면 제가 도와드리겠습니다”
3. 거래 중 다른 거래 요청 케이스 – 현재 진행 중인 거래 종료 후 진행 가능을 안내한다.
ex) (이체 진행과정 중) 사용자:“공과금 조회해줘”/ 소리: “이체 중에는 공과금 조회를 실행할 수 없습니다. 이체가 완료되면 공과금 조회를 도와드리겠습니다.”




3. 음성 출력 규칙

타 대화형 서비스(Siri, 네이버 i, 구글 Assistant 등)는 사용자의 한 가지 명령어가 발화되면 질문에 대한 한 가지 답변한다.

ex) 날씨 질문 케이스
· 사용자 발화 – 사용자: “시리야 내일 날씨”
· 프로세스 1- 소리: “다음은 오늘 날씨입니다.”

하지만, 금융서비스의 경우 사용자가 한 가지 명령어가 발화되면 하나의 Task가 실행이 되며, 프로세스에 따라 최대 6번의 답변을 해야 하는 상황이 발생한다.

ex) 공과금 납부 요청 케이스
· 사용자 발화 - 사용자: “소리야 공과금 납부해줘”
· 프로세스 1 - 소리: “공과금을 조회 중입니다.”
· 프로세스 2 - 소리: “고객님 아래와 같은 공과금 내용이 조회되었습니다.”/ “납부를 원하시는 대상을 · 선택해주세요.”
· 프로세스 3 - 소리: “출금계좌를 선택해 주세요.”
· 프로세스 4 - 소리: “010-1111-2222 고객님의 전화번호가 맞으세요?”
· 프로세스 5 - 소리: “공과금 납부를 위하여 선택해주신 정보를 확인하세요”
· 프로세스 6- 소리: “고객님 생체인증해 주세요.”
· 프로세스 7- 소리: “공과금 납부가 완료되었습니다. 더 필요한 금융업무가 있으시다면 말씀해 주세요.”

프로세스 2번과 같이 두 가지 이상의 정보를 사용자에게 제공되는 케이스가 발생한다. 이때, UX 디자이너는 앞의 내용과 뒤의 내용 중 어떤 것을 음성 출력(TTS)을 해줘야 하는 기준을 명확히 해야 한다. 두 가지 다 음성 출력(TTS)이 가능하지만 사용자가 느낄 피로감에 대해서도 고려해 보아야 한다. 




위에서 언급한 3가지 규칙 외에도 고려할 사항들은 아주 많았다. 하지만 2달여간 서비스를 기획하며 가장 중요하다고 느꼈던 부분에 대하여 공유하고 싶었다. 음성인식 AI뱅킹 소리(SORi)는 이제 막 걸음마를 시작한 초기 서비스로 사실 많이 매끄럽지는 못하지만 점점 보안되고 고도화하면서 더 나은 금융습관을 만들어 주는 서비스로 성장할 것이라 생각한다.

작가의 이전글 UI 가이드 작성 시 고려해야 할 점
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari