"헤이 카카오, 임진왜란이 일어난 연도는?" "임진왜란아~ 엄마 아빠가 깨우지 않아도 스스로 일어난 거야? 우리 '임진왜란'이는~ 정말 부지런한 친구구나?"
2018년도에 100만 조회수를 금방 돌파한, [전국 AI스피커 자랑] 영상 속 AI스피커 이야기입니다. 스마트 AI 스피커의 경우, '일어나다'를 임진왜란이란 전쟁이 발발하는 거라고 인지 못하고, 임진왜란이라는 이름을 가진 사람이 잠에서 깨는 거라고 파악한 것입니다.
출처 : AJUTV | 구글 홈 vs 카카오 미니 vs크로버 퀴즈 대결! 과연 1위는? ‘전국 AI스피커 자랑’ 1탄
일상적인(Daily) 스마트 스피커 사용하는 경우 목록을 보면, 상위권은 음악 스트리밍 사용(39.8%), 날씨 확인 (33.9%)이다.물어보기(29.4%)를 바짝 뒤쫓는 타자들도 그렇습니다. 특정 시간 알람(26.3%), 타이머 맞추기(20.3%).특정 밝기설정이나 전원 켜고 끄기 (24.5%) 명확한 지시가 대부분입니다.
스마트 AI 스피커를 말벗(Conversational)으로 삼고자 했던 사용자들도, 결국 휴대폰의 콘텐츠나 집안의 스마트 기기를 대신 통제해주는 비서(Secretary)로 사용하고 있는 상황인 것이지요.
물론 실제 사용자들이 일상생활에서 어떻게 질문하는지 관찰해보면빈도수 1위를 차지한 '음악 스트리밍 사용'도 쉽지는 않습니다. '음악 듣겠다'라는 명확한 의도(intent)가 사용자의 성향과 습관에 따라 다양하게 질의되기 때문입니다. 특히 아래 예시에서 보이듯 말끝을 올리는 의문문은 사실 BTS 최신곡을 틀어달라는 요청과 동일합니다.
'BTS 틀어줘', 'BTS 신곡이 뭐야?'
당신이 말하는 대로 전문가가 대신 교육시켜 드립니다
일상적으로 사용자가 자주 사용하는 경우에 대해서는, 스마트 AI 서비스를 설계하는 기업에서 여러 발화가 모두 동일한 의도라고 매핑을 시켜놓습니다. 하지만 모든 경우를 사전에 설계하기는 불가능합니다. 그래서 고객들은 직접 자신의 발화 습관이나 생활 리듬에 따라 맞춤형 마이크로 서비스를 만들고자 합니다. 이러한 니즈를 해결하는 것이 Alexa Skills 나 Google Actions인데, 개발 지식이 없는 고객들은 직접 만들고, 실제 서비스에 연동하는 것을 어려워합니다.
Amazon Lex는 고객이 원하는 시나리오를, 원래 있던 Alexa의 기본 시나리오처럼 동작하게 합니다. 사용자가 마우스로 드래그하고, 간단히 내용을 입력하면 됩니다. 그러면, 자연어 처리(NLU) 엔진 포함된 파이프라인에 넣어 기계학습(Machine Learning)이 진행됩니다.
요청에 언급되지 않은 외부의 정보를 검색(AWS Lambda)하는 것이 가능하고, 여태 오간 대화 내용 - "호텔 예약" + "장소는 뉴욕" + "날짜는 9월 30일" 등 맥락(context)을 유지하고 관리(AWS DynamoDB)할 수 있습니다. 2021년 9월, Amazon Lex 플랫폼이 드디어 한국어도 지원을 시작했는데요. 한국어로 말하고 쓰면 Alexa 대화형 챗봇(Conversational Bot)을 만들 수 있습니다.
출처 : AWS 한국 블로그 | Amazon Lex, 대화형 채봇 서비스에 한국어 지원 시작 (서울 리전 출시)
제한된 리소스를 가지고 다양한 아이디어를 도출하는 방법론 중에 스캠퍼 기법(SCAMPER)이 있습니다. 아래 킷캣 초콜릿의 사례를 통해, 초콜릿이라는 작은 단위의 요소를 일곱 가지 규칙으로 ㅡ 다른 원료와 바꾸거나 혼합하거나, 크기나 위치를 바꾸는 등 ㅡ 얼마나 다양한 상품을 만들어낼 수 있는지 쉽게 이해할 수 있습니다.
6. 싱글 사이즈로 줄이거나 (E, Eliminate) 7. 잘게 쪼개고 재배열할 수 있다 (R, Rearrange)
Amazon Lex라는 플랫폼을 통해 고객이 최소한의 노력으로, 똑똑하면서도 자연스러운 챗봇을 만들게 돕습니다.Amazon Lex 플랫폼의 예시에 '꽃 배달 주문(Order Flowers)'나 '호텔 예약(Book Hotel)'이 있는데, 각 시나리오 안에서는 연속된 질문과 답변이 오갑니다. 여기서 힌트를 얻은 고객은 각자의 챗봇을 손쉽게 기획할 수 있습니다. 그리고 꽃 대신 신발을 주문하거나, 호텔에 렌터카까지 예약하는 시나리오를 추가할 수 있고, 단계를 줄이고 늘리고 순서를 재배열 후 등록할 수도 있습니다.
진짜 중요한 사실은, 이렇게 저렇게 만든 새로운 상품도 결국 킷캣이라는 회사의 브랜딩과 물류 및 판매 인프라를 거쳐 소비자에게 도달한다는 것입니다. 여기서도, 만든 사람은 각각 다른지만, Amazon Lex 플랫폼이 제공하는 데이터와 알고리즘, 검색과 보안 등과 연결되기에 성능과 안정성은 모두 수준급입니다. 마치, 고객이 몇 마디 작사만 하면, 이 플랫폼에서 작곡뿐 아니라 리허설, 공연 실황까지 중계해주는 것입니다.
에나 있다고 합니다. 사바사 케바케(사람 by 사람, 케이스 by 케이스)라는 말처럼 상황이 다르고, 사람이 발화하면서 기대하는 바가 다 다르니 제약이 많습니다. 아무리 많은 데이터를 쌓고 좀 더 빠르게 연산한다 해도, 고객의 말을 경청하지 않고, 원하는 것과 상관없이 엉뚱한 답변을 계속한다면 멍청한 AI라고 평가받습니다.
Amazon Lex 플랫폼에서 해결하고자 하는 니즈는 사실 '쉽게 음성 AI를 만들게 돕겠어'가 아닙니다. '고객이 쉽게 원하는 것을 정확하고 빠르게 얻도록 돕겠어'에 가깝습니다. 그래서 마우스로 클릭하거나 타이핑할 필요 없이, 고객 자신이 평소 말하는 습관대로 질문하면, 원하는 정보를 얻을 수 있게 하기 위해 Alexa Skills에 이어 Lex 플랫폼의 서비스를 제공하게 된 것이다. (Let's do it! Lex do it!)
꼭 음성 AI 서비스나 고객 서비스 쪽이 아니더라도, 시사하는 바가 큽니다. 언제 어떻게 고객의 필요에 응답하고 있나요? 얼마나 많은 데이터를 체계적으로 수집하고, 또 상황에 맞게 활용하고 있나요? 척하면 다 아는 '스마트한 서비스'를 만들기 위해 때로는 고객이 직접 plug-and-play 방식으로 만들고 실행할 수 있는 자유를 주고 있나요?