brunch

You can make anything
by writing

C.S.Lewis

by insight coco Aug 12. 2021

AI 녹음앱 네이버 클로바노트 UX

ㅣ UXer가 사용하기에 유용한 AI 음성기록앱

UXer는 여러 리서치 방법론들 가운데 실제 유저와 대면하여 제품/서비스의 사용 계기-이용 현황-장단점 등을 구체적으로 물어보는 ‘유저 인터뷰’를 가장 많이 수행한다.


일반적인 담화에 가까워 보일 수 있지만 UXer의 인터뷰 설계 및 진행 역량에 따라 유저로부터 이끌어 낼 수 있는 답변의 질이 크게 차이가 난다. 인터뷰가 완료되면 결과를 분석하고 해당 결과물을 프로젝트를 의뢰한 유관 부서에게 전달하는 것을 끝으로 전체적인 유저 인터뷰는 마무리가 된다.


하지만, 많은 UXer들이 유저 인터뷰에서 흔히 범하는 실수 중 하나는 ‘결과 분석’ 과정의 중요성을 간과하는 것이다. 유저들의 응답이면 충분한 해결책이 될 것이라는 생각과 함께 많은 시간과 체력이 요구되는 앞선 과정들로 인해 자연스럽게 결과 분석에서의 집중력이 흐려지고 적은 시간을 투자하게 된다.


전자의 경우 필자의 ‘니즈의 3가지 종류’ 글을 꼭 읽어보기를 권장하는데, 요점은 유저의 말과 행동 이면을 파고드는 노력을 할 때야 차별화된 인사이트 도출할 수 있다는 내용이다. 후자는 결과 분석을 위한 충분한 시간과 체력을 확보하는 것이 관건인데 프로젝트 기간을 연장할 수 없는 상황이라면 각 단계에서 불필요하게 낭비되는 시간을 최소화하는 것이 현명한 방법이 될 것이다.


인터뷰 설계 – 인터뷰 진행 –결과 분석 – 결과 공유 등 유저 인터뷰 각 단계별로 불필요하게 낭비되는 시간을 줄이는 방법은 무수히 많겠지만, 오늘 글에서는 인터뷰 진행과 결과 분석 과정에서 반드시 필요한 과업인 ‘서기’를 용이하게 도와주는 AI 음성기록앱 ‘클로바노트(Clova Note)’ 사용자 경험(UX)에 대해 알아보고자 한다.


AI 음성기록앱 ‘클로바노트’

<AI 음성기록앱 클로바노트 베타 버전>

보통은 인터뷰 진행 시 모든 대화 내용을 안전하게 기록하기 위해 진행자 외에도 '서기'가 함께 참여하는 게 일반적이다. 하지만, 필자와 같이 일상에서도 혼자 수시로 유저 인터뷰를 진행하는 경우에는 대화 내용을 녹음하는 편이다. 물론 짧은 대화의 경우에는 녹음 내용 복구나 주요 부분들을 표기하는데 큰 시간이 소요되진 않지만, 장시간 인터뷰의 경우 인터뷰 진행 시간만큼이나 또 한 번 시간을 투자해 음성을 들어봐야 하는 수고가 요구되어 왔다.


이러한 상황에서 AI음성기록앱 클로바노트는 혼자서 현장 인터뷰를 진행해도 마치 또 한 명의 팀원이 있는 것 마냥 서기의 역할을 톡톡히 해주고 있는 고마운 앱이다. 현재는 베타 버전이지만 핵심 기능들을 사용하는 데 있어 전혀 문제가 없고, 모바일앱 또는 PC에서 모두 사용 가능하며 동일한 아이디로 동시 접속 또한 가능하다.


특히 해당 앱에는 네이버 클로바의 음성 인식 기술 CLOVA Speech가 탑재되어 있는데, 길고 복잡한 문장에 대해서도 정확한 음성 인식을 제공하는 딕테이션(NEST) 엔진과 참석자 간의 음성 차이를 구분해 주는 와이즈(WISE) 엔진이 적용되어 있다. 특히 AI 녹음 앱인 만큼 클로바노트를 사용하는 시간과 빈도가 늘어날수록 더욱더 정교한 음성-텍스트 변환 결과를 받을 수 있다는 게 해당 앱의 가장 큰 장점이 아닐까 싶다. *8월 12일 기준으로 영어, 일본어 음성변환도 가능하다.

<네이버 클로바의 음성 인식 기술, CLOVA Speech>

호환성: 각종 음성 파일을 빠르게 텍스트로 변환

클로바노트 내에서 녹음된 음성은 AI 기술을 활용하여 한글 텍스트로 자동 변환해 준다. 이뿐만 아니라 타 디바이스 혹은 타사 앱, 통화 등에서 녹음된 음성 파일 또한 클로바노트에 업로드하여 빠르게 텍스트 변환이 가능하다. 약 17분가량 되는 분량의 통화 녹음 파일을 업로드할 경우 텍스트 변환까지는 채 2분이 걸리지 않았다.

<음성 파일 업로드 / 통화 음성, 일반 음성/ 통화 음성 텍스트 변환 결과>

다만 현재 클로바노트 앱을 통해 녹음된 음성은 베타 서비스 기간에 한해서는 무제한 텍스트 변환이 가능한 반면, 다른 방법으로 녹음된 파일의 경우 텍스트 변환 시간을 최대 월 600분까지만 지원하고 있다. 또한 영상 및 일부 형식의 파일은 업로드가 불가하여, 필요시 별도의 코덱 변환 프로그램 또는 프리미어 등을 활용하여 음성 파일로 추출한 뒤 클로바노트에 포함시켜야 하는 과정은 다소 아쉬웠다. (첨부 가능 파일 = m4a, mp3, aac, amr, wav 파일)

<(좌) 월 단위 최대 600분까지 텍스트 변환 가능, (우) 업로드 가능한 음성 파일 형식>


정확성: 여러 가지 인터뷰 환경에 맞춤화된 텍스트 변환

음성 녹음을 완료하거나, 음성 파일 업로드 시 ‘음성의 종류’와 ‘참석자 수’를 선택하는 팝업을 대면하게 된다. 클로바노트는 음성기록앱의 사용 텍스트(Context)를 고려하여 일반 대화, 회의, 인터뷰 상담과 같은 음성의 종류와 실제 대화에 참석한 인원수를 유저가 직접 선택하게끔 하여 음성 간의 식별, 정확성을 올리고자 하였다. 두 번의 팝업을 유저가 일일이 선택해야 하는 유저의 직접 개입이 요구되었지만, 기존의 많은 텍스트 변환 앱들 대비해서 높은 변환 정확도를 제공하기 위해 사용된 적절한 *트레이드오프(trade-off)로 생각되었다. (*상대적으로 중요한 것을 제공받기 위해 일부분에 있어선 유저의 적절한 포기가 필요한 상황을 뜻한다.)


<팝업: 음성의 종류, 참석자 수 선택 과정>

물론 스마트폰의 녹음 위치, 발음, 대화 속도, 참여자 수, 참여자 간 음성의 비슷한 정도 등 수많은 요인들로 인해 음성 인식률이 크게 차이 나기도 하였지만, 일반적인 상황에서는 매우 만족스러운 결과물을 확인할 수 있었다. 특히, 유저 인터뷰 과정에서는 단어 하나하나의 정확성을 확보하는 것보다 유저들 간의 대화를 정확히 구분 지어 표기해 주는 부분이 무엇보다 유용했다.

< 일상에서의 서비스 관련 대화 시, 참석자 간 목소리 구분>


접근성: 주요 구간 빠른 마킹

유저 인터뷰를 진행하다 보면 유저로부터 모든 구간에서 유의미한 얘기를 듣기란 사실상 불가능하다. 하지만 막상 긴 인터뷰가 끝나고 나면, 주요 구간을 찾아보기 위해선 다시 한 번 모든 구간을 들어봐야 하는 과정을 거쳐야만 했다. 하지만 클로바노트 사용 시 유저 인터뷰 진행 중에도 유저들의 주요 멘트, 주요 질문, 또는 인터뷰 세션을 분리하는 용도로 앱 내 북마크를 활용해 표기가 가능하다. 하지만, 막상 인터뷰 진행에 몰두한 나머지 주요 구간을 마킹하지 못한 경우라도, 이후 녹음된 내용을 빠른 속도로 재생시켜 북마크 표기를 추가적으로 할 수 있다. 주요하다고 북마킹 해놓은 구간들을 빠르게 확인하면서 주요 인사이트를 정리하기에 매우 유용한 기능이었다. 베타 서비스 이후에는 북마킹 구간을 설정해준다거나, 북마킹의 우선순위를 표기할 수 있는 여러 방법들이 마련된다면 해당 기능의 활용도가 더욱 높아질 것으로 예상된다.


<주요 구간 북마크 표기>

연동성: 녹음과 동시에 주요 인사이트 실시간 메모

스마트폰을 활용하여 음성녹음을 하는 동시에 PC에서는 실시간 메모 작성이 가능하다. 해당 기능은 한 명이 인터뷰 진행 시, 다른 한 명은 서기 역할을 한다기 보다는 각 대화 내용에서 도출된 주요 인사이트 또는 주요 내용은 실시간으로 요약하는데 집중할 수 있다. 기존에는 단순히 인터뷰에서 나누었던 대화를 기록하는데 집중했다면, 인터뷰 현장에서만 발견할 수 있는 날것의 인사이트를 휘발되지 않고 안전하게 기록 가능하도록 돕는 경험은 매우 인상적이었다. 특히 인터뷰에서 도출한 주요 인사이트를 실제 유저 멘트와 근접한 시점에 기록해 둘 수 있어, 인사이트를 대변하는 멘트를 빠르게 탐색하는데도 매우 유용하다. 이러한 과정을 통해 인터뷰 직후 작성된 메모를 보며 팀원들 간의 빠른 인터뷰 인사이트 랩업이 가능하다는 장점 또한 있다. 혼자 인터뷰를 진행한 경우에는 북마킹 된 곳들을 다시 들으며 주요 내용에 대해 메모 섹션에 추가로 기입 또한 가능하다.


<(좌) PC 화면에서 클로바노트 실시간 높음 중 확인 가능, (우) 녹음 후 대화 내용 텍스트 변환 처리와 동시에 작성된 메모 확인 가능>


안정성: 쉬운 노트 공유 및 보안 보장

녹음 및 텍스트로 변환된 내용은 외부로 쉽게 공유 가능하다. 유저 인터뷰는 물론, 회의, 통화 내용, 일반 사담 등 민감한 사항들이 담겨있을 수 있기에 노트 공유 시 유효기간 설정이 가능하며, 자동 비밀번호가 설정되어 외부인의 접근을 막을 수 있다. 링크를 공유 받은 인원은 링크와 함께 공유된 비밀번호를 입력하면 접속이 가능하며, 별도로 클로바노트 앱이 설치되어 있지 않아도 접속 가능하다. 물론 공유자가 설정한 유효 기간 동안에만 열람 가능하며, 편집과 음원 다운은 작성자만 가능하다. 베타 버전 이후에는 권한 정도를 조금 더 구분하여, 편집 및 다운로드 권한도 공유자가 직접 부여할 수 있을 것으로 기대한다.

<녹음 및 변환된 텍스트 내용 쉽게 공유>

글을 마치며

UXer 역할은 남들이 발견하지 못한 숨은 니즈를 유저들로부터 발굴하는 일이며, 그렇게 하기 위해서는 결과 분석과 같은 유의미한 과정에 할애되는 시간이 충분히 확보되어야 한다. 결국 인터뷰 진행 후에 진행되는 서기 복구 과정과 같은 다소 가치가 적은 일에서 불필요하게 시간이 낭비되는 것을 최소화하기 위한 방법의 일환으로 금일 AI 음성기록앱 클로바노트를 소개하게 되었다.


필자는 실제로 평소 인터뷰 진행 시 클로바노트를 적극 사용하면서, 기존 대비 결과 분석 시간에 더 많은 시간을 할애할 수 있었다. 오늘 소개한 내용 외에도 변환된 ‘텍스트 또는 메모 편집 시’ 편집된 내용을 기반으로 유사 단어를 전체적으로 자동으로 바꿔주거나 마이페이지 내 ‘자주 쓰는 단어 설정’ 시 단어 인식률 또한 높아지는 것을 직접 경험할 수 있었다. 현재는 베타 서비스에 불과하지만 유저들의 많은 데이터가 누적되어 나날이 고도화될 AI음성기록앱 클로바노트가 개인적으로는 많은 기대가 된다. 앞으로도 연재되는 시리즈에서는 다음 4가지 유저 인터뷰 단계(인터뷰 설계 – 인터뷰 진행 – 인터뷰 결과 분석 – 결과 공유)에서 효율적인 업무를 할 수 있도록 도와주는 여러 AI툴들을 계속해서 소개할 예정이다.



By insight.coco


[insight.coco 작가의 인기글이이에요! ▼]   


본문 Reference:

l  클로바노트 = https://clovanote.naver.com/home

l  클로바스피치= https://clova.ai/speech

l  줌 연동해서 네이버 노트 만들기 = https://blog.naver.com/clova_ai/222365799633


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari