brunch

You can make anything
by writing

C.S.Lewis

by 플톡 Jun 07. 2021

Clova Note : 음성을 텍스트 메모로 변환하기

네이버의 Clova Note로 회의나 미팅 회의록 빠르게 만들기

일전에 소개한 “구글 음성인식을 활용한 문서 작성 속도 높이기“ 글에서 소개한 것처럼 요즘 키보드로 작성하는 메모보다 음성으로  메모하는 방식을 다양하게 시도하고 일에 활용하다 보니, 좀 더 나은 성능의 인식기에 대한 아쉬움이 있었는데요. 때마침 네이버에서 “클로바 노트”라는 어플리케이션을 출시하여 큰 관심을 갖고 설치하여 사용해 보왔습니다. “클로바 노트”는 네이버의 “클로바 음성인식/텍스트 변환”기술을 활용한 앱으로, 클로바의 음성인식 기술중 대화 및 긴 문장에 특화된 네스트(NEST, Neural End-to-End Speech Transcriber)엔진과 발성자의 목소리를 구분하는 화자인식 기술인 와이즈(WISE, Who is Speaking) 엔진이 탑재되었다고 합니다. 



아이폰과 안드로이드폰용 AppStore에서 모두 다운로드 받을 수 있습니다. 저는 안드로이드폰을 사용해서 Google PlayStore에서 다운로드 받았습니다.  사용해보면서 느낀 점들을 정리해보면 아래와 같습니다.


네이버 계정이 필요합니다. 네이버 계정으로 모바일 앱으로 로그인해야하며, 웹 서비스를 사용하기 위해서도 네이버 계정이 필요합니다.

음성을 스마트폰을 통해 바로 입력이 가능하며, 음성입력을 마치면 바로 텍스트 변환이 이루어집니다. 변환은 서버에 수행되는 것 같은데요. 변환이 완료되면 핸드폰으로 완료알람이 표시됩니다.

음성을 녹음하는 동안 중요한 위치를 기록할 수 있는 북마크(bookmark)를 넣을 수 있습니다. 북마크를 넣으면, 텍스트 변환된 노트 내용에서 북마크로 편리하게 이동이 가능합니다.

문자로 변환되면, 변환된 문자에서 음성파형으로, 음성파형에서 변환된 문자로 빠르게 전환이 가능합니다(Mac OS에서 음성노트가 지원되는 Notability와 같은 기능이 제공되어서 좋더군요^^)

음성 녹음 후, 녹음한 음성 노트의 유형을 선택해야하며 녹음하는동안 참여한 화자수도 선택해야 합니다(이 기능은 메모의 유형과 화자식별등의 추가 학습을 위한 메타정보로 수집하는 것 같습니다).

모바일 앱에서만 실시간 녹음이 가능하며, 음성을 텍스트로 변환하는 기능은 지원되지만 변환된 텍스트의 수정 기능은 모바일에서 지원되지 않습니다. 노트의 수정을 위해서는 웹 사이트 접속이 필수적입니다.

클로바 노트 사이트에서는 녹음은 지원되지 않으며, 대신 mp3,wave등의 오디오 업로드와 텍스트 변환기능은 지원됩니다. 용량이 큰 오디오 파일의 경우 모바일폰보다는 웹 서비스를 활용하는 것이 편리할 것 같습니다.

녹음한 음성이나 메모등의 정보를 네이버에 제공하는 조건으로 매달 300분이 충전됩니다. 일단 300분은 가입 시 기본적으로 제공됩니다. 300분의 조건이 실시간 변환 조건임으로  남은 시간이 없어서 녹음과 변환은 된다고 합니다(다만, 변환이 바로 되지 않고 변환에 최대 24시간이 걸리다고 하니 바로 되지 않은 불편함은 있네요).

음성변환의 성능이 좋지만, 기대 이상은 아직 아닙니다. 느리게 천천히 발성하면 비교적 오타가 크지 않지만, 빠르게 이야기하거나 중간 중간 pause가 있으면 오타율이 좀 높아지네요. 음량이 자동으로 조정이 되지는 않는 것 같아서 마이크를 통해 입력 되는 소리의 크기를 일정하게 맞추기가 쉽지 않더군요. 핸드폰의 마이크를 어느정도 띄어서 발성하면 인식율이 개선될 수 있을지 테스팅도 해보왔답니다. 앞으로 개인의 발성 음성과 메모 내용 모두를 학습데이타로 사용할 수 있다면, 개인별 인식기의 파라미터 학습이 가능할 것 같아서 인식율은 높아질 것으로 기대되는데요. 개인별 데이타 제공 여부가 인식율 개선에 큰 변수가 될 수 있지 않을까 생각되네요.



사용하면서 불편한 점들도 몇가지 있었는데요. 앞으로 아래의 사항들이 변경이 되면 좋을 것 같습니다.


음성을 녹음하는 도중에 취소하거나 재 녹음의 기능이 없습니다. 일단, 메모 녹음을 시작하면 중지를 누를 때까지 계속 녹음이 되어 음성이외의 소리로 인해서 오인식된 텍스트가 표시되더군요.

음성을 녹음한 후, 매번 메모 유형과 화자수를 입력하니 짧은 메모를 여러번 녹음하는 경우 엄청 번거롭더군요. 프로파일 기능이 지원되어 미리 설정된 값들을 사용할 수 있으면 좋을 것 같습니다.

모바일 앱에서 바로 노트 수정이 되면 좋을 것 같습니다. 생각보다 불편하네요.

노트 안에 텍스트와 함께 저장되는 음성의 품질이 낮은 것 같아서 듣다보면 조금은 귀에 거슬리는 것 같네요. 모바일 앱에서 저장할 수 있는 오디오 파일의 bit수를 설정하면 좋을 것 같습니다.


모바일폰의 첫화면으로 “클로바 노트” 앱을 배치한 만큼 앞으로 여러 업무에도 활용해보면서 문서 작성의 번거로움을 줄여볼 수 있을 것 같아서 벌써부터  기대되네요. 음성으로 언제든지 빠르게 메모를 하고, 변환된 텍스트 문장들과 함께 음성을 함께 관리할 수 있는 메모 어플리케이션을 찾고 계시다면, 좋은 대안이 될 수 있을 것 같네요.



회의와 회의 기록에 대한 방법들이 궁금하시다면, 아래의 글을 참고해 주세요.

음성인식과 합성을 활용하여 Google Doc로 글쓰기

구글 음성인식을 활용한 문서 작성 속도 높이기

온라인 회의 1시간에 끝내는 기술


매거진의 이전글 [파워툴] OneTab, GoFullPage

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari