brunch

You can make anything
by writing

C.S.Lewis

by 플톡 Dec 11. 2020

구글 음성인식을 활용한 문서 작성 속도 높이기

음성 입력으로 메모나 글 작성의 속도는 높이고 귀찮음은 줄이자

업무상 키보드를 사용하는 업무가 많다보니, 손목 증후근의 증상도 나타나곤 해서 요즘은 종이노트나 디지털 노트를 사용하여 펜을 사용한 문서 작성을 많이 하고 있는데요. 이렇게 그림이나 손글씨로 문서를 작성하면, 편의성은 높은데 작성한 내용들을 다시 문서나 슬라이드로 변환하는데 어려움이 봉착하게 됩니다. 손그림으로 스케치한 내용은 keynote나 Powerpoint의 그리기 도구를 사용하여 다시 그려야하기 때문에 약간의 수고스러움만 더하면 작성 작업의 할만 합니다. 정작 문제는 텍스트에 있습니다. 손글씨의 내용도 함축적이고, 해당 내용을 작성할 때 어떤 생각을 하고 작성했는지도 나와 있지 않기때문에 작성한 키워드나 키구문을 사용해서 Google Docs, Dropbox Paper, MS Words등에 모두 새롭게 작성해야하는 일이 생각보다 시간이나 노력의 부담이 크게 들더군요.  이러한 번거로움을 줄여볼 수 없을까 생각하던 중에 구글의 음성인식입력기(Speech-to-Text)를 사용해보기로 했습니다.




안드로이드나 iOS에서 모두 음성인식이 지원되는데요. 지금까지 이 기능을 좀더 적극적으로 사용해볼 생각을 많이 하지 못했던지라, 이번 기회에 텍스트 변환기능을 제대로 사용해보기로 했습니다. 개인적으로 핸드폰이나 태블릿 기기로 Android를 사용하고 있어 해당 기기에서 지원되는 음성 입력기능을 사용하여 “당근메일”에 게재할 글을 작성해보기로 했습니다. 안드로이드 기기 내의 모든 어플리케이션에서 구글 음성 입력이 지원되는데요. 저는 Google Keep을 사용해서 문서를 작성해보기로 했습니다.


작성 주제에 포함될 주요 내용들과 키워드들은 간략히 노트에 작성해두었던지라, 글을 쓰는 것처럼 말로 내용에 대해서 구술로 이야기하니 빠르게 텍스트로 변환이 되었습니다. 생각보다 많은 분량을 짧은 시간에 작성할 수 있어서 무척이나 뿌듯했지만, 사용 해보면서 느낀 좋은 점들과 아쉬운 점들을 몇가지 정리해보면 다음과 같습니다. 


Google 음성변환에 따르면, 구둣점 - 쉼표, 마침표, 느낌표 - 과 줄이나 단락 바꾸기 - 새 줄, 새 단락 - 등이 이 지원된다고 나와있는데요. 구둣점에서 ‘쉼표’와 ‘새 줄’ 바꿈은 오인식으로 인해 거의 불가했고, 새 단락은 3번 시도에 1번 정도 동작되어 단락을 나누기 위해서 음성을 멈추고, 키보드로 변환하여 줄이나 단락을 바꿈해주어야 했네요.


잘 인식되어 변환된 문장들도 많았지만, 변환이 제대로 이루어지지 않은 문장들도 일정부분 많아서 천천히 말하거나 또박또박 이야기해야하겠다는 생각이 들었네요. 음성인식이 통계적 언어모델을 적용하다보니, 종종 엉뚱한 단어나 구문으로 변환되는 경우가 있었습니다. 다만, 소리를 좀더 크게하고 발성 속도를 천천히 하면 인식율이 많이 개선됨으로, 좀더 적응되면 변환율을 높이는 발성방법을 찾을 수 있을 것 같습니다.


구글 키보드에서 제공되는 음성인식 기능을 사용하는 경우, 음성녹음은 따로 되지 않고 텍스트 변환만이 되어서 나중에 텍스트를 확인해보면서 어떤 이야기를 했는지 확인하기가 어려울 수 있습니다. Google Keep의 경우, “음성녹음” 메뉴가 있는데요.  이 기능을 사용하면, 구글 보이스 인식결과와 함께 음성부분도 함께 녹음되어 Keep에 저장됨으로 텍스트 변환이 제대로 되지 않은 경우 음성녹음을 다시 듣고 내용 확인이 가능합니다.


Google Keep의 알림 기능을 활용하면, 음성으로 변환된 문서를 편집하고 수정할 수 있도록 Google 캘린더(Calendar)에 관련 업무내용을 추가할 수 있습니다. 변환내용이 완전하지 않기 때문에 잊지 않고 빠르게 수정하고 편집하도록 알림기능의 설정은 매우 편리하고 유용하더군요. 


음성 변환된 텍스트는 Dropbox의 paper에 복사하거나 Google Keep의 “Google Docs로 내보내기” 를 통해서 편리하게 편집이 가능합니다. 음성입력이 가능한 어플리케이션들의 대부분이 제공하는 “공유하기” 기능을 활용하면 편집가능한 어플리케이션이나 서비스로 변환된 텍스트 전체를 이동시킬 수 있어서 빠른 편집이 가능합니다.


사용에 아쉬움은 있었지만, 글 작성을 위해서 워드프로세서나 편집기(editor)를 실행하고 처음부터 글을 작성하기보다 빠르게 머릿속에 있던 내용들을 말로하고 글로 변환하여, 초안 수준의 작성이 완성되다보니 이후 글의 완성 시간을 많이 단축할 수 있었습니다. 앞으로 기술의 발전으로 좀더 음성 변환의 정확도가 더 향상될 것으로 기대하며, 일상에서 생산성을 높이는 방법으로 음성을 다양하게 활용해보는 기회들을 만들어보면 좋을 것 같습니다.




빠른 기록과 저장, 활용 방법들이 궁금하시다면, 아래의 글을 참고해 주세요.

Colva Note : 음성을 텍스트 메모로 변환하기

머릿속 생각을 토스해(Toss)!







매거진의 이전글 일의 성과를 높이는 ‘자투리 시간’ 활용하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari