brunch

You can make anything
by writing

C.S.Lewis

by 플톡 Jul 12. 2022

음성인식과 합성을 활용하여 Google Doc로 글쓰기

인공지능 기술로 글쓰기의 도움 환경 구축하기

최근에 글을 작성하는 일들이 많아지면서 글 쓰는 일에 좀 더 생산성을 높이는 여러 가지 시도를 해보고 있습니다. 구글 음성 인식기를 사용하여 Google Keep에 간단한 메모들을 작성해보면서 텍스트 변환의 성능이 좋다고 생각되어, 좀 더 긴 글을 작성하는데 음성 인식기를 활용해보기로 하였습니다. 구글 Docs의 문서에서는 “도구 > 음성 입력”이 지원됩니다. 이어셋이나 헤드폰(마이크 기능 탑재)을 사용하여 편리하게 머릿속에 떠오르는 생각을 말로 표현하면, 구글의 음성 인식기가 빠르게 텍스트로 전환하여 구글 Docs에 해당 내용을 표시해 줍니다.

아직은 음성 인식기의 성능이 완벽하지 않아서 텍스트로 변환된 글을 다시 읽어보고, 수정해야 하는 경우도 많지만 현재로서도 충분히 사용할만한 성능을 보여주고 있어서 글쓰기의 속도감을 높이는데 매우 큰 도움이 됩니다. 음성 입력 기능 이외에 구글 Docs의 유용한 점은 맞춤법 기능입니다. 변환된 텍스트에 대해 우선 맞춤법과 문법 검사를 하고, 글을 수정하니 매우 편리하네요.

글의 초안이 어느 정도 완성되었다면 이제 작성한 글을 외부에 공개하기 전에 오탈자를 확인하고, 어색한 표현을 바꾸거나 글의 내용을 다듬기 위해 꼼꼼히 읽고 수정하는 단계가 진행됩니다. 눈으로 읽고 부족한 부분들을 확인하지만, 경우에 따라 오탈자나 띄어쓰기, 조사나 접속어등이 수정되지 않은 경우가 있어서 소리 내어 읽어보곤 하는데요. “이러한 교정 과정을 좀 더 편리하게 할 수 없을까?”라는 생각에 구글 Docs에서 음성합성(읽어주기) 기능을 찾아봤지만 기본적으로 지원되지 않아서 다른 방법을 찾던 중 구글 Docs에서 사용할 수 있는

Chrome Vox라는 확장 프로그램을 알게 되었습니다. “크롬 복스(Chrome Vox)"는 시각 장애인들을 위한 웹 브라우저의 텍스트나 메뉴 선택, 마우스 클릭 등을 음성합성(TTS: Text-to-Speech)으로 읽어주는 스크린 리더(Screen Reader) 프로그램으로 구글에서 지원하는 확장 프로그램입니다. 확장 프로그램을 설치한 후, 옵션을 살펴보면 다양한 기능들을 단축키로 설정 가능합니다.

Chrome Vox를 설치한 후, 구글 Docs에서 텍스트 읽기 기능을 사용하기 위해서는 도구 > 접근성 설정을 클릭하고, 아래와 같이 “스크린 리더 지원 사용 설정“을 체크합니다. 확인 버튼을 클릭하면, 구글 Docs의 상단에 “접근성"이라는 새로운 메뉴가 생겨난 것을 확인할 수 있습니다.

“접근성 > 스크린 리더로 소리 내어 읽기 > 선택 영역 소리 내어 읽기”를 사용하여 이제 구글 Docs 내에서 작성한 텍스트를 한국어 음성으로 바로 들을 수 있게 됩니다. 이런 읽기 모드를 통해 작성한 글의 텍스트를 바로 음성으로 듣고, 들으면서 눈으로 읽으면서 찾지 못했던 글의 어색한 부분들을 빠르게 파악하고 수정할 수 있어서 정말 큰 도움이 되었네요.

Chrome Vox를 사용할 때 한 가지 고려할 점은 구글 Docs에서 교정의 목적으로 사용할 경우 음성 안내와 텍스트 읽기 모드가 유효하지만, 해당 기능을 ON 시켜놓을 경우 크롬 웹 브라우저에서 모든 액션 - 마우스 클릭, 텍스트 입력 메뉴 선택 등 - 에 대해 음성으로 안내해주는 기능이 항상 활성화됩니다. 웹 서핑에서 이 기능을 사용하지 않을 경우, 구글 크롬 웹 브라우저의 확장 프로그램 관리 페이지(chrome://extensions/)나  “크롬 맞춤 설정/제어"의 “도구 더보기"를 선택하여 Chrome Vox기능을 OFF 하는 것이 좋습니다. 필요한 경우, 선택적으로 ON/OFF가 가능함으로 구글 Docs에서 작성 글의 교정 시 음성합성 기능을 다시 활용할 수 있습니다.

구글 Docs를 활용하여 음성 인식기로 글을 쓰고, Screen Reader를 통해 작성된 글의 음성을 직접 들어볼 수 있어 하나의 애플리케이션 내에서 글쓰기와 교정의 작업을 한 번에 편리하게 진행할 수 있어 글쓰기의 수고를 확실히 줄여주는데 큰 도움이 된 것 같습니다. 글쓰기의 환경을 좀 더 생산적으로 바꾸고자 고려하시는 분들이라면 한번 적용해보셔도 좋을 것 같네요.




아래의 글들도 함께 읽어보시보면 일과 업무의 생산성 향상에 도움이 됩니다.

Clova Note : 음성을 텍스트 메모로 변환하기

구글 음성인식을 활용한 문서 작성 속도 높이기


Clova Note : 음성을 텍스트 메모로 변환하기

Clova Note : 음성을 텍스트 메모로 변환하기

매거진의 이전글 HeyBunny : 뉴스레터 구독과 관리를 한 번에
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari