brunch

매거진 AI인간

You can make anything
by writing

C.S.Lewis

by 케이 Feb 17. 2021

이번에는! 말로 글쓰기

말로 쓴 글이 제가 1994년에 LA에 있었을 때...

2주 사이 GME가 가고 클럽하우스가 그 자리를 차지 했다. 스마트폰이라곤 안드로이드만 써본 나로써는 입구밴을 당할 수 밖이 없기에 그냥 멀리서 들려오는 경험담만, 신기하게 듣고 있을 수 밖에 없었다. 그러다가 아이디어 하나가 생각났다.


나만 클럽하우스 못 들어가는게 아닐텐데?


너드하우스라고 해서 클럽하우스에 나누는 이야기를 Speech-To-Text(STT)로 인식해서, 들어가지 못하는 안드로이드 사용자들에게 텍스트로 보여주는 서비스를 만들면 어떨까? 하는 생각이. 귀찮아서 하지는 않았지만, 그 덕분에 근 10년 만에 STT 기능을 다시 써보게 되었고, AI인간의 새로운 도구를 찾았다.


여기부터는 구글 음성인식기(STT)를 이용해 말로 쓴 글을 편집하고 교정한 내용이다.
투머치토커가 되었지만, 두서가 없는 건 선형적으로 쓰게 때문이 아닐까 싶다.





이번에는 뭘 해야 될까 번역기도 했으니 이번에는 STT를 이용해서 글을 써보려고 한다. 아무래도 타이핑을 치는 것보다 말로 하는게 좀 더 편하겠지? 알트탭 같은 경우는 예전에 썼을 때 느꼈던 UX가 너무 떨어져서 봉인된 기능처럼 안 쓰고 있는데, 음성인식도 사실 마찬가지다. 초창기에 썼던 음성인식기의 성능이 너무 떨어져서, 지난 10년 동안 계속 쓰지 않고 있었다. 그래도 지금은 좋아지지 않았을까? 하는 기대감과 함께 이번 화의 주제로 음성인식 AI를 이용해 글을 쓰고 있다.


이걸 글을 쓰고 있다고 해야 될지 말하는 거를 옮겼다고 해야 될지는 애매하지만. 지난주까지 신나게 있었던 게임스탑은 결국 망해 버렸다. 몇백 달러하던 주가가 몇십 달러로 줄어 드니 더 이상 레딧에 안 들어가게 되었다. 아무래도 분위기가 다운 되어서, 들어가도 재밌는 걸 찾기 어려워서 그러지 않을까 싶다.


그럼 대신에 뭘 해야 할까? 뭘 해야 했을까? AI를 하나 둘씩 가져다가, AI인간이 되기 위한 방법들을 생각해 봤습니다. 지금 시점에 바로 쓸 수 있는 것들이 뭐가 있지? 그렇게 생각하다 쓰게 된 글이 바로 음성인식입니다. 편집은 하겠지만, 음성인식을 통한 원문도 글에 남기긴 할겁니다. 퇴고를 안하고(하지만 안 할 수 없더라...ㅠㅠ) 잘못된 부분만 체크 한 걸 남길테니, 요즘 음성인식이 얼마나 잘 되는지 혹은 얼마나 안되는지 보시면 괜찮을 것 같아요.


(여기까지가 안드로이드에 있는 구글 음성인식기로 쓴 부분)



아 날아갔어요. Siri로 글쓰는 방법을 계속 말하고 있었는데 다 날아갔습니다ㅠㅠ 완료 버튼을 누르지 않으면 날아간다는 걸 깨달았습니다. 어쨌든 폰으로 할 때는 편집에 제약이 있었는데, 맥북에서 브런치 켜놓고 말로 글 쓰면서, 노래 들으면서, 편집도 하면서 할 수 있는 건 되게 좋은 것 같아요. 좀도 자주 써도 될 것 같다는 생각이 들어요.


(그 뒤에 완료 버튼을 눌렀는데도, 2번 연속으로 날아가서 Siri 받아쓰기는 포기함)





아무래도 글을 쓰는 방법과 말하는 방법의 차이, 입체적인 것과 선형적인 구조적 차이 때문에 말한 것을 바로 글쓰기로 옮기기는 어려운 것 같다. 대신 말로 하다보니, 글로 썼으면 오래 걸렸을 내용들은 비교적 빠른 시간에 채울 수 있었다. (전체 글을 말하는데 걸린 시간이 10분이 채 안된다.)

구글 음성인식기는 평소에도 써도 될 정도로 성능이 괜찮다. 글에는 저작권 이슈로 옮기진 않았지만, 빌린 아이패드로 클럽하우스에 가입해서 방에 들어간 후, 구글 음성인식기로 대화를 텍스트로 옮기게 해봤는데 기대보다 성능이 좋았다. 옮겨진 텍스트를 읽으면 대화를 이해하는데 큰 문제가 없을 정도로.

맥북에서 제공하는 받아쓰기 기능은 완성된 문장이 날아가는 문제가 있어서 쓰기 어려운 듯하다.

그럼 다음엔 더 AI와 가까워진 AI인간의 모습으로!


0x33 0x1A



Speech-To-Text(STT)를 이용해서 만들어낸 원본 부분을 아래에 덧붙입니다.



이번에는 뭘 해야 될까 번역기도 했으니 이번에는 stt를 이용해서 해 보려고 했다 아무래도 타이핑을 치는 것보다 말로 하는게 좀 더 편하겠지 예전에 알트탭이 있었는데 한번 사용해 떨어진 걸 느낌이 하는 기능이 개선되서 다시 사용하지 않습니다 마찬가지로 초창기에 썼던 음성인식이 너무 떨어져서 계속 사용하지 않고 있었는데 생각해 보니깐 지금쯤은 좋아지지 않을까 하는 기대 이번화는 음성인식으로 글 쓰고 있습니다 이걸 글을 쓰고 있다고 해야 될지 말하는 거를 옮겼다고 해야 될지는 애매 하지만요 지난주까지 신나게 있었던 게임스탑은 결국 망해 버렸죠 저도 100달러가 하던 일 시작 주시기 몇 시 달러로 10분 내일 통영 가는 거 보니까 더 이상 레디스란 가게 되더라고요 아무래도 그 쪽에 있는 분위기가 다운되서 저도 뭔가 재밌는 걸 찾을 수 없었기 때문에 더 이상 가지 않게 되었습니다 그럼 대신에 뭘 했냐 뭘 했을까요 좀 더워 ai로 갔다 쓸 만한 것 AI 인간이 되기 위한 방법들을 생각해 봤어요 지금 시점에 바로 쓸 수 있는 것들이 뭐가 있지 어 그래서 몇 가지 생각해 본 것들이 있는데 그거를 하나하나씩 확인 할 텐데 일단 첫 번째로 지금 하고 있는이 글을 쓰게 된 음성 인식입니다 본문은 그냥 음성 인식이 만든 본문 여기다 남길 거예요 위에다가는 퇴근 한 번 손을대 잘못된 부분만 체크 한 걸 남길테니 한번 요즘 음성인식이 얼마나 잘 되는지 혹은 얼마나 안되는지 보시면 괜찮을 것 같아요


아 자러 갔어요 날아갔어요 Siri로 글쓰는 방법을 계속 말하고 있었는데 다 날아갔습니다 이거를 완료 버튼을 안 누르면 날아갔다는 걸 깨달았네요 어쨌든 폰으로 할 때는 편집이 제약이 있었는데 맥북에서 브런치 켜놓고 글쓰면서 노래 들으면서 편집 하면서 할 수 있는 건 되게 좋은 것 같애요 좀도 자주 써도 될 것 같다는 생각이 들어요


(그 뒤에 2번 연속으로 날아가서 Siri 받아쓰기는 포기함)



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari