brunch

You can make anything
by writing

C.S.Lewis

by 누리 Sep 10. 2023

AI로 '불필요한 말버릇 교정기' 만들기 프로젝트(1)

'이제'는 이제 그만

그러니까, 이제, 이다음 ppt를 보면 이제, 기업 가치가 우상향 하는데요~


가끔 누군가와 대화를 하거나 발표를 듣다 보면 '이제'라는 단어가 없인 한 문장도 말을 못 하는 분들이 계십니다. 만약 술자리에서 '막', '약간', '~것 같아', '그러니까', '아니 근데' 같은 단어 쓸 때마다 한 잔씩 마시는 술게임을 한다면 저는 아마 5분 만에 소주 한 병을 비워야 할 겁니다.

이런 술게임을 하면 안주 나오기 전에 만취할 듯


왜 쓰는지도 모르겠고, 딱히 의미 전달에 도움도 안 되고, 오히려 매끄러운 말하기에 방해가 되는 불필요한 말버릇들. 생각보다 가지고 계신 분들! 저 포함해서 정말 많습니다.


ChatGPT 에게 왜 불필요한 말버릇이 생기는지 물어보았습니다.


음.. 그렇다고 합니다. 그래서 스스로 인지하지 못하고 쓰는 1) 불필요한 말버릇을 알려주고, 2) 교정하게 도와주어, 3) 보다 매끄럽게 대화할 수 있도록 도와주면 너무 재밌을 것 같다는 생각을 하게 되었습니다.


덧, MBTI 별 말버릇도 있다고 하네요 ㅎㅎ


본격적으로 뽀개기를 위해 '한 달 반'으로 타임라인을 잡고 가능하면 아주 단순한 형태의 서비스로 구현해 보기로 했습니다.

본인의 불필요한 말버릇이 궁금하다면 일단 베타테스터 신청부터 고고! 무료로 말버릇 리포트를 만들어 드립니다. 신청 링크 (잘… 해드릴게요!)



차근차근 한 단계씩


1. 불필요한 말버릇 리스트를 만듭니다.  

chatGPT에게 불필요한 말버릇이 뭐가 있는지 물어보았습니다.

그리고 직접 N명 이상의 - 일상 대화 혹은 회의 내용을 녹음하여 불필요하지만 자주 쓰는 단어가 있는지 확인하여 그때그때 리스트에 추가해 둡니다.

그리고 위 리스트를 정리하여 ChatGPT에게 '불필요한 말버릇 리스트'로 학습시킵니다.


2. 음성을 텍스트로 전환합니다.

STT - (Speech-to-Text) 기술로 음성을 텍스트로 변환합니다. STT는 음성 인식 알고리즘을 사용하여 사람의 말을 텍스트 형태로 변환하는데요, 스마트폰의 음성 검색, 음성 메모, 자동자막 생성 등에 활용됩니다.

가장 유명한 STT 서비스 중 하나인 Whisper ai를 활용해서 텍스트를 추출할 수 있습니다. 이외에 Vrew라는 툴 또한 음성 혹은 영상에서 텍스트를 추출할 수 있습니다.


3. ChatGPT로 불필요한 말버릇 보고서 생성하기

ChatGPT에게 전환된 텍스트 파일을 입력하고, 불필요한 말버릇을 분석해 달라고 합니다. 이때 희망하는 템플릿이 있다면, 이를 Custom Instruction에 미리 입력해 두고 리포트 형식을 추출할 수 있을 것으로 생각됩니다.



실제로 해보자! 테스트


1. 본인의 지난주 사이드프로젝트 스터디 발표를 텍스트로 추출했습니다.  

발표 내용은 미드저니를 활용해서 캐릭터를 그려 당근마켓에서 판 썰이었습니다. 약 6분 분량의 음성을  Whisper ai로 추출했는데 크게 세 가지 문제를 발견했습니다.

1) 화자 분리가 안됨 : 여러 명이 이야기를 하면 - 각각의 음성을 누가 말했는지 구분이 되어야 하는데 구분이 아예 불가능합니다.

2) 간투어 삭제 : 아... 어... 음 과 같은 불필요한 말버릇을 '간투어'라고 하는데요, 간투어를 빼고 추출해 줍니다. 자막을 만들거나 할 때는 간투어가 저절로 없어진 텍스트 파일을 받는 것이 효율적이겠으나, 저는 불필요한 말버릇을 토씨 하나 빼지 않고 받아야 더 정확히 분석을 할 수 있으니 가장 큰 문제입니다.

3) 시간 : 생각보다 추출시간이 오래 걸립니다.


어쨌든 추출한 결과를 ChatGPT에게 분석해 보라고 시켰습니다.

추출된 발표내용 > 텍스트의 일부


2. ChatGPT로 발표 내용 분석 결과

꽤나 결과는 잘 뽑아 줍니다. 텍스트로 추출된 음성 파일에 간투어가 살아있고, 프롬프트를 조금 더 다듬으면 보다 흥미로운 리포트가 생성될 수 있을 것 같습니다.


아, 어, 음 간투어를 살리자!


간투어를 어떻게 살리지 고민하고 있는데, 회사의 디자이너분께서 'Vito'라는 서비스를 소개해주었습니다. 마침 스터디에서 만난 지인분이 재직 중인 회사 서비스더라고요! 매월 100시간 까지는 무료 사용도 가능!

화자 분리 가능, 간투어 살리기 가능, 속도도 빠름!


그리고 지인 개발자에게 세팅 방법을 물어보자, postman 이라는 서비스를 통해 호출할 수 있게 도와주었습니다. (사랑합니다, 님 최고!)

config라는 테이블에 걸고 싶은 조건 값을 입력해 주면 되는데요,


{"use_itn": true, "use_disfluency_filter": false,  "use_diarization": true,

  "diarization": {

    "spk_count": 2

  },

  "use_paragraph_splitter": true,

  "paragraph_splitter": {

    "max": 130

  }}


순서대로, 영어/숫자 변환, 간투어 필터 미적용, 화자 분리, 화자는 2명, 문단 깔끔하게 나누고, 문단 길이는 길게(130)로 설정해서 대화를 추출했습니다. 결과는 꽤나 만족스럽습니다. 비토 짱짱



베타테스터 50명을 모아라!


브런치, 지피터스 커뮤니티, 지인을 총 동원하여 본인의 불필요한 말버릇 리포트를 받고 싶은 베타테스터 50명을 모집해서 서비스를 개선하려고 합니다.

    통화녹음, 일상대화 녹음, 발표 영상 등을 제공받고  

    이를 분석하여 말버릇 리포트를 제공해 주고  

    서비스 개선에 반영할 예정입니다.  

    가능하신 분들은 추가 인터뷰도 하면 좋겠네요!  


에어테이블로 베타테스터 신청 링크를 만들었습니다.



그리고 이 글을 읽고 계신 당신, 혹시 무의식적으로 쓰고 있는 말버릇이 궁금하지 않으십니까? 그럼 베타테스터 신청하시죠! 신청 링크 (실망시키지 않겠습니다)


곧 서비스 출시하고 소소하게 수익까지 창출해 보겠습니다. 2탄을 기대해 주세요!


함께 읽으면 좋은 글




윤누리

운동과 술을 사랑하는 자유로운 영혼. 석유화학회사를 때려치우고 와인 공부하다 스타트업에 정착했다. 창의성과 영감이 샘솟는 삶을 위해, 인생을 변화시킨 사람과 문장들을 수집 중이다.


(현) 국내 최대 인공지능 커뮤니티 지피터스, 커뮤니티 리더

'일곱잔' 와인바 사장 @신사


(전) 와이아웃 커뮤니티, 운영 리드

와디즈 경영추진팀

패스트파이브 커뮤니티 크리에이터팀

독일 UNCCD(유엔사막화 방지기구) FCMI 팀

석유화학회사 환경안전경영팀

서울대학교 과학교육, 글로벌환경경영 전공

산림청 주관, 유네스코 - DMZ 지역 산림 생태 연구 인턴

한국장학재단 홍보 대사

4-H 동시통역사, 캐나다 파견 대표

서울대학교 아시아 연구소 1기 인턴 팀장

서울대학교 국제 협력본부 학생대사 이벤트 팀장

와인 21 객원 기자, 레뱅드매일, 파이니스트 와인 수입사 홍보 대사

이전 12화 압구정 와인바 1위 탈환 대작전 with ChatGPT
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari