AI가 만든 음성, AI가 보정! 무결점 오디오 레시피

스크립트 추출 후 편집을 거쳐 완벽 재탄생까지

by 이연곤

NotebookLM(노트북LM)의 혁신적인 '오디오 오버뷰''동영상 개요'을 통해 그래프에 대한 심층적인 설명을 제공받을 수 있고, 얼마나 강력한 인사이트를 얻을 수 있는지 경험했습니다.


이전글: "복잡한 차트, AI가 쉽게 풀어준다! AI로 그래프의 인사이트 한눈에 보기, 이해부터 영상 제작까지"


NotebookLM은 단순한 요약을 넘어, 차트가 포함된 구글 독스와 같은 멀티모달(multimodal) 자료를 분석하여, 데이터를 해독하고 새로운 지식을 발견하게 해주는 AI 연구 도구임을 확인했습니다.




AI 콘텐츠 제작의 마지막 1%를 완성하는 법


NotebookLM의 혁신적인 '오디오 오버뷰''동영상 개요' 기능 덕분에 방대한 자료를 순식간에 요약하고 학습하는 시대가 열렸습니다. 하지만 AI가 생성한 음성 콘텐츠는 때때로 미세한 발음 오류나 부자연스러운 톤으로 인해 최종 결과물의 품질을 저해할 수 있습니다.


콘텐츠의 스크립트를 완벽하게 다듬고, 무결점의 고품질 오디오로 재탄생시켜야 합니다.


이를 위해서 강력한 generate-speech 기능이 탑재된 AI가 필요하죠. 과연 무엇일까요?




NotebookLM과 Google AI Studio를 오가는 실습


음성 스크립트를 추출한 후 발음이 부정확한 문장을 수정하고, 수정한 문장을 다시 음성으로 만들어 콘텐츠의 질을 높이는 실전 워크플로우를 소개합니다.




1단계: NotebookLM - 지식 요약과 스크립트 확보

NotebookLM에서 출처 [추가] 버튼을 클릭하면 오디오 및 비디오 파일을 소스로 추가할 수 있습니다. [소스 업로드]를 클릭하거나 드래그 앤 드롭으로 '오디오 오버뷰''동영상 개요' 파일을 올려놓습니다.


그 다음, 출처로 등록된 '오디오 오버뷰' 또는 '동영상 개요' 파일만 선택한 후 스크립트 추출 요청을 합니다.



프롬프트:

스크립트를 추출해



[참고] 오디오 오버뷰 파일:





2단계: 스크립트 정밀 교정 (오류 제거 및 사용자 경험 개선)

추출한 스크립트를 꼼꼼하게 검토하고 교정하는 단계입니다.



안녕하세요. 오늘 저희와 함께 좀 깊이 파고들 주제 바로 디지털 전환입니다. 어 제공해 주신 여러 자료들, 특히 그 디지털 대전환 교육이라는 책 내용 중심으로 그 의미와 파급력 한번 제대로 살펴보겠습니다. 야 근데 시작부터 개념이 아주 강렬해요. 자료 보니까 앞으로 모든 기업이 디지털 약탈자 아니면 디지털 희생량 둘 중 하나가 된다. 뭐 이런 경고가 있더라고요.

네. 그렇죠. 그게 뭐랄까 기술 변화를 잘 타서 시장을 를 확 휘어잡는 쪽이 약탈자. 반대로 이제 변화 속도를 못 따라가면 희생이 된다는 어 상당히 좀 도발적인 관점이죠.

네. 상당히 도발적이에요. 그래서 이번 탐구에서는이 디지털 격차 문제 어 특히 인공지능 AI 도입 관련해서요. 산업 현장이 지금 어떻게 바뀌고 있는지 그리고 이게 왜 지금 우리 교육에 던지는 메시지가 이렇게 중요하고 또 시급한 건지 한번 연결해 보려고 합니다. 자료들을 좀 침반 삼아서 그 핵심을 한번 같이 파헤쳐 보시죠. 자 그럼 먼저 산업계 이야기부터 좀 해 볼까요? 자료를 보니까 음 벌써 발빠른 기업들은 생성형 AI 있잖아요. 뭐 ChatGPT (챗GPT)같은 거요. 이걸 문서 작성이나 어 소프트웨어 코드 만들고 심지어 고객 응대까지 여기저기 막 쓰면서 생산성을 엄청 높이고 있다고 하더라고요. 진짜 뭐 새로운 연장을 얻은 것처럼요.

네. 그게 바로 이제 약탈자로 가는 길인 셈인데요. 근데 또 자료의 다른 쪽을 보면 여전히 많은 기업들은 좀 망설리고 있다, 이 점도 지적을 해요. 줄어주로 나오는 얘기가 뭐 데이터 보안 우려라든가 아니면 아직 법이나 제도가 좀 불명확하다 이런 거거든요.

아, 그런 현실적인 문제들이 있군요.

네. 그래서 이런 이유로 AI 도입을 좀 주저하거나 늦추다 보면 어, 결과적으로는 똑같은 시간, 똑같은 인력을 쓰는데도 효율은 훨씬 떨어지는 거죠. 약간 그런 구조적인 문제에 빠지게 된다는 분석이에요. 이게 바로 자료에서 말하는 희생의 경우일 수 있다는 거고요. 결국 디지털 기술을 얼마나 빨리 또 효과적으로 받아들이냐가 기업의 생존이랑 직결되는 시대다. 이걸 보여 주는 거죠.

아, 단순히 그냥 기술을 썼다 안 썼다, 이 차원을 넘어서는 거네요. 그 결과가 실제 효율성 차이로 나타난다는 그 데이터도 재밌던데요. 어떤 조사 보니까 AI 잘 쓰는 기업이란 그렇지 않은 기업 사이에 평균 업무 효율이 어 통계적으로 의미 있을 정도로 차이가 난다고요. 이게 어느 정도인가요?


네. 그 첫 번째 시각 자료 AI 도입과 생산성 관련 조사 결과 차트 한번 보시면요. 그 차이가 숫자로 딱 보입니다. PWC 자료는 2018년부터 2022년까지 한 5년 동안 AI 기술의 비교적 많이 노출된 산업군. 이걸 AI-exposed sectors 라고 있죠. 여기는 연평균 생산성 증가율이 4.3%였어요.

4.3%요.

네. 그런데 AI 노출이 좀 적었던 산업군, Less-exposed sectors 는 같은 기간에 0.9% 증가에 그쳤습니다.

와. 0.9%대 4.3%면 거의 다섯 배 가까이 차이 나는 거 아닌가요?

맞습니다. 상당한 격차죠. 산업군별 평균으로 봐도 이렇게 차이가 확나는 거예요.

이야, 정말이네요.

그리고 특히 좀 주목해야 할 데이터가 가트너 조사 결과인데요. 그냥 AI 프로젝트를 뭐 시작했다 이게 아니고요. 일정 규모 이상으로 AI 프로젝트를 운영하는 단계, 그러니까 AI projects at scale 에 도달했을 때요, 개별 프로젝트 차원에서 보고된 생산성 개선 효과가 평균적으로 약 23%에 달했다는 거예요.

23%요, 프로젝트 하나만으로요.

네. 이게 진짜 중요한 포인트 같은데요. AI 도입이 그냥 뭐 시험삼아 해보거나 보여주기식이 아니라 조직 전체 역량이랑 딱 결합될 때 그때 정말 폭발적인 시너지가 날 수 있다. 이런 가능성을 보여주는 수치라고 봐요. 그 약탈자 기업들이 어떻게 경쟁 오일을 만들어 가는지 좀 엿볼 수 있는 부분이죠.

와, 23% 개선이라니 특정 프로젝트 하나만으로도 그 정도 효과면 이게 만약에 회사 전체로 퍼진다면 그 파급력은 뭐 상상하기 어렵겠는데요.

바로 그 지점입니다. 거기서 이제 두 번째 시각 자료 맥킨지 분석이 또 의미가 있는 거죠.이 자료는 특히 생성형 AI, GenAI (젠AI)가 가져올 잠재적인 연간 생산성 향상 효과를 열하는데요. 분석 결과를 보면 전 세계 경제 전체로 봤을 때 연간 0.5에서 3.4% 포인트, PP, 범위의 생산성 증대가 가능할 거다. 이렇게 보고 있어요.

아, 잠시만요. 퍼센트 포인트, PP요, 그냥 퍼센트가 아니고요.

네, 맞아요. 퍼센트 포인트. 이게 뭐냐면 기존 성장에 더해서 추가로 얼마로 더 성장하는지 그 크기를 나타내는 단위거든요. 예를 들어서 기존 경제 성장률이 뭐 한 2%였다고 치면요, GenAI 도입으로 최대 5.4% 그러니까 2% + 3.4% 포인트, 여기까지 성장할 수 있다는 그런 잠재력을 말하는 겁니다. 단순 비율 증가가 아니라 증가 유일 자체가 더 커진다는 거죠.

아하. 그렇군요. 퍼센트 포인트라는게 그런 의미였네요. 그냥 몇 % 늘었다는 것보다 훨씬 더 큰 파급력을 가진 수치네요.

네. 그렇습니다. 그리고 진짜 주목해야 할 부분이 뭐냐면이 효과가 매년 발생할 수 있는 잠재력이라는 거예요. 한번 딱 좋아지고 끝나는게 아니고요. 해마다 0.5에서 3.4% 포인트만큼 생산성 향상이 쌓여갈 수 있다는 거죠. 누적되는 거예요. 라고(한번) 생각해 보세요. AI를 잘 쓰는 기업이나 국가랑 그렇지 못한 쪽의 격차는 이건 뭐 정말 기하급수적으로 벌어질 수밖에 없어요. 이 수치가 중요한 건 단순히 효율성 개선이 아니라 성장 속도 자체가 달라진다는 걸 의미하기 때문이에요. 매년 3%씩만 격차가 벌어져도 한 5년 뒤에는 뭐 경쟁사라는 완전히 다른 세상에 살게 될 수도 있다는 거죠. 이게 바로 자료에서 계속 경고하는 디지털 약탈자와 희생양의 격차가 벌어지는 아주 현실적인 메커니즘이라고 할 수 있습니다.

와, 연간 최대 3.4% 포인트 향상, 그것도 매년 누적이라뇨? 이렇게 되면 AI를 제대로 쓰는 기업과 그렇지 못한 기업간의 차이는 정말 걷잡을 수 없겠는데요. 이 약탈자 대 희생량 구도가 어 진짜 현실적인 위협으로 다가 오네요. 이런 산업계의 엄청난 변화는 당연히 다음 세대를 키우는 교육계에도 큰 질문을 던질 수밖에 없겠군요.

정확합니다. 자료에서도 바로 그 부분을 굉장히 강조하고 있어요. 산업 현장에서 벌어지는 이 약탈자 대 희생양 구도가 결국 우리 교육이 왜 변화야 하는지, 왜 디지털 영향을 갖춘 인재 양성이 이렇게 시급한 과제인지 설명하는 아주 강력한 배경이 된다는 거죠. 이건 뭐 더 이상 특정 기업의 생존 전략 이런 차원의 문제가 아닌 거예요. 앞으로 우리 사회를 이끌어갈 젊은 세대일 있잖아요. 이 친구들이 변화된 세상에서 희생량이 되지 않고 자기 길을 잘 찾아갈 수 있도록 준비시켜야 하는 문제죠. 어떻게 보면 교육의 가장 근본적인 책임과 맞다 있는 겁니다.


교육 현장에서도 이런 위기감을 좀 느끼고 변화를 시도하고 있다는 내용도 있었죠.

네, 맞아요. 변화의 조짐은 분명히 나타나고 있습니다. 자료 보니까 이미 전국 초중고등학교에서 AI 기초 소양이나 뭐 데이터 과학 관련 과목들이 선택 과목 형태로 막 생겨나고 있다고 하고요. 또 교사분들 연수 프로그램에도 디지털 도구를 활용한 교수법이라든가, AI 윤리 같은 내용들이 필수로 들어가기 시작했대요.

아, 가르치는 내용뿐만 아니라 방법까지도요.

그렇죠. 단순히 새로운 지식만 가르치는게 아니라 가르치는 방법 자체를 좀 디지털 지대에 맞게 바꾸려는 고민이 시작된 거죠. 물론 뭐 산업계 변화 속도에 비하면 아직 갈길이 멀다 이런 지적도 같이 나오긴 합니다만 그래도 방향 자체는 잡아가고 있다고 볼 수 있을 것 같아요.

구체적인 학교 사례도 되게 인상 깊었어요. DC시에 있는 어떤 고등학교 이야기가 나왔는데 거기는 생성형 AI를 그냥 쓰는 걸 넘어서 수업 프로젝트에 아주 깊숙히 활용했더니 결과가 놀라웠다고요.

네. 그 사례가 시사하는 바가 정말 큽니다. 그 고등학교에서는 예를 들면 학생들이 뭐 연구 주제 찾고 자료 분석하고 발표자료 만드는 그 모든 과정에 생성형 AI를 약간 보조도구처럼 활용하는 프로젝트 기반 수업을 했다고 해요. 그랬더니 이 수업에 참여한 학생들 대상으로 측정을 해 봤는데 복잡한 문제를 해결하는 능력 점수라든가 또 스스로 학습 목표를 정하고 탐구하는 자기 주도 학습 참여율, 이런 것들이 이전보다 무려 40% 이상 향상되었다는 보고가 있었습니다.

와, 40%요? 40% 향상이면 진짜 대단한 변화인데요. 이게 단순히 뭐 AI 사용법을 배웠다, 이게 아니라 학습 능력 자체가 좋아졌다는 의미로 볼 수 있겠네요.

바로 그겁니다. 이 D 고교 사례는 미래 교육이 어디로 가야 하는지, 특히 어떻게 가르치고 배울 것인가에 대한 굉장히 중요한 단서를 준다고 생각해요. 예전에는 정해진 지식을 무엇을 가르칠 거냐 여기에 집중했다면요, 이제는 AI 같은 강력한 도구를 활용해서 학생들이 스스로 질문 던지고 정보 찾고 답을 찾아가는 그 과정을 어떻게 설계하고 지원할 거냐 이걸로 교육의 패러다임이 바뀌고 있다는 걸 보여 주는 거죠.

음. 그렇군요.

본질적으로 이 학는 학생들이 미래 사회에서 디지털 휘생량희생양이 되지 않도록 문제 해결 능력 그 자체 그리고 배우는 능력 그 자체를 키워 주는 시도를 하고 있는 셈이에요. 자료에서 계속 디지털 전환이 미래의 선택이 아니라 현재의 생존 이라고 강조하는 이유가 바로 여기에 있는 것 같습니다. 교육계 역시 이 변화를 생존 전략의 관점에서 바라보기 시작했다. 이런 증거라고 볼 수 있겠죠.

아, 듣고 보니 정말 교육의 역할이 달라지고 있다는 게 확 느껴집니다. 단순히 지식 전달자가 아니라 학생들이 스스로 좀 항해할 수 있게 돕는 그런 길잡이 역할이 중요해지는 것 같네요. 그렇다면 이 모든 이야기들을 좀 종합해 볼 때 우리가 여기서 얻을 수 있는 핵심 메시지는 뭘까요?


네. 자료 전체를 쭉 관통하는 메시지는 아직 명확한 것 같아요. 결국 교육 시스템 자체가 먼저이 디지털 시대에 맞게 변화해야 한다는 겁니다. 그래야만 학생들이 새로운 시대가 요구하는 역량 뭐 예를 들면 AI를 이해하고 잘 활용하면서도 또 비판적으로 생각하는 능력 이런 걸 갖출 수 있다는 거죠. 그리고 그렇게 변화된 역량을 갖춘 학생들이 사회로 나와야만 우리 사회 전체가이 격변하는 디지털 전환기에서 뒤쳐지지 않고 계속 발전해 나갈 수 있다, 이런 강력한 주장입니다. 교육의 혁신이 곧 사회 전체의 미래 경쟁력과 직결된다는 것. 어떻게 보면 당연한 말 같지만 그 어느 때보다도 좀 절실하게 들리는 외침이라고 할 수 있겠습니다.

네. 오늘 저희와 함께한 이 탐구를 통해서 우리는 AI 도입을 중심으로 한 디지털 전환이 산업계에서 어떻게 그 디지털 약탈자와 디지털 희생량이라는 뚜렷한 구도를 만들어 내고 있는지 그리고 이게 또 PWC나 가트너 맥킨지 같은 여러 데이터를 통해서 구체적으로 측정 가능한 생산성 격차로 나타나고 있다는 걸 확인했습니다. 또한 이런 거대한 변화가 단순히 산업 현장의 문제를 넘어서 우리 교육 시스템에 던지는 과제가 얼마나 시급하고 또 근본적인지 그리고 D 고교 사례처럼 변화를 만들어 가려는 현장의 노력과 그 중요성에 대해서도 깊이 있게 이야기를 나눠봤습니다. 제공해 주신 자료들 덕편덕분에 이 복잡한 주제의 핵심을 좀 잘 짚어 볼 수 있었던 것 같네요.


네. 마지막으로 오늘 나눈 이야기들을 바탕으로 듣고 계신 분들께 한 가지 질문을 던지면서 마무리하고 싶습니다. 자료에서는 교육을 디지털 시대의 생존 전력이라고까지 표현하면서 그 중요성을 엄청나게 강조했잖아요. 만약 이게 정말 사실이라면 우리의 학습 시스템 뭐 그게 공교육이든 평생 교육이든요. 이런 시대 변화의 속도를 충분히 따라잡지 못하고 좀 뒤쳐지게 된다면 어떻게 될까요? 산업계의 디지털 희생처럼 교육 시스템 자체가 혹은 그 시스템 안에서 충분한 기회를 얻지 못한 개인들이 교육적 희생이 되는 시나리오. 이건 장기적으로 우리 사회에 어떤 결과를 가져올까요? 단순히 뭐 개인의 부른불운이다 이걸 넘어서 사회 전체의 활력이나 미래를 갉아먹는 더 큰 문제가 되 않을지 한번쯤 깊이 고민해보실 만한점이라고 생각합니다.

네. 정말 곱씹어볼 만한 질문입니다. 교육적 희생이라. 오늘 저희와 함께 이 깊이 있는 탐구에 참여해 주셔서 감사합니다.



위 교정을 보면, 짙은 빨강 폰트로 된 부분이 포함된 문장은 새롭게 오디오를 생성해야할 부분이라고 보시면 됩니다.





3단계: Google AI Studio - 무결점 오디오 재생성

Google AI Studiogenerate-speech 기능은 고품질의 텍스트-음성 변환(TTS)을 제공합니다. 2단계에서 완벽하게 다듬어진 스크립트를 이 기능을 통해 새로운 음성 파일로 변환합니다.


1. Google AI Studio에 접속하여 generate-speech 기능을 선택합니다. https://aistudio.google.com/generate-speech

2. 'Mode'에서 'Single-speaker audio'를 클릭합니다.

3. 'Text'란에 문장을 붙여넣거나 적습니다.

4. 'Voice' 드롭다운 버튼을 클릭하여 여성 또는 남성 음성을 직접 듣고, 그 중 하나를 클릭하여 선택합니다.

5. 하단의 [Run] 버튼을 클릭하면, 새로운 음성이 생성되고, 완료되면 새로운 음성이 재생됩니다.

6. 직접 음성을 들어보고 틀린 발음이 있다면 3번부터 5번을 반복 수행합니다.

7. 최종 생성된 음성을 다운로드 할 수 있습니다.




4단계: 최종 품질 극대화

NotebookLM을 통해 얻은 오디오 및 영상에 Google AI Studiogenerate-speech로 재생성한 음성을 결합하여 컨텐츠의 품질을 높일 수 있습니다.





AI 콘텐츠 제작의 새로운 표준


NotebookLM이 데이터 분석과 지식 탐색의 효율을 극대화했다면, Google AI Studio는 그 결과물을 상업적으로나 교육적으로 완벽하게 사용할 수 있는 수준으로 끌어올립니다.

이 'AI가 만든 음성, AI가 보정! 무결점 오디오 레시피'를 통해 여러분은 스크립트 추출의 용이성, 편집을 통한 정확성 확보, 그리고 재생성을 통한 최고 품질의 오디오를 얻을 수 있는 워크플로우가 될 것입니다.


NotebookLM의 인사이트 추출 능력Google AI Studio의 정교한 음성 합성 능력을 결합하여, 여러분의 콘텐츠 제작 워크플로우를 한 단계 업그레이드할 준비가 되셨나요? :)


keyword
이전 09화복잡한 차트, AI가 쉽게 풀어준다!