AI 가상인물에 목소리를 입히다
공모전( AI for good film festival)에 참여하기 위해서 AI 영상을 준비하고 있습니다. 영상 제작 프로세스는 아래와 같습니다.
1. 콘티 제작
2. AI 인물(주인공) 이미지 생성
3. 각 씬별 레퍼런스 AI 이미지 생성
4. 각 씬별 AI 영상 제작
모든 단계에서 시행착오가 있었던 것 같은데.. 이전 포스트에 자세히 작성해두었으니 궁금하면 참조해주세요!
이제 전반적인 영상 클립은 제작이 완성되어, 음성을 입히면서 튜닝을 하려합니다. 음성 툴은 여러 유튜버가 소개했던 일레븐랩스 AI(ElevenLabs) 를 활용했습니다. 생각보다 사용법도 간단하고, 만족도도 높았습니다.
일레븐랩스 AI(ElevenLabs) 사용 주요 3단계를 소개드립니다.
먼저 콘티단계에서 설정한 인물의 특징, 성격 등의 키워드를 지피티, 제미나이 등 LLM AI툴에게 설명하고 보이스 제작 프롬프를 만들어 달라고 합니다.
일레븐랩스 AI(ElevenLabs)에서 제공하는 ‘Best practices’링크를 같이 입력하면 좋습니다.
로딩 후 목소리가 생성될텐데, 다시 생성할 때마다 목소리 톤과 어투, 속도 등이 미세하게 계속 달라집니다. 한번 새로고침을 하면 다시 그 해당 AI보이스는 다시 찾을 수 없기 때문에, 맘에 들면 바로 저장하는 것을 추천합니다.
저는 같은 프롬프트로 최소 2-3개 정도 만들어 두고 활용했습니다. 일단 옵션을 몇 개 만들어 두면, 음성을 제작할 때 실제 활용할 대사를 입혀보면서 더 괜찮은 AI 보이스를 찾는데 도움이 되었습니다.
대사를 그냥 입력하면 상상한 어조대로 안 나오고, 로봇처럼 읽어줄 때가 많습니다. 특히 한국어 모델은 더욱 어색합니다. 이를 방지하기 위해 일레븐랩스 AI(ElevenLabs)에서는 감정태그 기능을 지원합니다. 문장 앞 뒤에 감정을 적어주면 반영해서 AI음성이 생성됩니다.
본인이 생각하는 뉘앙스나 느낌이 추상적이라 적절한 감정 단어가 생각나지 않는다면, AI의 도움을 받아 키워드로 바꿔주면 됩니다.
몇 번 반복하다 보면 점점 더 퀄리티 있는 AI 보이스를 생성할 수 있습니다. AI 영상 제작자들 모두 화이팅!