반복 작업을 효율화하고 디테일까지 잡는 방법
'AI fot good film festival '공모전을 준비하고 있습니다. 콘티 작업과 간단한 스토리보드 작성을 마치고, 이미지를 생성하고 있습니다. 영상작업에 필요한 각 씬별 레퍼런스 이미지가 있으면 원하는 방향으로 영상을 만들기 쉬워진다는 걸 그간 유튜브 영상을 제작하며 알게됐습니다.
공모전용 영상이다보니, 각 씬의 호흡이 길고 인물들의 일관성을 유지하는 것이 중요했습니다. 인물의 외관을 유지하면서 새로운 씬의 레퍼런스 이미지를 계속 만들어야했습니다. 까다롭고 디테일한 수정사항을 요구하는 이미지 생성 요청을 반복해서 작성해야했습니다..
지난AI Image lesson 포스트에 적었듯, 바로 이미지 툴에서 프롬프트를 입력하는 것보다 텍스트 프롬프트 툴(GPT, gemini) 에서 표준 이미지 생성프롬프트 지침에 맞게 정제하는 과정을 먼저 거치고 있습니다.그런데 계속해서 유사하면서도 조금씩 변주되는 요청들을 줄글로 설명하는게 생산성이 떨어진다는 생각이 들었습니다.
다른 툴을 찾아볼까 생각도 했지만 GPT, Gemini의 인터페이스도 이미 훌륭하다고 생각했습니다. 고민을 하다 개발자들이 코딩할 때 명령어를 정의하는 것처럼 어떤 '단축어'를 정의하는 방식을 활용해보았습니다.
'*프롬프트' 를 입력하면, 앞서 히스토리와 맥락을 반영하여 요구사항에 맞는 프롬프트를 생성해달라는 요청이라 명시했습니다. 대화창에서 여러가지 작업과 질문을 번갈아 요청하다보니 구분할 필요가 있었기 때문입니다. '이제부터 다시 이미지 프롬프트를..'로 작성하는 것보단 확실히 편했습니다(사실 더 짧게 '*프' 이런식으로도 정의 가능했겠지요!
그리고 디테일한 내용을 변주하기 위해 반드시 설명해야하는 몇 가지 조건문들도 같이 넣었습니다. 이런 것들은 하나하나 풀어서 설명하면 너무 길기 때문에 단축어의 효과가 굉장했습니다...!
첫 시도에서는 출력값의 형식까지 바뀌어서 문제가 됐습니다. 원래 대답 형태가 표준 이미지 생성 프롬프트에 맞게 작성해둔 것이었기 떄문입니다.
이 부분만 다시 요청해서 원하는 방향으로 수정했습니다.
그리고 사소하지만 생산성을 높일 수 있는 팁. GPT에서는 출력내용을 버튼으로 복사할 수 있는 기능을 지원합니다. 'canvas' 기능으로, 옵션으로도 선택이 가능합니다. 매번 긴 문장을 드래그해서 복사하는게 귀찮으니 해당 기능을 써달라고 했습니다.(알면서 왜 진작 안 했을까?)
이 사전작업들을 하고 나서는 훨씬 프롬프트 작성이 용이해졌습니다 ㅎㅎ 결과물의 퀄리티도 좋아졌습니다. 즉, 디테일이 안 잡혀 다시 요구하는 일이 줄어들었습니다.