세 동료와 자료조사-감수-대본 디벨롭-섭외-제작준비-촬영-연출을 했다.
만들어보고 싶은 영상 시리즈가 있어서 일단 시작해 버렸다.
하다 보니 생각보다 신경 쓸 것이 많아 괜한 일을 벌였나 싶기도 했는데,
혼자서 나 편할 대로 세 동료와 지지고 볶는 것으로 이런 결과물을 만들 수 있다니...
다큐 PD를 꿈꾸던 10~15년 전에는 상상도 못 하던 일이라고 생각하니 새삼 감지덕지.
세 동료의 이름은
chatGPT, Midjourney, Kling.ai
(어제 만든 장면 중에 세 명의 초등학생이 귀엽게 나란히 앉아있는 모습이 있어 커버이미지로 써봤다.)
사람과 한 마디 못하고 하루 종일 AI랑만 대화하며 든 짤막한 생각들을 남겨본다.
프롬프트를 입력하고 엔터 탁,
작업이 진행되는 동안 가챠 레버를 돌리는 것처럼 두근두근하다. 나는 특히 Midjourney에서 Vary 버튼을 누르는 게 제일 설렌다.
Subtle과 Strong 두 가지가 있는데,
- 지금 사진도 나쁘진 않아서 많이 손대고 싶진 않지만, 그래도 혹시 개선될 여지가 있을까? 기대하며 Strong을 누르고
- 거의 상상한 대로라 디테일들만 조금 보완됐으면 하는데 그게 뭔지는 나도 잘 모르겠다, 싶을 때는 Subtle을 선택한다.
같은 프롬프트로도 다른 결과물들이 나오고,
특정 결과물을 똑같이 재현하기도 어렵다는 점이
참 묘하다.
내 빈틈을 우연으로 메우는 것도,
아니 우연을 위해 빈틈을 남겨두는 것까지도 나름의 재미가 있다.
AI에게는 정말 자세하게, 풀어서 말해야 한다.
결과물이 잉? 스러운 부분은 보통
사람에게 설명하듯 두루뭉술하게 내뱉은 부분에서 나온다. (아직 내가 프롬프트 쓰는 것에 익숙하지 않아서일 수도 있지만)
예를 들어, ‘밥을 먹고 있는 1인칭 시점’이라고 표현하면 안 되고
‘식탁 위, 그릇에 썬 빵과 치즈가 담겨있고, 화면 하단에 손부터 아래 팔뚝까지가 보인다.’라고 표현해야 하는 식이다.
어제 내내, 추상적으로 묘사하던 장면과 분위기를
구체적인 사물과 구도와 빛의 종류 등으로 번역하는 머리를 쥐어짰다.
평소 사람들과 대화할 때에는 얼마나 구체적으로 이야기하려 노력했나 돌이켜본다.
생각이나 감정을 자세한 언어로 변환하는 일이 귀찮을 때, 자세히 짚어가기 자존심 상할 때..
너무 커다란 단어여서 아무 뜻도 아닌, 그런 대충의 단어들로 뭉갰던 적도 많다.
더 자세하고 구체적인 언어들로 표현해야겠다.
가까운 사람들에게는 더욱더.
이미지를 생성하는 Midjourney는
빠른 이미지 생성이 가능한 '시간' 단위로,
영상을 생성하는 Kling.ai나 Runway 등은
5초의 영상 한 단위를 생성하는 '건' 단위로 과금한다.
시급을 받는 아르바이트생, 혹은
건 단위 페이를 받는 프리랜서와 다를 바 없다, 하하.
Kling에서 5초짜리 영상을 생성하는 데에
Standard는 20크레딧, Professional은 35크레딧.
어제의 예로, 아이들이 뛰어가는 모습을 Standard로 했더니 아이들끼리 겹치고 징그러운... 사태가 벌어졌는데, Professional로 했더니 한 번에, 이렇게 깔끔할 수가!
그나마 이것은 Kling 1.6 버전이라 각각 20, 35 크레딧이고, Kling 2.0 Master 버전을 쓰면 5초 영상을 만드는데 100크레딧(약 0.8~1달러)이다.
빨리, 여러 안을, 높은 퀄리티로 만들고 싶으면 돈을 내어라.
아, chatGPT Pro 써야겠다.