brunch

You can make anything
by writing

C.S.Lewis

by Rumierumie Oct 26. 2024

예술 감독처럼 AI 어시스턴트와 대화하기

몇 년 전, 디트로이트에서 20명이 넘는 사람들과 함께 워크샵을 한 적이 있다.

신규 서비스 컨셉을 발표하는 자리였다. 청중은 PM, PO, 서비스 운영자, 그리고 앞으로 새로운 서비스를 만들어 갈 여러 이해관계자들이었다. 발표를 앞두고 손에 땀이 났다. 유독 긴장했던 이유는, 내가 발표해야 할 20장의 슬라이드에 만화가 그려져 있기 때문이었다. 단순히 만화처럼 보이지만 - 내가 준비한 것은 미래의 고객 퍼소나가 신규 서비스를 어떻게 이용할지, 컨셉을 스토리텔링으로 풀어나가는 용도였다.


스토리텔링에는 여러 가지 방식이 있지만, 나는 만화를 읽는 것처럼 쉽고 친근한 스타일을 택했다. 가뜩이나 신규 서비스 관련된 사람들이 많이 모인 자리라, 딱딱해지기 쉬운 분위기를 풀어주고 싶었다. 만화 같은 발표를 보면서, 사람들이 미래의 고객이 각 순간에 어떤 행동을 할지 상상할 수 있기를 바랐다. 슬라이드를 넘기며 설명을 이어가는데, 듣는 사람들의 표정에 호기심이 피어나기 시작했다. 다음 장면엔 뭐가 나올까? 이 장면에서 설명하는 상황이 우리 팀의 작업에 어떤 영향을 끼칠까? 그런 생각들을 하고 있는 것 같았다.


발표가 끝난 후 회의실은 질문과 토론으로 가득 찼지만, 만화 같은 발표 때문인지 서비스 컨셉을 조금 가볍게 받아들이는 사람도 있었다. “더 효과적으로 사람들에게 이야기를 전달할 수는 없을까?”


좀 더 전문적인 컨셉 발표 자료를 준비하고 싶은 욕심도 있었다. 제작 시간과 예산 문제로 일찌감치 까였지만-컨셉을 명확히 이해할 수 있는 짧은 영상으로 전달하는 아이디어를 냈었다. 배우들이 출연하고, 대사도 있고, 문제가 일어나는 상황과 해결방안을 드라마틱하게 연출할 수 있는 짧은 영화 같은 포맷으로 이야기를 전달했다면 듣는 사람들이 더 진지한 태도를 보여줬을까? 퀄리티 높은 영상과 이미지를 생성해 주는 AI 어시스턴트가 있었다면, 예산이나 제작 기간을 걱정하지 않고 전혀 다른 컨셉 발표 자료를 만들 수 있었을지도 모른다.  


사람들의 시선을 사로잡는 이미지, 어떻게 만드는 걸까

작년부터 AI 툴로 영상과 이미지를 만들고 있는 친구에게, 최근에 DALL-E로 생성한 결과물을 보냈다. 내가 원하는 대로 결과물의 디테일이 수정되지 않아서 답답하다고 불평을 했다. 몇 분 후에, 그 친구는 내가 만든 스토리보드를 응용한 새로운 이미지를 보내줬다. 푸르스름한 분위기, 커피를 내리는 커플, 창 밖으로 보이는 도시 풍경… 분명 비슷한데 친구가 만든 이미지에 훨씬 더 눈이 갔다.

왼쪽: 내가 DALL-E로 생성한 이미지 / 오른쪽: 친구가 Midjourney로 생성한 이미지


왜 친구가 만든 버전이 더 멋있어 보일까?

친구는 ‘Midjourney’를 사용했는데, 이 도구는 고품질 이미지를 생성하는 대표적인 AI 툴 중 하나다. DALL-E의 성능이 Midjourney보다 떨어지는 걸까, 궁금해서 친구에게 어떤 식으로 이미지를 요청했는지 보여달라고 했다. 아하, 도구를 탓할 게 아니라 프롬프트 수준을 탓해야 했다. 친구가 보내준 프롬프트에는 명령어와 파라미터*가 세세하게 추가되어 있었다. AI가 작성자의 의도를 정확하게 파악할 수 있도록 섬세한 조정을 한 것이다. 친구는 프롬프트를 작성할 때 기억해야 할 게 있다고 했다.

* 미드저니 파라미터 종류 - https://docs.midjourney.com/docs/parameter-list ​  


You need to think like you’re an art director.


예술 감독 되기

예술 감독처럼 생각해야 해 - 그게 전부였다. 이미지를 생성하는 것에도 섬세한 조정이 필요한데, 영상은 더했다.

친구는 ‘Runway’라는 영상 생성 AI 툴을 소개해줬다. 이번엔 무작정 프롬프트를 적지 않고, 가이드를 먼저 읽어봤다. 프롬프트와 명령어의 구조를 이해하는 게 도움이 될 거라는 친구의 조언 덕분이다. 조명은 어떻게 할까? 카메라는 어떤 종류일까? 홈비디오, HD, 아니면 항공샷을 찍을 수 있는 드론? 장면의 길이는 얼마나 될까? 카메라 전환은 어떤 방식으로? 짧은 영상임에도 생각해야 할 요소들이 이렇게나 많다니, 그걸 미처 몰랐다. 예술 감독처럼 생각하고 요청하려면, 도구와 소통하는 방식을 배워서 결과물을 도출하는 방법을 익혀야 했다.

Runway 인터페이스 - 시각효과를 디테일하게 수정할 수 있다


해리포터의 움직이는 사진들처럼

몇 번의 시도 끝에 무료 계정 크레딧을 다 써버렸다. 결과물은 확실히 나아졌다. 캐릭터들이 웃고, 카메라 움직임도 내가 상상한 것과 꽤 비슷해졌다. 해리포터에 종종 등장하는-움직이는 사진처럼 이미지들이 살아났다. 나는 한층 더 게을러졌다. 스토리보드용으로 만든 이미지들을 연결해서 한 편의 영화처럼 만들고 싶었다. 4-5장의 이미지만 업로드하고, 프롬프트를 작성하면 AI 어시스턴트가 마법처럼 완성된 짧은 영화를 만들어줄 줄 알았다. 잔뜩 기대를 걸고 실험한 결과는… 대실패였다.


Runway는 내가 제공한 이미지에 약간의 생동감을 불어넣고, 카메라 작업과 비디오 타이밍을 조정할 수 있게 해 주었지만, 여러 이미지를 한 번에 연결해 연속적인 이야기를 만드는 것은 불가능했다. 결국 각 장면을 개별적으로 만들고, 다른 도구를 사용해 긴 영상으로 연결 및 편집하는 수밖에 없었다.


감독님, 밥상을 차려주세요

한때 황정민 배우의 수상 소감이 화제가 됐었다. 영화 제작에는 많은 팀원들의 노력이 들어간다고 했다. 각자의 역할을 열심히 해서 밥상을 차려 놓으면, 배우가 차려진 밥상을 맛있게 먹으면 된다고 - Midjourney와 Runway를 다루면서 내가 밥상을 차리는 감독의 위치에 앉아있었다. 각각의 AI 어시스턴트가 특정 작업에 특화되어 있으니까, 그 작업을 제대로 해내도록 능력을 끌어내려면 내가 감독 역할을 잘 수행해야 했다. (얼렁뚱땅 썼던 프롬프트와, 실망스러운 결과물들이, 어쩌면 나에게 제대로 된 밥상을 차려달라고 투덜거리고 있었는지도 모른다.)


AI 어시스턴트에게 고품질의 결과물을 원한다면, 내가 먼저 훌륭한 프롬프트 생성자가 되어야 한다. 다행인건, 연습을 통해 프롬프트 작성 능력을 개선할 수 있다는 것이다—도구와 소통하는 방법을 이해하고, 순서를 따르고, 여러 번 시도해 보는 과정을 반복하면 된다.


너무 빨리 실망하거나 좌절하기엔 아직 이르다. 나는 ‘살아 있는’ 스토리텔링 영상을 만들기 위해 더 시간을 들여 연습하고 배우기로 했다. 언젠가는 1분짜리 영상으로 미래의 서비스 개념을 소개할 수 있겠지—이해관계자들의 흥미를 끌고, 한 팀으로서 서비스를 만들도록 독려하는 그런 영상을 만들고 싶다 :)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari