brunch

AI 영상 제작, 코드와 서사의 경계를 허무는 일

권유라 작가의 <한 번에 완성하는 AI 영상 제작> 리뷰

by 공대생의 심야서재

이 글은 의뢰를 받아 작성한 서평입니다.


나는 비교적 AI를 잘 부리는 인간이다. 회사에서나 개인적으로나 AI 없이는 살기 힘들 정도다. AI가 대세라니 어쩌면 그 물결에 무심하게 따라간다고 가볍게 여길 수도 있겠지만, 나름 그 분야의 책도 쓰고 가끔 강의도 나가는 형편이니 AI의 수혜자이자 혹은 리더임은 분명한 것 같다.


오랫동안 나는 두 개의 세계에 걸쳐 살고 있다고 생각해 왔다. 한쪽은 0과 1, 논리와 구조로 이루어진 개발자의 세계다. 요즘은 바이브 코딩 덕분에 코딩을 거의 하지 않지만, 내가 개발자라는 사실은 잘리지 않고 버티는 중인 직장의 타이틀이 증명한다. 나는 개발자답게 잘 짜인 코드가 고객의 문제를 해결하면 기쁨을 느낀다. 또한 효율적인 알고리즘을 어렵게 구현해 내면 그 과정에서도 희열을 느낀다. 나머지 다른 세계는 감성과 서사, 은유로 채워진 문학적인 세계다. 단어와 문장을 엮어 누군가의 마음에 파문을 일으키고(싶지만 현실은 그렇지 못하다.), 보이지 않는 감정을 이야기로 직조해 내는 일에 매료된 곳이다. 두 번째의 세계가 매력적이지만 먹고사니즘에 충실하다 보니 AI형 인간으로 그럭저럭 살고 있다.


SC 1.png 소라에서 영문 프롬프트 입력


20250720_1734_Analog Meets Digital_simple_compose_01k0kffk9wfhwrvjq1vczc9wnx.png 이미지 제작


20250720_1741_Typewriter's Digital Desert_remix_01k0kfq09efqb9g1pf16wjqtve.png 이미지 리믹스


이 두 세계 사이에서, 나는 늘 일종의 '번역가'처럼 사는 중이다. 코드의 간결함은 바이브 코딩 덕분에 AI에게 맡겨버렸으니, 이제 나만의 아름다움을 문학적 언어로 표현해내고 싶다. 그래서 남몰래 소설 쓰기 모임도 운영하며 열정적으로 소설을 쓰고 있기도 하다.


모든 것은 이야기로 시작해서 이야기로 끝난다. 나의 고민은 이런 것이다. 인간만이 가진 고유의 이야기에 담긴 복잡한 감정을 과연 논리적 덩어리로 풀어낼 수는 있을까? 그것은 인간의 영역인데 AI가 과연 대체할 수 있을까. 인간의 영역과 AI의 이질적인 두 세계를 연결해 온전히 '나다운' 무언가를 창조할 수 있을까? 이 고민은 개발자로서가 아닌 한 인간으로서의 요즘 나의 고민이자, 새롭게 가꾸어나가야 할 정체성에 대한 고민이다.


그러던 중 권유라 작가의 <한 번에 완성하는 AI 영상 제작 with 챗GPT+소라+브루> 책자의 서평을 의뢰받았다. 물론 의뢰는 받았지만 편집자와의 개인적인 인연이지 돈을 받고 하는 일은 아니다. 이것은 지극히 사적인 영역이라 할 수 있겠다. 이 책을 읽고 처음에는 또 하나의 기술 트렌드를 좇는 책이겠거니 생각했다. 하지만 책장을 넘길수록, 내 생각이 얼마나 편협했는지 깨달을 수 있었다.


이 책은 단순하지 않다. 이것은 기존의 인간이 지닌 내재적인 한계를 깨부수는 책이다. 챗GPT는 이제 대명사다. 놀이터에서 만나는 6살짜리 꼬마도 챗GPT가 무엇인지 아는 세상이다. 그런 면에서 이 책은 챗GPT의 안내서이긴 하지만 이미지와 영상 제작이라는 또 하나의 전문가의 영역으로 우리를 인도한다는 측면에서 웬만한 전문서를 다 제쳐버린다. 나는 늘 궁금하다. 인간보다 더 인간적인 영상들이 어떻게, 어떤 과정으로 제작되는지, 그 과정에 호기심을 느끼고 실제로 배우고 싶어진다. 이 책은 챗GPT + 소라 + 브루를 안내하는데, 소라와 브루가 무엇인지 모르는 사람은... 이 책으로 시작하면 된다. 그리고 궁금한 사람은 퍼플렉시티에서 검색부터 하고 오도록 하자.


SC 3.png 소라에서 영상 프롬프트 활용


제작된 영상


리믹스된 영상


세상엔 툴 들이 아주 많다. 대부분 좋은 툴이다. 나쁜 인간은 많지만 나쁜 툴은 거의 없다. 그것이 툴과 인간의 차이다. 아니면 말고... 아무튼 이 책은 챗GPT의 소라라는 이미지 및 영상 제작 도구를 어떻게 활용하는지 아주 친절하게 안내한다. 그냥 따라 하면 된다. 나는 이미 글을 쓰고 나서 내용을 챗GPT에게 소라 이미지 제작용 프롬프트를 제작해 달라고 명령을 하달한 후에 여러 차례 이미지를 만들어본 경험이 있다. 몇 가지 방법만 알면 누구나 쉽게 소라에서 이미지를 만들 수 있고, 한 장의 사진으로 Remix를 해서 4컷 만화건 8컷 만화건 연속적인 컷을 만들어낼 수 있다. 영상이라고 복잡할까? 영상은 이미지라는 프레임의 연속이 아닌가? 메뉴만 다를 뿐 만드는 과정은 거의 똑같다.


그래, 나의 말을 듣고 보니 소라가 무엇인지 대충 짐작은 할 것이라고 나는 기대한다. 그렇다면 브루는 또 무멋인가? 이것은 영상 제작 툴이다.(내가 즐겨 쓰는 브이플랫 앱을 제작한 회사에서 만들었다.) 소라가 영상을 만들어주긴 하지만, 음향 효과도 입혀야 하고 트랜지션도 넣고 자막도 넣어야 한다. 또한 영상 제작의 꽃인 컷 편집도 예외일 수 없다. 브루는 그 모든 과정을 AI 기술을 통해 자연스러운 영상을 제작해 준다.


과거에 나는 유튜브에 잠시 몰두한 적이 있다. 그때 브루를 잠시 구독한 적이 있었는데, 3시간짜리 영상을 편집하는데 굳이 파이널 컷이나 다빈치 리졸브 같은 전문적인 툴을 쓰지 않아도 충분히 전문가스러운 영상을 빠르게 제작할 수 있다는 사실에 놀랐다. 여러분도 이 책을 읽으면 나처럼 경이로움을 느끼게 될 것이다.


그래, 이 책은 여러분에게 '어떻게' 만들 것인가를 알려줄 뿐만 아니라, '무엇을', 그리고 '왜' 만들어야 하는가에 대한 영감까지 전달해 줄 것이다.


이 시대는 AI 덕분에 세상의 풍경이 완전히 바뀌어가고 있다. 소수의 전문가만이 가능했던 소프트웨어 개발이, 잘 만들어진 도구와 바이브 코딩 덕분에 일반 사람에게 개방된 것처럼, 아이디어만 있다면 누구나 세상을 바꿀 서비스를 만들 수 있는 시대가 열렸다.


이 책에서 소개하는 챗GPT, 소라, 브루의 조합은 영상 제작 분야에서 혁신적인 역할을 해낸다. 영상은 오랫동안 나에게 '선망의 대상'이었다. 머릿속에 떠도는 이야기를 글로 풀어내는 것은 익숙했지만, 그것을 시각적 이미지와 사운드로 구현하는 것은 다른 차원의 영역이니까.


하지만 이 책은 선언한다. "더 이상 고민을 할 필요가 없다"라고. 마치 정교한 API를 호출하듯, 우리는 이제 자연어만으로 전문가 수준의 영상을 '생성'할 수 있게 되었다. 챗GPT에 아이디어를 던지면, 숙련된 기획자처럼 시나리오와 콘티를 짜준다. 이 기획안을 소라에게 전달하면, 할리우드 특수효과 팀이 부럽지 않은 영상을 렌더링 해낸다. 마지막으로 브루에 영상을 넣으면, 노련한 편집자가 작업한 것처럼 자막과 배경음악, 효과음까지 더해준다.


이 과정은 개발자에게 자동화와 닮아 있다. 창작의 과정에서 가장 지루하고 반복적인 부분(scaffolding)을 AI에게 맡기고, 인간은 가장 핵심적인 '아이디어'와 '디렉팅'에만 집중하면 되는 것이다.


특히 내 마음을 사로잡은 것은 '프롬프트'의 역할이다. 개발자에게 '변수명을 의미 있게 짓는 것'이 얼마나 중요한지 아는 사람이 있을까? 이 작업은 코드의 가독성을 높이는 것뿐만 아니라, 논리적으로 사고하고, 동료와의 소통을 원활하게 하는 행위다.


책에서 강조하는 '프롬프트 엔지니어링'은 이 논리와 맞닿아 있다. AI에게 원하는 결과물을 얻기 위해서는 프롬프트를 잘 짜야한다. 이것은 마치 모호한 요구사항을 명확한 코드로 번역하는 과정과 같다. 카메라를 어떤 앵글 다뤄야 하는지, 어떤 분위기를 연출하고 싶은지, 인물은 어떤 감정을 표현해야 하는지, 구체적인 언어로 '지시'해야 한다.


그러니까 현재는 '글쓰기'의 시대라 할 수 있다. 문학적 글쓰기가 인간의 감수성을 자극하는 것을 목표로 한다면, 프롬프트 엔지니어링은 AI의 '이해'를 자극한다. 그래서 최적의 결과물을 이끌어내야 한다. 작가의 표현력이 요구됩니다. "황량한 사막"이라는 모호한 표현 대신 "해 질 녘, 붉은 노을이 길게 그림자를 드리운 아타카마 사막, 바람에 흩날리는 모래알갱이가 클로즈업되는 시네마틱 샷"이라고 쓸 수 있는 능력. 이것이 바로 기술과 인문학이 만나는 지점이다. 이런 문학적 표현을 할 수 있어야 고 퀄리티의 영상을 뽑아낼 수 있다. AI 시대의 문학적 표현이라니 아이러니하지 않는가?


이 책을 읽으며 나는 끊임없이 내가 수행한 프로젝트들을 떠올렸다. 언젠가 소설로 쓰고 싶었던 인생의 한 장면, 복잡한 개념을 설명하기 위해 그림으로 표현하고 싶었던 어떤 삽화, 혹은 그저 머릿속을 맴돌던 추상적인 이미지들. 이제 이것들을 더 이상 텍스트 안에 가두어 둘 필요가 없게 되었다.


물론, AI가 모든 것을 해결해 주는 만능 도구는 아닐 것이다. 때로는 의도와 전혀 다른 결과물을 내놓으며 우리를 당황하게 할 것이고, 생성된 영상에는 아직 인간의 섬세한 감성을 완벽히 담아내지 못하는 한계도 분명 존재한다. 하지만 중요한 것은 완벽한 결과물이 이 아니라, '시도해 볼 수 있다'는 경험 그 자체다. 실패의 비용이 극적으로 낮아진 지금, 우리는 더 대담하게 상상하고, 더 과감하게 실험하며, 그 무한한 과정 속에서 '나다움'이 담긴 세계를 벼려나갈 수 있다.


이 책은 우리에게 확신을 준다. 한 인간의 평범한 생각과 작가의 문학적 감성은 더 이상 따로 분리되어 있지 않다는 것. 오히려 이 둘이 서로 융합되고 어우러질 때, AI라는 신세계를 만나 폭발적인 에너지를 낼 수 있다는 것. '한 번에 완성하는 AI 영상 제작'은 그 여정에 동참하고 싶지만, 주저하는 모든 소심이들에게 친절한 가이드가 되어줄 것이다. 이제 나의 오랜 고민은 "두 세계를 어떻게 연결할까?"에서 "이 새로운 세상에서 어떻게, 어떤 모습으로 존재할 것인가"로 바뀌었다.


영상 제작이 궁금한 분들은 아래 링크에서

https://www.yes24.com/product/goods/147101039


작가가 쓴 책이 궁금한 사람은 아래 링크에서

https://www.yes24.com/product/goods/144539067


keyword