brunch

You can make anything
by writing

C.S.Lewis

by 최영훈 Feb 24. 2024

AI의 조건 ; 뚜렷한 상상, 명확한 텍스트

꼰대와 베테랑 그 사이 48

화려한 AI

며칠 전 작업실, 감독이 신기한 사이트를 알려줬다. AI가 영상을 만들어주는 사이트라고 했다. 요즘 뉴스에 오르내리고 이슈 몰이를 하고 있는 SORA. 사이트에서 설명하길 텍스트를 기반으로 1분짜리 영상을 AI가 만들어준다고 한다. 영상 몇 개를 봤는데, 잘 만들었다. 내가 본 영상은 도쿄 시내를 걷는 아가씨, 산악 도로에서 쫓기는 SUV 차량 등이었다. 그런데 내 흥미를 끈 건 따로 있었다. 각 영상 밑에 달린 텍스트....앞서 말했듯이 처음 본 영상은 도쿄 시내를 걷는 패셔너블한 아가씨였다. 당연히 이 텍스트도 이 문장으로 시작했다. 그래서 '야, 이 정도 설명만으로 이런 영상이 나온다고', 막 생각이 들 찰나, 그 밑에 더 긴 문장들이 보였다. 그럼 그렇지.


산악 도로를 달리는 자동차 영상도 마찬가지였다. 단순히 "흰색 SUV가 산악 도로를 달리고 있다."와 같은 짧은 문장이 아니라 자동차의 종류와 색은 물론이고 바퀴의 굵기, 바퀴에 묻은 흙, 산 길 오른쪽으론 숲, 왼쪽으론 계곡, 태양의 각도, 굽이의 각도와 개수, 자동차 위에 얹은 루프 랙의 색깔... 여하간 묘사할 수 있는 건 최대한 다 묘사해 놨다. 그 영상을 만든 영어 텍스트의 본문은 아래와 같다.


The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.


당신의 상상을 위한 모두의 협업

이 텍스트의 길이를 보면서 묘한 기분이 들었다. 이거, 의외로 간단한 문제가 아니겠는데... 일단 홍보 영상이든, 상업 영화든, 드라마든 대본과 시나리오의 지문은 심플하다. "산악 도로에서 SUV가 쫓기고 있다. 험한 길, 운전하기가 쉽지 않다." 정도 아닐까? 이 지문에 맞는 장소를 찾기 위해 로케이션 헌터와 조감독이 발품도 팔고 검색도 한다. 적당한 자동차를 찾는 것도 이와 비슷한 단계를 거친다. 소품 팀이나 미술팀이 부지런을 떤다. 이렇게 그러모은 후보 장소를 감독 등 연출진에게 제시하면 회의 끝에 장소가 결정된다. 우리 팀이 홍보 영상 작업을 할 때도 대략 이와 같은 과정을 거친다.


예를 들어 대왕암을 촬영하고 싶으면 직접 감독하고 가서 둘러보고 발로 갈 수 있는 데는 다 오가면서 사진을 찍고 그 사진을 보면서 의견을 나눈다. 장소와 공간이 장비 운영하는데 녹록지 않아 보이면 지미집 감독이나 조명 감독도 불러 함께 움직일 때도 있다. 결정적으로 함께 오래 일한 사람들은 지문이 길지 않아도 다들 작업 노하우가 있고 감독의 머릿속에 있는 장면을 기가 막히게 알아채고 제시할 수 있다. 반면 AI는 이렇게 수많은 사람들이 공동작업으로 현실로 만들거나 오랫동안 함께 일한 사람들이 쿵하면 짝하는 노련함으로 구현해내는 시나리오 속 짧은 지문을 최대한 디테일하게 텍스트로 입력해야만 상상하는 영상을 만들어준다.


내가 상상하는 걸 나도 정확히 말할 수 없을 때

여기서 더 큰 문제는 내가 상상하는 걸 나도 잘 말할 수 없는 경우가 많다는 것이다. 색깔, 태양의 각도, 산의 높이와 기울기, 흙이 날리는 각도, 타이어의 굵기와 더러움, 루프랙의 크기와 색깔.... 이런 것들이 아주 세세하게 머릿속에 있더라도 그걸 각종 형용사와 명사를 동원해 최대한 정확하게 텍스트로 옮겨 내는 건 쉽지 않다. 그래서 요즘 나도 시나리오 안에 이렇게 디테일하게 설명하는 대신 레퍼런스 이미지나 영상을 감독에게 보여주고 있다. 그마저도 대강의 분위기와 방향성의 공유를 위해서지 세부적인 동선이나 디렉션은 없다.


그러나 AI에게 그럴듯한 영상을 의뢰하기 위해서는, 첫째, 상상은 뚜렷해야 하고, 둘째, 그 선명한 상상을 글로, 즉 명령을 내릴 수 있는 텍스트로 정확하게 풀어 묘사할 수 있어야 한다. 아이러니하게도 뚜렷하게 상상할 수 없고 명확하게 글로 표현할 수 없으면 AI에게 뭔가 그럴듯한 일을 시키는 것이 쉽지 않다. 역설적이게도, 이런 이유로, AI 시대에, 특히 영상 쪽은 얼마나 다르게 상상할 수 있는가 하는 그야말로 상상의 힘, 상상력이 더 중요해지고, 그 상상력을 말과 글로 풀어낼 수 있는 능력도 중요해졌다. 두 가지 능력 모두 체득하는 것이 쉽지 않다.


현재, 내가 아는 영상 제작사는 관공서나 기관의 일을 할 때, 관련 정보를 AI에게 입력한 후 시나리오를 쓰게 한다. 이 경우 작가료는 굳는다. 지금 미국의 작가 조합의 파업도 대략 이런 위기감 때문이다. 그러나 표현에 있어서의 핵심은 상상의 오리지날리티이고 그 오리지날리티의 정확하고도 독창적인 묘사다. 그게 없다면 의외로 세상엔 비슷비슷한 영상과 이야기가 넘쳐날지도. 다시 한번, 역설적이게도 이런 시대에, 책을 읽는 것만큼 글쓰기도 중요해진다. 아니 오히려 글쓰기가 더 중요해지는 것 같기도.

매거진의 이전글 디바의 메시지
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari