brunch

매거진 지나x테크

You can make anything
by writing

C.S.Lewis

by 지나쥬르 Mar 23. 2023

<구해줘! 인공지능> 2탄 - 미드저니

Midjourney - 예술인가 기술인가


<구해줘! 인공지능 1탄>에서 이어지는 글입니다.


1편에서 소개했던 ChatGPT에 이어, 최근 재미를 붙이고 있는 디지털 툴은 미드저니(Midjourney)라는 AI 아트 프로그램이다. 이것을 배우는 이유는 간단하다. ‘답답해서’이다. 요즘 나는 브런치, 블로그, 헤드라잇 뉴스 앱, 세 곳에 글을 발행하고 있는데, 글쓰기 자체보다 적합한 이미지를 찾기 위해 더 많은 시간을 쓸 때가 종종 있다. 글 중 등장하는 특정 컨셉이나 다소 추상적인 상상의 장면을 찾는 작업이기에, 이 과정이 매우 소모적으로 느껴질 때가 많았다.


글을 통해 이야기가 펼쳐지는 장면을 상상하게 만드는 것이 작가의 기본적인 덕목일진대, 이미지로 상상력을 보완하고자 하는 욕구는, 아직 내가 그걸 글로 못 해내고 있기 때문일 것이다. 그뿐 아니라, 온라인상의 글을 쓰는 경우, 빽빽하게 텍스트만 가득한 글보다는 이미지로 한두 군데 쉬어 여백을 주는 것이 독자에게 부담을 덜 주고, 가독성을 살릴 수 있다고 생각한다. 물론 필력이 뛰어나다면, 이미지고 뭐고 다 필요 없이 텍스트로 승부할 수 있겠지만. :)



1. 예술이냐 기술이냐, 그것이 문제로다


우선 작품 하나를 살펴보기로 보자.

출처: CNN, 제이스 앨런의 ‘스페이스 오페라 극장(Théâtre D’opéra Spatial)’, 콜로라도 아트 페어 대상 수상


처음 이 작품을 보았을 때, ‘Wow!’하는 감탄사와 함께 소름이 돋았다. 인공지능이 이런 그림을 그리다니…… 일단 구도가 멋지다. 크고 동그란 구멍 사이로 밝고 뿌연 빛이 쏟아지고, 그 빛을 배경으로 가수와 연주자들이 정갈하면서도 조금 흩어진 구도로 자리를 잡고 있다. 무대 우측의 주홍빛 커튼과 노란 불빛, 공연자들의 붉은빛이 도는 의상이 그림에 악센트를 주고 있다.


위의 그림은 게임 디자이너, 제이슨 앨런(Jason M. Allen)이 콜로라도 아트 페어에 제출한 ‘스페이스 오페라 극장(Théâtre D'opéra Spatial)’라는 작품이다. 미드저니를 이용해 만든 그림으로, 콜로라도 아트 페어에서 대상을 받아 세간의 화제가 되었다. 인공지능이 그린 작품이 대상을 수상한 것에 대해 많은 참가자들이 “공정하지 못하다. 부정행위다. 엿 같은 일."이라며 불만을 토로했고, 텍스트 한 줄 입력만으로 순식간에 그려낸 그림이라며 한바탕 논란이 일었다.


하지만 작가는 한 인터뷰에서 "미드저니에서 프롬프트(prompt, 명령어)를 여러 번 수정해 생성된 이미지를 다른 프로그램으로 리터치해 최종 작품을 완성하는 데까지 총 80시간 이상을 썼다"라고 말했다. 또한 ‘Jason M. Allen via Midjourney’라 표기, 디지털 프로그램의 도움을 받았음을 밝히고 아트 페어에 참가했기에, 수상 규칙에 어긋난 바는 전혀 없었다. 그럼에도 많은 사람들이 이 작품을 '예술이 아닌 기술의 승리'라고 받아들이는 듯하다.



2. 도와줘, 미드저니!


다시 미드저니 학습 이야기로 돌아와... 글과 함께 올릴 만한 이미지를 찾기 힘든 답답함으로, 미드저니를 배우기 시작했다. 미드저니를 하려면, 디스코드(discord) 계정도 있어야 하고, 무제한으로 이미지를 생성하고 싶다면 유료 가입도 해야 하는 등, 다소 귀찮은 초반 행정 절차가 있다. 그다음은 창작의 영역으로 해볼 만하다. 프롬프트를 간단하게만 입력해도 놀라울 정도로 세련된 이미지를 뽑아낸다. 물론 프롬프트를 세밀하게 구사할수록, 원하는 이미지가 나올 가능성이 커진다. 실험작 몇 가지를 공유해 보겠다.


1) 봄날의 고양이를 그려줘


내가 첫 번째 생성한 이미지는 고양이 그림이다. 미드저니 봇에 입력한 명령어는 다음과 같다.


/imagine

cute cat, children book illustration, basking in the sun, dozing off in the wood fence, crouching down, happy and satisfied, high resolution, pastel


위의 명령어를 입력하면, 네 개의 다른 고양이 이미지가 생성된다. 따스한 햇살 아래 일광욕을 하며 만족스러운 표정으로 졸고 있는 고양이 그림이 나왔다.


© 지나쥬르 via Midjourney


2) 발리우드 댄스를 추는 발레리나는 어떤 모습일까?


두 번째로 생성한 이미지는 예전에 썼던 <춤과 글쓰기의 공통분모 5가지>에 들어갈 ‘발레리나가 발리우드 댄스를 추는 장면’이었다. 당시 마땅한 이미지를 찾지 못해, 발레리나 이미지를 왼쪽에 넣고 오른쪽에 줌바 댄서 이미지를 넣었다. 미드저니는 과연 어떤 이미지를 만들어낼지 궁금증이 솟구쳤다.


/imagine

ballerinas dancing bollywood, elegant yet funny, highly detailed, in the style of Edgar Degas, perfect anatomy


미드저니가 만들어준 네 가지 이미지 중 가장 마음에 드는 이미지 하나를 골라 업스케일(upscale) 시켰더니, 아래와 같은 이미지가 생성되었다.


© 지나쥬르 via Midjourney


이번에는 <The Star, 무대 위의 무희>라는 드가의 작품명과 추가 형용사 ‘bright and vivid’를 넣어보았다.


/imagine

a ballerina dancing bollywood, elegant yet funny, bright and vivid, full body shot, inspired by <The Star> by Edgar Degas


명령어를 조금씩 수정하면 미묘하게 다른 이미지를 생성해 낸다. ‘bright and vivid’라는 형용사가 들어가니, 색상이 좀 더 알록달록하게 표현되었다.


© 지나쥬르 via Midjourney


3) 19세기 여성 작가를 보여줘


마지막으로 미드저니에게 19세기 여성 작가를 그려달라고 했다.


/imagine

a young writer in the 19th century, beautiful girl, perfect anatomy, writing in her library with a window and beautiful plants, sunlights coming into the window, intelligent and thoughtful, calm and bright ambiance, highly detailed (좌측, 네 개 이미지 중 하나를 업스케일)


/imagine

a young writer in the 19th century, beautiful girl, perfect anatomy, writing in her library, intelligent and thoughtful, calm and very bright ambiance --no windows (우측, negative prompt 사용)


© 지나쥬르 via Midjourney


3. 미드저니의 최대 장점 – 저작권 해결


Unsplash, PIxabay 등 무료 이미지 사이트에서 폭풍 검색을 하다 원하는 이미지가 없으면, 가끔 구글 이미지 검색까지 하는 데 죄다 저작권에 걸리는 이미지뿐이다. 미드저니에 유료 가입해 이미지를 생성하면, 이 ‘저작권’ 문제를 해결할 수 있다.


© 지나쥬르 via Midjourney


이미지 저작권 문제를 해결해 주는 큰 장점이 있지만, 결코 ‘내 작품’ 같은 느낌은 들지 않는다. 명령어는 내가 입력했지만 이미지를 만들어 낸 건 인공지능이니까. 플랫폼 3.0 시대에 너무 구시대적인 발상일까. 위 그림이 내 작품이라고 느끼지 못하는 이유는, 어쩌면 이제 막 미드저니 걸음마를 뗀 아마추어의 작품이기 때문일지도 모르겠다. 미드저니 갤러리에서 전문가들의 작품을 살펴보면, ‘이런 미친 상상력은 어디서 나왔을까?’ 의문이 들 정도로 창의적이고 멋진 작품도 많다.


하지만 나는 여전히 손그림과 아날로그적인 무언가에 향수를 느낀다. 30층까지 순식간에 이동하는 엘리베이터보다, 파리의 낡은 아파트, 달팽이 등껍질같이 느릿느릿 올라가는 계단이 나를 더 가슴 뛰게 한다. ‘밀리의 서재’에서 언제나 꺼내 볼 수 있는 전자책도 편하지만, 2주 넘게 기다려 받은 종이책의 질감과 냄새가 훨씬 고혹적이다. 당장은 시간 부족으로 AI 아트로 이미지를 만들어내야겠지만, 언젠가는 내 손으로 그림을 그려보고 싶은 소망이 있다.



이야기 판은 내가 짜는 것


미드저니는 누구나 배우면 쉽게 쓸 수 있다. 중요한 것은 인풋, 즉 사용자가 입력하는 명령어이다. 심지어 이 명령어를 사고파는 플랫폼(promptbase.com)까지 등장했다고 한다.


그림은 인공지능이 그리지만, 결국 본인의 상상력을 명령어라는 세부적인 언어로 구사하는 것, 본인이 의도한 컨셉과 가장 맞는 것을 골라내는 센스, 업스케일(upscale)하고 변형(variation)을 통해 최종 작품을 뽑아내는 것 모두 창작자의 몫이다. 이미지가 잘 생성되는 타이밍을 놓치지 않고 계속 앉아 끝까지 해내는 ‘엉큐’도 필요하다. 미술 사조나 디자인 용어를 잘 알고 있으면 훨씬 유리하다. 무엇보다 미를 볼 줄 아는 ‘안목’이 필요하다. 안목은 인공지능으로 길러지는 게 아니라, 모두 각자의 고유한 경험에서 나온다.


최근 <더 글로리>를 보며 한 번 더 느꼈다. 드라마 각본을 스릴감 있게 연출한 감독, 무대 감독, 연출 팀, 각자의 역할에 빙의한 듯, 소름 끼칠 정도로 연기를 펼친 배우들, 이 모든 것이 있었기에 좋은 드라마가 탄생했을 것이다. 하지만 애초에 이 모든 이야기 판을 짠 것은 김은숙 작가였다는 것. 스토리를 쥐락펴락하는 것은 결국 창작자의 몫이다.


한때 ‘예술의 치명적인 적’으로 취급받았던 사진*처럼, 언젠가는 미드저니 아트도 하나의 예술 장르로 인정받는 시대가 도래할 수도 있다. 또는 더 강력한 플랫폼의 출현으로 세상에 존재하지도 않았다는 듯 묻힐 수도 있을 것이다. 플랫폼은 플랫폼일 뿐이다. 결국 남는 것은 인간의 창의력과 안목으로 탄생한 이미지와 수많은 작품이다. 작품의 본질은 창작자 개인의 사유와 경험으로부터 비롯된다. ‘구해줘! 인공지능’이 아니라, ‘우리가 우리를’ 구해야 하는 것이다.




1. 이미지 출처: CNN 기사, midjourney.com, 지나쥬르 미드저니

2. 인용*: 처음 카메라가 발명됐을 당시 화가들은 이를 인간 예술성의 타락으로 여겼다. 예컨대 19세기 프랑스 시인 겸 미술 평론가 샤를 보들레르는 사진 기술을 “예술의 가장 치명적인 적”이라고 비난했다.

3. 참고 기사:

1) "AI won an art contest, and artists are furious" by CNN

2) "An A.I.-Generated Picture Won an Art Prize. Artists Aren't Happy" by New York Times

3) "美 미술전 1등 그림 알고보니 AI가 그려" by 매경

4) "인공지능 그림 "악마의 영감을 받은 느낌" by 한겨레


※ 이 글은 뉴스/글 컨텐츠 플랫폼, '헤드라잇'에도 게재했습니다.


매거진의 이전글 <구해줘! 인공지능> 1탄 - 챗GPT
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari