'텍스트와 유저'에 삽입된 이미지 산출 과정에 대한 글
안녕하세요? 부밍북입니다. 아주 오랜만에 글을 올립니다.
노운아 작가의 '텍스트와 유저'가 '2022 아르코문학창작기금 선정작'으로 됐는데요. '다음브런치에서 만나는 문학'이라는 문구로 프로모션 중에 있으며 현재 브런치북에서 본 작품을 감상하실 수 있습니다. '텍스트와 유저'는 총 10회로 이야기가 나뉘어 있습니다. 단편 소설인 이 작품을 10개로 나누어 전자책 형태로 발간하다 보니 좀 밋밋한 느낌이 들었습니다. 그래서 소설의 내용을 형상화한 이미지를 한번 실어보는 건 어떨까 해서 이미지생성AI, B^ DISCOVER를 활용해 봤습니다. 따라서 이번 글은 소설의 분위기와 내용을 반영한 텍스트에 부합한 이미지가 과연 잘 산출되었는가에 대한 좀 심심한 글이 되겠습니다.
먼저 소설 '1화: 콘텐츠AI카페'에 등장하는 유저와 콘텐츠카페의 이미지를 생성해 보고 싶었습니다.
카카오브레인에서 출시한 이미지생성AI, B^DISCOVER에 영문 텍스트를 입력해 보았습니다.
In the black, blue and grey mixed darkness, vague human-beings are sitting in front of AI computer. The atmosphere is affected by mysterious inspiration and it seems to haunt spirits. In the screen, it is full of texts by AI deep learning.
텍스트는 문제없어 보이는데요, 산출된 그림이 생각만큼 만족스럽지는 않았습니다. 저 내용도 몇 번의 수정 과정을 통해서 이루어졌습니다. AI컴퓨터 앞에 앉아 있는 어떤 희미한 존재를 만들어 내기가 쉽지 않군요.
이번에는 '5화: 현실에 없는 부모'에 삽입된 완벽한 어머니와 아버지를 산출해 내기 위한 입력 텍스트입니다.
Shadow of a woman mixed light and blu, yellow background.
Shadow of a man mixed light blue and yellow background, Henri Matisse.
이미지생성AI에게 너무 큰 기대를 한 걸까요? 초반에는 완벽한 문장에 자세한 요구를 넣은 텍스트를 입력해서 이미지를 산출하려고 했습니다. 그러나 그러면 그럴수록 생성이미지는 오히려 단순해진다는 것을 깨닫게 되었습니다. 따라서 간단한 입력 텍스트를 생선했습니다. 그리고 문장 수준이 아닌 절이나 구 수준으로 단순화시켰습니다. 또한, 사람을 그리는 것에는 아직 기술이 만족할 만한 수준에 오른 것 같지 않았습니다. 기괴하고 혐오스러운 얼굴이 나타나서 결국 'vague, shadow'와 같은 흐릿한 실루엣을 원하는 입력값을 주었습니다. 또한 어떤 '화가'의 스타일을 입력하니 그림이 한결 보기 좋게 변했습니다.
'7화:p2e'에 언급되는 깨진 이야기를 형상화한 텍스트입니다. 전통적으로 플롯을 설계한 작가가 게임처럼 글을 짓는 유저들에 의해 자신의 작품이 파괴되는 경험을 하게 되고 결국 그런 엉망이 된 자신의 작품과 마주하게 되는 슬픈 장면입니다.
Broken machine language in the book. Roman, Greek, Korean letter. Analogue Image.
사실은 로마문자, 한글, 그리스문자와 같은 단어를 넣지 않으려고 했지만 부밍북이 원하는 이미지를 원하려면 인위적으로 저런 단어를 입력해야 했습니다. Broken, machine language, Java programme 등 이러한 입력값을 넣어 보고 수많은 시도를 했지만 가장 마음에 드는 그림이 위에 첨부된 것입니다. 따라서 이미지생성AI를 통해서 아주 만족할 만한 수준의 이미지를 얻기 위해서는 AI를 올바르게 유도하기 위한 입력값이 중요하다는 것을 알 수 있었습니다. 이 말은 결국 원하는 출력값을 얻기 위해서는 원하는 입력값을 누군가는 아주 잘 넣어줘야 한다는 것인데요, 즉 AI만큼이나 입력자는 박식해야 한다는 것입니다.
금방 끝날 줄 알았던 이미지생성 작업은 생각보다 꽤 오래 걸렸습니다.
마지막 '10화:영원한분리'에 등장하는 인간미와 모성애가 전혀 느껴지지 않는 완벽한 여인을 그려 넣어야 했습니다. 아주 어려운 입력값입니다. '인간미'도 없고 '모성애도 없는' 완벽한 여인이어야 했습니다. 그러나 현재의 기술 수준으로는 완벽한 여인의 얼굴을 생성해낼 수 없다는 결론에 이르렀기에 일단 'back'을 입력값 최우선 단어로 설정했습니다.
Back of fantastic vague woman, cubism style
현재 화자로서 작품 활동을 하는 작가님들에게 실례가 될 수 있는 언급인데요, 원하는 이미지를 얻을 수 있는 최단코스로는 어떤 화자의 화풍을 직접 입력하는 것입니다. 따라서 저는 큐비즘을 넣어 봤습니다. 그리고 'fururistic'이라는 단어를 지속적으로 넣었습니다. 노운아 작가의 '텍스트와 유저'에서 우려하는 것이 작가의 종말인데요. 사실 먼 미래의 이야기도 아닙니다. 현재 일어나고 있는 이야기입니다. 하지만 극적 이미지를 얻고 싶었기에 지속적으로 'futuristic'이라는 단어를 설정했습니다.
여러분 어떠신가요?
요즘 기업들이 이미지생성AI의 도움을 받아서 광고컷을 만들거나 광고포스터를 싣고 있습니다. 물론 가상인간도 직접 만들어 적극적으로 마케팅에 활용하고 있지요. 그런데 그런 깜짝 놀랄 수준의 이미지생성을 얻으려면 그 역시 엄청난 아티스트들의 노력과 인간의 손길이 필요하다는 것을 알게 되었습니다.
과학과 기술. 과학과 예술. 과학과 인간.
기술과 과학. 예술과 과학. 인간과 과학.
무엇을 앞에 두느냐의 문제이지 결코 대응되는 문항 어떤 것도 소멸이나 쇠락을 경고할 수는 없을 것 같습니다. 중요한 건 이러한 현재의 흐름 속에서 우리, 나는 무엇에 중심을 두고 앞으로 나가야 하느냐에 관한 고민은 계속 되어야 할 것이라고 생각합니다.
그럼 노운아 작가의 '텍스트와 유저'를 많이 읽어 주시면 감사하겠습니다.