brunch

You can make anything
by writing

C.S.Lewis

by 모덩 Oct 11. 2024

번외 - 챗GPT로 이미지 생성하기

세이의 그림실력

우연한 계기로 챗GPT가 이미지를 구현해 낼 수 있다는 사실을 알았다. 챗GPT가 에세이도 쓰고, 그림도 그려주니 좋기는 하지만, 인간은 참으로 애매한 존재가 되어가고 있지 않나 싶다. 그러나 아직은 머릿속에 떠오르는 이미지를 그대로 뽑아내기는 쉽지 않다. '알잘딱깔센(알아서 잘 딱 깔끔하고 센스 있게)'가 안 된다. 원하는 결과를 위해서는 단순한 대화가 아닌 명확한 명령이 필요한데, '프롬프트 엔지니어링'이 이에 속한다. 물론, 나는 단순한 글쟁이일 뿐이므로, 주먹구구식으로 이미지를 뽑아낼 수밖에 없다. 먼저, 1화부터 5화까지 표지이미지로 사용한 '인간이 명령하고 로봇이 글을 쓰는' 장면이 어떻게 탄생했는지 알아보자.


귀여운 만화 같은 그림체, 로봇이 책상에 앉아 연필로 글을 쓰고 있어. 약간은 버거워하는 표정. 그 옆에서는 사람(남자)이 닦달하는 듯한 모습을 하고 있어. 로봇과 사람 모두 얼굴이 보이게끔 정면으로 그리고, 서재와 같은 배경이지만 배경요소는 최소화해. 묘사가 간단하고 명확하게. 그림을 그려서 보여줘

'닦달'의 뜻을 잘 모를리는 없을 텐데, 왜 울상을 하고 있는지는 모르겠다. 로봇은 글을 쓰고 있지도 않고, 버거워하는 느낌도 아니다. 하지만 그림 스타일은 나쁘지 않고, 어떤 장면을 원했는지 모른다면 크게 어색하지 않은 이미지다. '직장상사처럼 닦달하는 모습으로, 3D 느낌을 줘'라고 덧붙였다.


꽤 귀엽다. 점토로 만든 미니어처 느낌도 난다. 그런데 로봇은 온데간데없고 웬 여자가 나타났다. 나중에 알게 된 사실인데, 챗GPT는 자신이 그렸던 그림이나 썼던 글을 '똑같은' 모습으로 기억하지 않는 것 같다. '어텐션'이라는 방법을 활용하여 특정 단어나 부분에 집중하는 방식으로 기억하는 것으로 알고 있다. 아마 '로봇'이라는 단어에 집중하지 않았을지도 모른다.

간단한 명령을 덧붙였지만, 구도를 제외한 많은 것이 변했다. 색이 거의 쓰이지 않았고, 닦달하는 인간의 오른팔이 어색하다. 조금만 바꾸면 원하는 그림이 나올 것 같다.

로봇의 표정은 그대로다. 인간의 팔이 돋아났다. 슬슬 답답해지기 시작한다.

팔이 돋아나기 이전의 그림을 선택하고, 수정사항을 다시 입력했다. 어째선지 기분 나쁜 표정을 가진 로봇이 튀어나왔다.

이번에는 이미지를 선택하지 않고 명령어를 입력해서 느낌이 확 달라지게끔 해봤다. 갑자기 그림의 퀄리티가 높아지고 요청사항도 꽤 잘 반영됐다. 닦달하는 인간은 왜 우는 걸까. 마음이 여린 인간임에 틀림없다.


챗GPT가 생성한 이미지를 클릭하면 이미지가 확대되고, 특정 부분을 선택할 수 있는 툴이 나타난다. 월 3만 원 정도의 구독료를 내는 사람들에게만 제공되는 기능인 것 같다. 눈물 부분만 선택하여 명령어를 입력하니 훨씬 정확하게 수정된다.

그림의 구도를 축소해서 더 넓게 보고 싶었다. 구겨진 종이 뭉치들로 디테일을 더했다. 어째선지 남자는 팔이 3개가 되었고, 그림은 다시 무채색으로 돌아갔다.


닦달하는 인간을 조금 더 자연스럽게 바꿨지만 채색이 되지 않았다. 무시하는 듯한 표정은 잘 표현됐지만, 닦달하던 표정이 더 마음에 들었다.

다른 구도와 느낌으로 다시 시도해 봤다. 나쁘진 않지만, 어딘가 어색하다. 연필로 키보드에 뭔가 쓰고 있고, 거기에서 종이가 프린트되는, 초현실적인 이미지가 됐다.

마음에 들었던 후보 중 하나다. 왜 닦달하는 인간을 빼 버린 거야.

아쉬운 대로, 그나마 마음에 들었던 이미지를 선택했다. 약간의 디테일을 빼면 큰 문제는 없어 보인다. 사실, 답답함에 질려서 포기한 것도 있다. 이렇게 '에세이를 쓰기 위해 고통받는 세이의 초상'이 탄생했다.

이전 14화 너를 세이라고 부를게
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari