chatGPT vs Midjourney 카드뉴스 하나 만들 때 생기는 일
카드뉴스 디자인? 그냥 예쁘게 만드는 거 아냐?
어떤 내용을 몇 장으로 나눠야 할지, 어디에 어떤 문구를 넣어야 할지, 전혀 감이 안 왔다.
결국 chatGPT에 기획 내용을 통째로 붙여넣고 초안부터 받아봤다.
그런데 아뿔싸... 내가 중요하다고 생각한 워딩은 다 빠지고,
어떤 슬라이드는 글이 넘치고, 어떤 곳은 너무 비어보였다.
"역시 초안은 초안일 뿐"이라는 걸 다시 체감했다.
큰 문구를 먼저 캔버스에 옮겨 보기 시작했다.
“디자이너는 결국 시각으로 사고하는 직업이다”
라는 말처럼, 하나하나 배치해 보니 서브 문구와 본문의 우선순위가 눈에 보이기 시작했다.
예전엔 타이틀 120pt, 서브 70pt! 이런 식으로 정했다. 하지만 지금은 전체 디자인 시스템을 먼저 잡고, 에셋화를 시작한다. 배너용으로 쓰던 이미지들을 가져와 분위기를 맞춰보고, 텍스트에 맞는 시각 자료를 고민했다.
midjourney에게 내가 원하는 이미지를 /describe 프롬프트로 돌려봤다.
3D icon of an illuminated blue plastic open office card file ...
미드저니로 프롬프트를 쓰는 것이 어렵다면, 기존 이미지를 어떻게 설명하는지 참고하기 좋다.
유저들이 사용하는 프롬프트 방식과는 조금 다르기 때문에 가장 좋은건 유저들이 쓰는 프롬프트 방식을 변형 하는 것이긴 하다.
각 디스크립션을 넣고 보니 원하는 이미지 쪽에 가장 가까운 프롬프트를 사용하게 되었다.
3D icon of an illuminated blue plastic open office card file on a dark background, in a minimalistic style, isometric view, with a translucent glass material, soft lighting, high-resolution photography, insanely detailed with fine details, isolated on a plain black background, stock photo.
해당 프롬프트에서 원하는 느낌의 일러스트를 만들어본다. 비주얼적으로는 잘 나오는데, 너무 아트워크 느낌이 강했다. 좀 더 실용적인 느낌으로 뽑아보고자,
그래서 이번엔 chatGPT에게 먼저 의뢰해봤다. 예상보다 퀄리티가 꽤 괜찮았다.
실용적이고 균형 잡힌 느낌.
이어서 chatGPT가 만들어준 이미지를 좀 더 고퀄리티로 만들고 싶어서 Midjourney에게 레퍼런스로 주고 명령어를 시행했다. 왜인지 다 뒤를 돌아보고 있어서 레퍼런스를 삭제했더니 이번엔 특유 아이콘 스타일 느낌이 없어졌다.
(어렵다 너란 Midjourney)
마음에 드는 이미지를 적절한 사이즈로 넣고 재가공이 필요하다.
(결국 이미지는 chatGPT가 추천해준 이미지로 사용했다. Midjourney의 이미지는 뭔가 너무 예술(?)성이 돋보여서 카드뉴스로 쓰기에는 목적이 명확하게 보이지 않았다)
배경 제거: Figma가 더 잘한다
배경 확장이나 생성형 편집: Photoshop이 압도적으로 좋다
둘 다 써본 입장에서,
이미지의 세부 스타일은 midjourney,
구체적인 편집은 Photoshop,
빠른 컨셉 확인은 ChatGPT로
역할을 나눠 쓰는 게 제일 현실적이었다.
미드저니에서의 이미지도 나쁘진 않았지만 결과물에서 기획자 캐릭터가 뒤를 보이고 있기에(왜지)
정면이 좀 더 친근한 느낌이 들어 chatGPT를 선택했다.
그러나 미드저니의 그래픽 디테일 요소는 빠뜨릴 수가 없다.
미드저니는 이미지의 영감을 얻는 수단으로 사용중이다.
아이콘을 만들기 위해 ‘질문’이라는 키워드로 말풍선을 만들어봤다.
chatGPT는 말풍선 모양은 잘 잡지만 디테일이 부족하고, midjourney는 디테일은 좋은데 블루 계열은 죄다 날려버린다거나, 방향을 ‘아래’로 했는데 ‘위쪽’을 가리키는 화살표가 나오기도 했다.
조금더 구름모양을 닮았으면 좋겠다는 생각에 몇번 재시도를 했다. chatGPT는 반영은 잘해주지만 그래픽적으로 완성도가 높진 않다. 그래서 미드저니와 함께 사용할때 개인적으로 고퀄리티를 쓸 수 있다고 생각을 한다.
스타일 레퍼런스에 chatGPT가 만든 이미지를 넣고, 프롬프트는 미드저니가 잘 구현해줄 수 있는 프롬프트를 지속해서 사용하였다. 그래픽적으로 확실히 더 깔끔하다. 특히 첫번째 이미지가 마음에 쏙 들었다. "질문" 이나 "Question"이라는 단어는 쏙 빼버렸지만...
다시금 이미지를 올려보고 말풍선 안에 직관적으로 "왜?"가 필요하다고 생각해본다.
하단의 문구도 설계의 출발점입니다 -> 질문은 설계의 출발점으로 고쳐보았다.
이후 이미지 작업은 역시나 포토샵으로 한다. 여전히 포토샵을 놓을 수는 없다.
막상 '왜'를 작업하고나서보니 조잡한 느낌이 들어보인다. 이럴때에는 잠시 자리를 뜨고 다른 날에 보는게 훨씬 판단력이 좋아진다. 나중에 다시 내용이 어떤 쪽이 잘 들어오는지 비교해보아야 겠고...
아마 조잡한 이유라고 생각되는건 주 문구에 '왜'만들지 묻는 힘 이라고 들어가서 왜? 말풍선이 겹쳐보이는 것 같기도 하고, 반면에 '?'만 있을때 해당 카드 뉴스의 전달이 잘 되고 있는지 모르겠다.
“이 이미지, 진짜 사람을 끌어들일 수 있을까?”
“이 말풍선, 이 메시지, 진짜 전달될까?”
“질문은 설계의 출발점이라는 걸 시각적으로 표현했나?”
의심하고 수정하고, 다시 반복한다.
앞서 작업을 하면서 chatGPT로 레퍼런스를 만들고 미드저니로 그래픽 퀄리티를 높이는 것이 정답이라고 생각했지만 그 과정이 마음처럼 쉽지는 않다. 예를 들어, 화살표의 경우 분명 아랫방향 레퍼런스 그래픽과 프롬프트도 아랫방향을 이야기하고 있지만, 미드저니가 떡하니 위를 가르키는 화살표를 생성하곤 한다
비슷한 맥락으로 기존 이미지를 그대로 사용하고, 행동만 바꿔주는것은 chatGPT에서 적용하는게 쉽다. 미드저니가 그래픽적으로 더 완성도가 있음은 확실하지만 일관성을 가져간다는 것은 여간 쉬운일이 아니다.
추가적인 예로, 해당 이미지를 예로 들면 더욱 그 사실을 알 수 있다.
chatGPT의 경우 매트한 질감이 강해서 유사하지만 유사하지 않은 그런 이미지를 주로 생산해준다. 의도에는 맞게 하였으나, 디자인 스타일이 완전하게 일관성은 없다는 느낌이다.
미드저니는 애초에 의도가 맞지 않아서 곤란하다...
(그나저나 미드저니의 세번째 이미지는 왜 욕설이 된것인가...)
이런 저런 실험을 하고 작업의 시행착오를 거쳐가며 늘 디자인에 대해 생각해본다. 그러나 사실 오늘 가장 중요했던것은. 막상 작업이 다 끝나고 나서 알게 됐다. 이건 전체 기획을 카드뉴스화하는 게 아니라, 2~3장으로 임팩트만 주고 상세페이지로 유입시키는 '광고 배너'였던 것. 목표가 달라지니 구성도 바뀌어야 한다.
오늘의 교훈 : 작업을 하다가, 이게 맞나? 싶을때 다시 물어보자.
이 글은 ‘카드뉴스 하나 만들기’라는 작은 프로젝트 속에서, 툴을 오가는 현실적인 생존기이자, 혼자서 모든 걸 다 해야 하는 주니어 디자이너의 일상기록이다. 툴이 많아졌고, 도구는 똑똑해졌지만,
결국 방향을 잡고 질문을 던지는 사람은 ‘디자이너’다.