미드저니와 GPT 이미지 생성_UX 관점에서의 차이

두 도구 모두 강력하지만 접근 방식은 확연히 다르다.

by SWM

1. 서론

최근 SNS에서 GPT 이미지 생성 신기능이 큰 화제가 되고 있습니다. 특히 사람들이 많이 요청하는 것은 지브리 스타일의 이미지이며, 그 완성도가 상당히 높아 놀라움을 주고 있습니다. 실제로 사람들의 손가락이나 얼굴 같은 세부적인 부분까지 정확히 표현해낸다는 점에서 기존 AI 이미지 생성의 단점을 보완했다고 평가받고 있죠. 사용자들의 엄청난 요청으로 인해 GPU 리소스 부족 문제가 생길 정도입니다.

오늘은 이 GPT 이미지 생성과 함께, 이미 널리 알려진 미드저니의 이미지를 생성 과정을 UX 관점에서 간단히 비교해 보려고 합니다.



2. 미드저니와 GPT 이미지 생성 개요


미드저니(Midjourney)

사용자가 텍스트 프롬프트를 입력하면 이미지를 생성.

초기에는 디스코드 채널을 통해서만 사용이 가능했지만, 현재는 웹 기반으로도 접근 가능.

이미지 비율, 버전, 스타일 레퍼런스 등 다양한 파라미터 설정이 가능해 세밀한 조정이 가능.

텍스트 명령어 입력과 추가 옵션(예: --v, --ar)에 대한 약간의 학습이 필요하지만, 난이도가 매우 높지는 않아 금방 익숙해질 수 있는 수준.


GPT 이미지 생성

간단한 텍스트 입력만으로도 높은 퀄리티의 이미지를 생성.

대화형 인터페이스를 통해 직관적인 사용이 가능하며, 복잡한 파라미터 없이도 완성도 높은 결과를 생성.

최근에는 사람 손가락이나 얼굴처럼 기존 AI 이미지 생성에서 자주 발생하던 오류들을 상당 부분 보완하여, 보다 정확한 결과물을 생성.


3. UX 관점에서의 차이점


3-1. 사용자 인터페이스(UI) 차이점

미드저니

- 웹 기반 UI를 제공하나, 스타일 레퍼런스와 이미지 레퍼런스를 아이콘만으로 표시하기 때문에 직관적이지 않다고 느껴졌다.

- 이미지 비율 설정이나 --v 같은 텍스트 명령어를 직접 입력해야 해, 코딩을 하는 듯한 느낌을 줄 수 있습니다.

- 각 프롬프트마다 4개의 결과물을 한 번에 제공하여, 사용자가 비교 선택을 할 수 있는 장점이 있습니다.

Frame 1000005583.png 미드저니 UI


GPT 이미지 생성

- 대화형 인터페이스를 통해, 사용자가 짧은 텍스트만 입력하면 됩니다.

- 추가 설정 없이 바로 결과물 1장을 제공하며, UI가 매우 직관적이라 프롬프트 학습 필요도가 낮습니다.

- 사용자 입장에서는 아이콘이나 명령어에 대한 학습 없이, 챗봇에 말하듯 이미지를 요청할 수 있어, 접근성이 좋습니다.

Frame 1000005584.png GPT 이미지 생성 UI


3-2. 사용자 경험(UX) 차이점

미드저니

- 이미지 품질이 뛰어나며, 세부 조정이 가능합니다.

- 다만, 프롬프트에 대해 학습이 필요하고, 이미지 비율이나 버전 등 세부적인 옵션을 직접 설정해야 하기 때문에, 초보자는 진입장벽을 느낄 수 있습니다.

- 4개의 선택지를 제시하기 때문에, 사용자는 결과를 비교하면서 원하는 이미지를 선택할 수 있지만, 동시에 선택에 대한 고민이 늘어날 수 있습니다.

- 여러 번 피드백과 수정을 거치는 과정 자체가 창의적인 작업을 좋아하는 사람에겐 즐거울 수 있지만, 빠른 결과를 원하는 사람에게는 번거로울 수 있습니다.


GPT 이미지 생성

- 텍스트 입력만으로도 완성도 높은 이미지를 생성해 주어, 사용자 입장에서는 직관적인 UX를 경험합니다.

- 결과물을 1장만 제공하기 때문에 선택의 고민이 줄어들 수 있지만 비교 후 선택할 수 있는 환경은 아닙니다.

- 기존 AI 이미지 생성에서 문제가 되었던 손가락이나 얼굴 표현 오류가 크게 개선된 모습을 보여, 사용자들이 놀라워하는 부분입니다.

- 다만, 생성 과정에서 세부 옵션 조정은 아직 제한적이며, 복잡한 설정을 선호하는 사용자에게는 다소 단조롭게 느껴질 수 있습니다.


3-3. 속도와 응답 시간 차이점

미드저니

- 체감상 빠른 이미지를 생성하며, 한 번에 4가지 결과물을 제공해 줍니다.

- 피드백과 조정을 통해 원하는 이미지를 얻을 수 있으나, 그 과정에서 시간을 더 소모하기도 합니다.

- 수정을 요청하고 기다려야 하는 시간이 생겨도 품질을 생각하면 크게 불편하지 않을 수 있습니다.


GPT 이미지 생성

- 생성 속도가 미드저니보다 빠르다고 보기 어려우며, 요청이 많을 때는 더욱 느려질 수 있습니다.

- 유료 플랜을 사용하더라도, 무리하게 몰리는 시간대에는 일정 시간 요청 제한이 걸릴 수 있어, 빠른 결과를 원하는 사용자에게 불편을 줄 수 있습니다.(이 부분은 불쾌한 경험이었습니다. Plus요금제임에도 제한이 걸리다니..)

- 생성 완료 시의 결과물 완성도가 높아, 사용자들은 기다릴 가치가 있다고 여겨지긴 했습니다.

Frame 1000005585.png GPT 이미지 생성 요청 제한



4. 결론

미드저니와 GPT 이미지 생성은 각각의 장점이 분명한 도구입니다.

- 미드저니는 세부적인 설정과 조정이 가능해, 더 정밀하고 창의적인 결과를 원하는 사용자에게 적합합니다.

- 반면, GPT 이미지 생성은 단순한 지시어만으로도 놀랍도록 완성도 높은 이미지를 생성해 주기 때문에, 일반 사용자에게 더 적합하다고 생각됩니다.


저 역시 프로덕트 디자이너로서 두 도구를 사용해 본 결과, 현재 시점에서는 GPT 이미지 생성 기능이 더 좋다고 느끼고 있습니다. 빠르게 결과를 확인하고, 별다른 학습 없이도 퀄리티 높은 이미지를 얻을 수 있다는 점에서 실무 외에도 다양한 목적으로 활용하기 좋습니다. 다만, 더 디테일하고 세부적인 조정이 필요한 경우, 여전히 미드저니가 강력한 선택지가 됩니다.


요약하면,

결국 선택은 목적에 따라 달라질 것 같습니다.

- 간단하고 빠른 생성, 직관적인 사용성을 원한다면 GPT 이미지 생성을,

- 깊이 있는 컨트롤과 창의적인 조합을 원하는 작업이라면 미드저니를 선택하면 좋을 것 같습니다.

keyword