2부. 미드저니로 3D 이미지 생성하기
다양한 AI 서비스를 현업에서, 혹은 사이드 프로젝트, 개인작업 등 여러 분야에 활용하면서, 필자가 단연 가장 많이 사용하는 서비스는 이미지를 생성하는 서비스 '미드저니(Midjourney)'이다.
처음 미드저니를 사용하고 느꼈던 솔직한 감정은 ‘좀 과한 듯 하지만, 퀄리티가 엄청 좋다, 곧 내 밥그릇을 AI에게 뺏길 수도 있겠는데?’였다. 또한 얼마 전 미드저니가 업데이트되면서 v 6.0이 출시 (알파 버전)되었는데 놀라울 정도로 이미지 퀄리티가 좋아졌으며 텍스트를 넣을 수 있게 되었다.
운이 좋게 AI 서비스를 빠르게 실무에서 사용함으로써 현재는 AI 서비스 사용이 생활화가 되었다는 것에 대한 안도감과, AI가 필자보다 빠르게 성장하며 발전하고 있다는 불안감이 들었다.
그래서 미드저니(Midjourney)가 뭔데?
그래서 미드저니가 뭔데 이렇게 호들갑이냐.라고 느끼시는 분들도 계시리라 생각한다.
따라서 미드저니에 대한 간략한 소개와 사용 방법을 우선적으로 설명드리려고 한다.
미드저니 (Midjourney)
미드저니는 2022년 7월 12일 약 출시된 지 1년이 넘은 서비스이다.
미드저니는 한 마디로, 사용자가 입력한 프롬프트(Prompt)를 이미지로 그려주는 AI라고 설명할 수 있다.
미드저니는 웹 사이트에서 사용할 수 있는 DALL.E와 다르게 가입부터 이미지 생성/편집까지 모든 과정이 전부 디스코드 서버에서 이루어진다. 따라서 접근성이 어려워 시도해 보지 못한 분들도 계시리라 생각한다.
하지만 그에 따른 장점도 있다. 많은 사람들과 함께 미드저니 디스코드 서버 내에서 이미지를 생성하고 편집하기 때문에 다른 사람들의 프롬프트를 참고해 나만의 이미지를 만들 수 있으며, 모든 이의 이미지를 다운로드할 수 있다. (필자는 미드저니의 Pro 플랜을 사용하고 있는데, 해당 플랜에는 Stealth 모드가 포함되어 있다. Stealth 모드를 사용하면 다른 사람에게 나의 프롬프트로 생성된 이미지를 보여주지 않을 수 있으며, Relax 모드가 무제한으로 제공된다.)
참고 : Stealth Mode 설정 방법
미드저니에서 이미지 생성하기
그럼, 이제 미드저니에서 이미지를 생성해 보자!
미드저니에서 이미지를 출력하는 방법은 간단하다.
디스코드 메뉴 좌측의 general 혹은 newbies 서버를 들어간 후, (숫자는 관계없이 원하시는 방에 입장하면 된다.)
입력창에 /imagine을 입력하면 아래 사진과 같은 명령어가 노출된다. 해당 명령어를 클릭한 후, prompt 부분에 원하는 명령어를 입력하면 된다.
필자는 레퍼런스로 사용할 이미지의 링크를 첨부한 후, 원하는 이미지의 프롬프트를 넣었다.
prompt : (비슷한 느낌의 스타일을 원하는 경우, 이미지 링크), image of brunch set including pancakes and coffee, 3d rendering style, simple, cute --v 6.0
여기서 미드저니를 사용하며 필자가 느낀 노하우를 공유하려고 한다.
실제 사람이 등장하거나, 사진과 같은 이미지는 -> photo
ex) photo of korean student who is smile, no background --ar 16:9
그 밖에 그래픽 이미지는 -> image
ex) image of christmas, monet's style, there is a christmas tree, village, color is pastel tone
* 해당 부분은 필자가 미드저니를 사용하며 얻은 노하우이며, 정답은 아님을 알려드립니다.
- 글자 첨부 (v 6.0부터 사용 가능) : "wave" / 쌍 따옴표 안에 넣고 싶은 글자를 넣으면 글자를 포함한 이미지를 생성해 준다.
(ex. image of brunch set including pancakes and coffee, 3d rendering style, simple, cute, put the word "cherry")
- 비율 : --ar / 해당 프롬프트 뒤에 비율을 넣으면 해당 비율의 이미지를 생성해 준다.
여기서 주의할 점은 --ar은 붙이고 스페이스바를 한 칸 띄고 숫자를 넣어야 제대로 출력되는 것을 습득했다.
(ex. image of brunch set including pancakes and coffee, 3d rendering style, simple, cute, put the word "cherry", --ar 16:9)
- seed : 미드저니는 이미지를 출력할 때 각 이미지 세트마다 seed 값을 제공한다.
해당 seed를 이미지 뒤에 입력하면 전에 생성했던 스타일의 이미지들을 만들어낼 수 있다.
(ex. image of brunch set including pancakes and coffee, 3d rendering style, simple, cute, put the word "cherry", --seed 4094505301)
미드저니로 3D 렌더링 이미지 만들기
AI 서비스를 UXUI 디자인에 어떻게 녹여낼 수 있을까?라는 생각을 하다가, 많은 UXUI 서비스에서 3d 아이콘 및 인터랙션을 사용하기에 3d 아이콘을 만들어보아야겠다는 생각이 들었다.
AI 서비스가 나오기 이전 3d 아이콘을 만들려면 블렌더 C4D 등의 툴을 학습하고 배워야 했다. 그리고 아이콘이나 3D 그래픽을 만드는데 시간이 꽤 걸렸다.
하지만 이것을 AI로 만들어 일관된 스타일의 그래픽 이미지를 뽑을 수 있다면, 최소 3명의 디자이너의 역할을 할 것 같다는 생각이 들었다.
그래서, 오늘은 AI를 이용해 브런치 세트를 만들어 보려고 한다!
미드저니에게 팬케이크와 커피를 포함한 브런치 세트를 만들어 줄 것을 요청했다.
처음 프롬프트를 입력했을 때 '3d style'이라고만 프롬프트를 넣었더니 실사와 같은 이미지가 생성되었다.
따라서 '3d rendering style'라고 수정해서 명령어를 입력했으며 레퍼런스 이미지 주소를 함께 첨부했다.
image of brunch set including pancakes and coffee, 3d rendering style, simple, cute
출력된 이미지들 중에 필자의 스타일인 이미지가 있었기에 variation 옵션을 선택해 해당 이미지를 베리에이션 했다.
미드저니는 명령어를 입력하면, 4개의 이미지를 출력해 주는데 U1-4와 V1-4의 옵션이 있다.
왼쪽 상단에서부터 차례로 1,2,3,4 순으로 이미지의 사이즈를 키우거나, 베리에이션을 진행할 수 있다.
미드저니로 만든 3D 그래픽 이미지를 서비스에 사용할 수 있을까?
몇 번의 베리에이션을 반복하니 꽤 만족스러운 3D 브런치 세트 이미지가 생성되었다.
놀라운 점은 물체 간의 빛과 반사를 표현해 냈다는 것이다. 3D 브런치 세트 이미지를 만들면서 미드저니에 스타일을 학습시킨다면 하나의 서비스에 사용할 만한 만족스러운 3D 그래픽 이미지를 만들 수 있을 것 같다는 생각이 들었다.
미드저니는 스타일을 학습시킬 수 있는 기능이 있다. 출시되자마자 필자 또한 사용해 보았지만, 필자의 실력 부족 탓인지 만족스러운 결과물은 아니었다. 하지만 더 공부하고 프롬프트를 잘 만드는 디자이너가 된다면 곧 서비스에서도 사용할 만한 만족스러운 3D 그래픽 이미지를 생성할 수 있으리라 생각한다.