나는 어떻게 사용하고 있나?
이전 편에서 GPT와 달리 3의 간단한 이야기를 했다면 이번 편은 미드저니와 스테이블디퓨전에 대한 간단한 이야기가 될 것 같다. 나는 미드저니로 이미지 생성 AI를 시작했고, 지금도 잘 사용하고 있다. 미드저니는 버전이 업데이트될 때마다 이미지 퀄리티도 상승하고 좋은 기능도 많이 생기고 있다. 이전에는 무료로 생성할 수 있었는데 현재는 유료사용자만이 이미지 생성을 할 수 있다. 기본이 10불이니 한 번씩 가입해서 사용해 보는 것을 추천한다. (커피 2잔에 한 달을 사용할 수 있다는 것)
-
현재 미드저니는 웹사이트에서 바로 이미지를 생성할 수 없고 디스코드라는 애플리케이션을 사용해서 이미지 생을 하고 있다. 즉, 미드저니 사이트에서 가입을 하고 디스코드의 계정도 필요하다는 말이다. 웹사이트 가입은 몇 번 클릭으로 끝나니 간단하게 할 수 있을 거라고 생각한다.
-
가입하고 디스코드까지 왔다면 이제 다했다. 미드저니봇에게 이제 내가 원하는 키워드를 던져주면 이미지를 생산해 준다는 말이다. 그렇다고 무작정 키워드만 던진다면 아마 아무 일도 일어나지 않을 것이다. 미드저니 봇이 알아들을 수 있는 말이 있다.
https://docs.midjourney.com/docs/quick-start
위에 미드저니의 모든 기능에 대한 설명이 있다. /imagine을 앞에 붙이고 영어로 아무 말이나 쓰면 이제 이미지를 만들 수 있다. 사물이던 사람이던 동물이던 어떤 것이든 말이다. 만들어 보고 싶을걸 만들어 봤다면 이제 원하는 걸 만들어 볼 차례이다. 나는 영어를 잘 못하기 때문에 영문 프롬프트는 GPT를 활용하거나 원하는 번역은 아래 서비스를 활용한다. GPT도 유료이고 사용 토큰을 아끼기 위해 간단한 번역은 아래서비스를 활용하는 편이다.
https://www.deepl.com/translator
그리고 프롬프트 외에 미드저니에서 활용할 수 있는 파라미터(수학과 통계학에서 어떠한 시스템이나 함수의 특정한 성질을 나타내는 변수)를 알아두는 게 좋다. 이런 파라미터들을 한 번씩 사용해 보면 본인이 선호하는 파라미터를 발견할 수 있을 거라고 생각한다.
https://docs.midjourney.com/docs/stylize-1
The Midjourney Bot has been trained to produce images that favor artistic color, composition, and forms. The --stylize or --s parameter influences how strongly this training is applied. Low stylization values produce images that closely match the prompt but are less artistic. High stylization values create images that are very artistic but less connected to the prompt.
나는 --Stylize --S를 많이 활용하는 편이다. 이 파라미터는 개인적으로 상상력 표현력 수치라고 생각한다. 수치가 50 이하로 낮으면 프롬프트 그대로 표현을 해주고 100 이상부터는 미드저니가 조금 더 자기가 생각하는 표현을 더해준다고 생각하면 편하다. 프롬프트 그래도 수행을 원한다면 수치를 낮추고 미드저니에게 좀 더 표현을 부탁하고 싶다면 수치를 높여주면 된다.
-
그리고 버전별로 이미지를 비교해서 볼 수 있다. 이 기능 역시 파라미터를 이용하면 된다. --v 4.0 /--v 5.2 / --v 6.0 이런 식으로 파라미터를 쓰면 버전 4, 버전 5.2, 버전 6의 생성이미지를 확인할 수 있다. 물론 한꺼번에 생성은 안되고 파라미터를 각각 입력하여 한 장씩 이미지 생성을 하면 된다. 최신버전인 V6기준으로 이야기해보자. 이전버전보다 확실히 표현능력이 향상되었다. 화질에 대한 프롬프트를 작성하지 않아도 최고의 화질과 느낌으로 생성을 해주는 느낌을 많이 받았다. 그리고 긴 문장의 이해도가 높아지고, 일관성과 모델의 대한 이해도가 많이 올라갔다고 한다. 또한 한국의 이미지도 예전에는 중국 스러움이 많았는데 이 부분도 많이 개선되었다.
개인적으로는 인물중심의 이미지를 생성하고 있기 때문에 인물 중심의 프롬프트를 설명하도록 하겠다. 인물을 생성한다는 의미는 광고 모델로 활용함으로 해석되기 때문에 영화적인 연출이나 실제 포토그래퍼들이 촬영하는 세팅값을 많이 사용한다.
Cinematic
shot - close-up / face / full body / head and shoulders portrait / portrait / behind 등등
Photography - fashion / street / document / advertising / macro / nature / travel 등등
camera - sony a7r IV / leica SL2-S / Nikon Z9 등등의 실제 카메라 혹은 필름까지도 가능
lighting - God Rays / Soft Lighting / Golden Hour / Low Light 등등
-
nationality - korean 등의 인종 및 국적
facial - 모델의 표정
hair - 모델의 헤어스타일
-
그 외에 weather / mood / location 등 여러 카테고리의 프롬프트를 응용하면 됩니다. 이렇게 각각의 프롬프트를 응용하다 보면 알맞은 조합이 나오게 되거나 선호하는 스타일이 나오면 그 조합을 매칭하고 본인의 레시피로 적어두면 좋습니다.
-
Street Photography , full body, leica M10, nature light, korean woman , moody --s 110 --style raw --ar 16:9 --v 6.0
Street Photography , full body, leica M10, nature light, korean girl, moody --s 250 --style raw --ar 16:9 --v 6.0
사실 프롬프트의 순서가 가중치와 연관성이 있다고는 하지만 순서를 꼭 지켜서 작성을 하지 않아도 된다고 생각한다. 물론 가이드를 만들고 자신만의 프롬프트 레시피 규칙을 만드는 것은 좋을 수 있다. 근데 그냥 막 넣어도 어느 정도 잘 나온다.
35mm film still, 18 year old woman wearing a mini dress , slender, lowkey, black and white film --ar 16:9 --style raw --v 6.0 --s 150
Beautiful eyes girl, red hair, Beautiful skin, wind --s 500 --ar 16:9 --style raw --v 6.0
Russians Yakuza, Beautiful eyes girl, Beautiful skin, Glossy Lips, face tatoo::2 , tatoo::1.8 , wind --s 35 --ar 16:9 --style raw --v 6.0
사실 어렵게 생각하지 말고 gpt나 번역기를 이용해서 원하는 이미지를 한글로 적은 다음 나오는 영문을 그대로 넣고 1차적으로 생성한 다음에 파라미터 값과 문장을 살짝씩만 조정해 줘도 충분히 원하는 이미지를 얻을 수 있다. 어떤 규칙으로 어떤 프롬프트를 꼭 사용하라라는 정답은 아직 없다고 생각한다. 하나씩 해보면서 자신한테 편리한 방법을 찾으면 된다.
Create a highly detailed and realistic advertisement photo of a single Korean seed hotteok (sweet pancake), floating in a zero-gravity state against a black background. The hotteok should have steam rising from it, making it look delicious and appetizing. The lighting should be set to showcase the texture of the hotteok vividly. The photo needs to capture the fine details of the food, including honey dripping from the hotteok, enhancing its visual appeal. The overall image should be very realistic, ideal for a food advertisement, focusing on the quality and deliciousness of the hotteok, as if it's floating in mid-air. --style raw --v 6.0 --s 120
위에 이미지는 호떡집 광고를 만들려고 생성해 본 이미지이다. 프롬프트가 꽤 길지만 알아서 잘 만들어 줬다. 그렇다면 저 위에 장문의 프롬프트는 어떻게 생성했을까? GTP로 원하는 이미지의 설명을 넣어서 만들었다.
'한국의 씨앗호떡 광고를 만들려고 한다. 호떡에 김이 모락모락 나고, 먹음직스러운 호떡의 이미지를 만들고 싶다. 배경은 검은색이고 호떡의 질감이 잘 나타나도록 조명이 세팅되어야 한다. 음식사진을 아주 디테일하게 표현하고 싶다. 호떡에서 꿀이 흘러 떨어지는 모습이면 좋겠다. 아주 리얼한 실사 광고 사진을 만들어줘'
그냥 이렇게 내용을 잘 설명했다. 그랬더니 만들어 줬다. 그러므로 뭔가 규칙을 두려워하거나 어떻게 만들지를 망설이지 말고 생각나는 말들을 다 적어보고 적용해 보면 된다.
그리고 달리 3으로 이미지를 생성 후 생성된 이미지의 프롬프트를 미드저니에 적용하는 방법도 있다. 아래의 이미지는 달리 3으로 우선 이미지를 생성하고 생성된 이미지를 미드저니에서 파라미터값만 붙여서 다시 생성한 이미지이다.
'크리스마스 케이크를 그리고 싶다. 케이크의 재료가 전부 분해된 분해도를 아주 리얼하게 표현하고 싶다. 케이크의 재료들이 공중에 떠있고, 각각의 재료가 맛있고 신선하게 표현되면 좋겠다. 화소가 좋은 카메라로 촬영한 느낌의 사진 같은 표현. 그리고 산타와 루돌프 눈사람도 함께 점프하는 모습. '
Create a highly detailed and realistic image depicting a deconstructed Christmas cake with all its ingredients floating in the air, captured as if taken with a high-resolution camera. The ingredients should include cake layers, frosting, fruits, and other typical cake decorations, all suspended in the air, each element looking delicious and fresh. Additionally, include Santa Claus, Rudolph, and a snowman jumping joyfully among the floating cake ingredients. The overall look should be very realistic, capturing the essence and freshness of each ingredient in a playful, floating arrangement with the festive characters. --style raw --v 6.0
그리고 스테이블디퓨전으로 업스케일링을 하고 파리바게트 로고를 넣어 완성한 광고컷이다. 이런 식으로 달리 3든 미드저니든 GPT든 스테이블디퓨전이든 각자가 사용하는 방법을 익힌다면 얼마든지 응용할 수 있다고 생각한다. 위와 같은 과정을 통해서 만든 이미지들이다.
그리고 내가 사랑하는 우리 칠성이의 모습도 이런 식으로 표현할 수 있었다. 고양이중에는 산책을 할 수 있는 고양이도 있지만 대부분 고양이는 자신의 영역 외에 나가는 것에 대한 두려움이 있기 때문에 밖에 나가지 못한다. 그래서 함께 산책은 할 수 없지만 생성 AI를 통해 여러 도시를 다닐 수 있었다.
그리고 이렇게 이미지를 만들었더니 친구들도 만들어달라고 해서. 친구들의 아름다운 친구들을 만들어 주었다. ( 이런 게 AI의 순기능? )
2023년 12월에 V6로 업데이트(알파) 되어 이미지 퀄리티과 더 향상되었다. 미드저니가 출시한 지 22개월이 되었는데 수많은 업데이트와 성능개선이 이루어진 것이고 앞으로 속도는 더더더 빨라질 것 같다. 그리고 곧 디스코드를 벗어나 미드저니 웹사이트를 통해서 이미지 생성이 가능해지면 사용자들의 접근성이 더 올라갈 것이기 때문에 지금보다 더 대중적으로 사용될 수 있지 않을까?
-
다음 편은 뭘로 할까...? 스테이블디퓨전 컴피유아이를 해볼까?
-
Plus X
변사범. 邊師範. Sabum Byun
Co-Founder
-
Mail. sabum@plus-ex.com
Mobile. +82-10-3448-8594
3F, 17, Eonju-ro 149-gil, Gangnam-gu
Seoul, Republic of Korea, 06048
-
Website / Blog / Behance / Facebook / Bruch
Wwwplus-ex.com
www.blog.naver.com/sabum007
www.behance.net/sabum
www.facebook.com/byunsabum
www.brunch.co.kr/@sabumbyun
-
쉐어엑스 생성 AI를 활용한 커머셜 아트웍 제작 강의
https://sharex.fastcampus.co.kr/dgn_online_pxsxbsb