brunch

매거진 일상기획

You can make anything
by writing

C.S.Lewis

by 김폴리 Nov 10. 2022

요즘 핫한, 그림 그려주는 인공지능 간단하게 따라해보기

스테이블 디퓨젼(Stable Diffusion) 소개와 사용법

어제 인공지능 카피라이터 '뤼튼'에 대해 포스팅을 하면서 세상이 정말 빨리 바뀐다고 생각했다. 그러면서 요즘 그 핫하다던 그림 그려주는 인공지능에 대해서도 소개를 해볼까 한다.


불과 몇 달 전, 스테빌리티 AI(Stability AI)라는 이름의 한 스타트업이 AI로 이미지를 생성해주는 프로그램의 오픈소스를 완전히 무료로 공개하였다. 한 문장만 적으면 거기에 맞는 이미지를 그려주기도 하고, 내가 대충 그림을 그리면 그걸 토대로 그림을 그려주기도 하는 기능을 가진 오픈소스 AI이미지 생성 프로그램, 스테이블 디퓨젼(Stable Diffusion)이었다. 이 오픈소스는 몇 달 사이에 IT업계의 수많은 변화들을 가져왔다.


 스테이블 디퓨전은 22년 8월에 공개된 이후 완전하게 무료로 깃허브 등에 올라와 누구나 이 기술을 사용할 수 있게 되었고, 수많은 기획자들과 개발자들은 이 소스를 재료로 자신들의 영역에서 수많은 방향으로 확장하여 개발 및 활용하였고 다양한 응용사례가 나오기 시작하였다.


일본 애니메이션 형태로 특화되어 그림을 그려주는 인공지능, Novel AI 서비스가 인기를 끌고 있고, 의료 영역에서 가상의 의료 이미지 데이터를 확보하기도, 포토샵이나 피그마 등 디자인 툴에 직접 플러그인 등을 개발하여 연동하기도 하였다. 그러면서 이 회사는 22년 올해 10월, 1억 100만달러, 약 1,450억원 규모의 투자를 받기도 했고, 지금의 기업가치는 약 10억 달러에 도달했다고 한다. 약 1조 1,200억원이다. 스테이블 디퓨전과 비슷한 서비스인 달리(DALL-E 2), 미드저니(Midjourney)도 인기를 끌고 있지만, 완전한 오픈 소스의 힘은 대단했다. 1,000만 명 이상의 사용자가 매일 스테이블 디퓨전 모델을 사용하고 있으며, 편하게 사용할 수 있는 유료 서비스, 드림 스튜디오(DreamStudio)의 사용자 수도 150만 명 이상이라고 한다.


설명은 여기까지!


이제 실제로 어떻게 AI가 이미지를 생성해주는지 직접 경험해보기로 하자! 먼저 브라우저에서 편하게 테스트 해볼 수 있는 서비스,  드림스튜디오(DreamStudio)로 이미지를 생성해보자.

유료지만 가입하면 약 200회의 무료 크레딧이 제공되고, 다 쓰고나면 100회당 약 1.2달러로 만들 수 있다.

가입 후 로그인을 하면 바로 실행을 할 수 있다.


https://beta.dreamstudio.ai/home

초기 예제의 문장(Prompt라고 칭한다) : A dream of a distant galaxy, by Caspar David Friedrich, matte painting trending on artstation HQ


주요 원리는 '문장 입력'이다. 내가 원하는 상황의 글을 문장으로 써서 입력한다. 추가로 어떤 사람의 그림체, 또는 화법, 분위기, 조명, 배경 등을 자세하게 적을 수록 그림 생성의 완성도가 올라간다.

그림 그린 것에서 수정도 가능하다. 생성된 그림에서 Open in Editor를 클릭 후 브러쉬로 사람 모양을 지운 후에, 키가 아주 큰 사람이라는 키워드를 추가해본다.


A dream of a distant galaxy with a very very tall man, by Caspar David Friedrich, matte painting trending on artstation HQ


그럼 아까보다 더 훨씬 키가 커진 사람이 등장한 이미지로 바뀐다. 이렇게 생성된 이미지를 기반으로 Img to Img 추가 수정도 가능하다. 대단하지 않은가? 추가 수정까지 가능하다니. 점점 발전하면 콘티 등의 스케치는 이런 AI로 충분히 대체가 될 수 있을 것 같다는 생각이 들었다.


내가 만든 다양한 이미지들의 예시를 보여드린다.


Handsome young man with short hair wearing glasses in a suit is writing a blog post on his Samsung laptop while sitting at his desk



내가 아주 대충 그린 왼쪽 이미지를 가지고 오른쪽의 이미지를 생성해내었다.

A beautiful woman with long hair running away from animals in a wooded forest



A handsome monkey eating a banana in a jungle full of big trees, greg rutkowski, artgerm, trending on artstation, cinematic animation still, by lois van baarle, ilya kuvshinov, metahuman


a monkey with human faces eating several bananas in a jungle with lots of big trees, eating bananas, digital painting, masterpiece, digital art, high quality, highly detailed, concept art, trending on DeviantArt, high coherence, anatomically correct, five fingers, cinematic, high definition, path traced, laboratory background, matte painting, digital painting, ultrarealistic,cinematic lighting, award winning photo




마무리를 지으며,


보시면 아시겠지만, 그림이 꽤나 괜찮다. 오류는 있지만 자잘한 부분들이고 곧 더 성능이 좋아질 것이다. 실제로 어딘가에 쓸모가 있는 퀄리티라는 것이다. 인공지능이 발전하면 발전할 수록 대중들이 인공지능 자동화 툴을 사용하게 될 것이다. 그 때에는 AI가 따라잡을 수 없는 그 이상을 해내는 진짜 잘하는 사람들은 더 인정받고, 그 이하에서 머무는 애매한 사람들은 자신의 자리를 잃어갈 것이라는 결과가 너무 눈에 선하다.


어떻게 보면 딱 정해져 있는 그림 스킬 같은 영역에서는 인공지능이 더더욱 학습을 많이 해서 발전할 것이기에, 이미 있는 화법 또는 스킬을 넘어서는 것은 정말 어려워질 지도 모른다. 그래서 유래 없는 창의성을 발휘하는 생각하는 힘이 더욱 중요하게 여겨질 것이라는 당연한 이야기로 오늘의 포스팅을 마무리 짓는다.




좀 더 딥하게, 하지만 무료로 접해보는 방법도 아래에 있어요.


1. 오픈 소스 AI 모델 개발에 활용할 수 있는 라이브러리 공유 플랫폼, 허깅페이스


허깅페이스 내의 스테이블 디퓨전 space를 방문하면 간단하게 로그인 없이 문장만 입력하여 결과를 볼 수 있다. 다른 space들에도 가보면 재미있는 인공지능 모델들이 있으니 시험해봐도 좋다.


https://huggingface.co/spaces/stabilityai/stable-diffusion


2. 구글 코랩(Google Colab)

구글에서 제공하는 웹브라우저 기반 머신러닝 코딩 도구를 통해, 실제 스테이블 디퓨전을 설치해보고 돌려볼 수 있습니다. 사실 스테이블 디퓨저가 GPU 기반이라 노트북이나 집 컴퓨터에서 돌리기엔 부담스럽지만, 구글의 코랩에서는 구글의 컴퓨터 자원을 사용하여 실행하는 것이기 때문에, 약간 느리긴 하지만 아주 부담없이 무료로 스테이블 디퓨전을 체험해볼 수 있습니다. 자세한 설명은 스테이블 디퓨전을 아주 잘 설명해주신 아래 유튜브를 참고하시면 좋을 것 같아요.

https://colab.research.google.com/drive/1jUwJ0owjigpG-9m6AI_wEStwimisUE17?usp=sharing


https://www.youtube.com/watch?v=Nrx0BPOD_js




인스타그램에도 보기 좋게 정리를 하여 포스팅을 올리고 있습니다. 참고해주세요 : )

https://www.instagram.com/kimpaulie/


매거진의 이전글 AI가 자동으로 콘텐츠를 써주는 서비스의 성능은?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari