어제는 일기 쓰기를 빼먹었다. 이유는 따로 없고, 갑자기 너무 쓰기가 싫어서 그냥 땡땡이를 쳤다. 반성해야겠다. 어제는 디스코드 커뮤니티의 데일리 주제에 맞는 그림 만들기만 하고 다른 일은 안 했다.
오늘 점심엔 2023 파주 슈필에서 구매한 보드게임들이 도착했다. 미리미리 프로텍터도 사 두고 방에 자리도 만들어 놨어야 했는데 게을러서 미루고 있었더니 방 안에 자리가 없다. 일단 거실에 놔뒀다. 프로텍터가 오는 날 박스 뜯어서 정리하고 방에 둬야지. 내가 이제껏 가지고 있던 게임들은 다 모임에서 해 보고 재미있어서 산 것이라 모임에 가져갈 게임이 없었는데 이제 나에게도 모임에 들고 가 보드게임이 생겼다!
거실에 놓인 거대한 택배 상자를 외면하고 오늘도 카페에 갔다. 옛날부터 나는 뭐든 일을 하려면 카페에 가야 했다. 도서관은 너무 조용해서 숨이 막히고 집에선 누워있느라 일이 안 된다. 카페에선 책을 좀 읽고, 커뮤니티 데일리 주제에 맞는 그림을 만드려고 했는데 항상 그렇듯 딴 길로 새서 다른 그림을 만들어 버렸다.
오늘 만든 고양이 인간 잘 만들어져서 여기도 올린다. 다른 이미지를 보고 싶다면 @alram_k_ 인스타에 들어가면 볼 수 있다
지금까지 내 일기를 본 사람들은 알겠지만 내가 사용하는 ai 그림 프로그램(?)은 midjourney다. 그것 외에도 DALL-E 2, 노벨 AI, 빙 AI 등 다양한 Ai들이 있지만 사용해 본 적은 없다. 파이썬 강의도 다 들었겠다 시간이 남는 김에 며칠간은 다른 AI도 사용해 보려고 생각 중이다. 이미 미드저니를 구독하고 있어서 무료로 찍먹만 해보려고 하는데, 그러면 아마 저작물에 대한 권리는 가지지 못하지 않을까 싶다.
사실 사용해 보고 싶었던 건 다른 이미지 생성기 보다 stable defusion WebUI이었다. 가끔 인스타 릴스를 보다 보면 stable defusion deforum 모드를 이용해서 만든 영상들이 보이는데 그게 너무 만들어보고 싶었기 때문이다.
deforum 사용방법에 대해서 이야기하는 유튜브
셀 애니메이션을 만드는 것처럼 AI를 사용해서 만든 이미지를 각 프레임으로 영상을 만드는 것 같다. 솔직히 영어라서 뭐라고 하는지 잘 모르겠긴 한데 이미지만 봐도 굉장히 흥미롭다. Stable diffusion webui deforum을 사용해서 만든 영상은 각 프레임의 커다란 골격은 같되 세부 이미지는 제각기 달라서 실험적인 느낌을 준다. 유튜브에서 보여주는 영상도 그렇고, 인스타그램에서 종종 보이는 stable diffusion으로 만든 영상도 그렇고, 이 프로그램(?)을 이용해서 만드는 영상들의 대세는 끝없는 줌인을 하면서 끝없이 이어지는 그림 영상을 선보이는 건데 볼 때마다 꼭 한 번은 도전해 봐야지 하고 생각한 기억이 있다.
시간도 있겠다. 오늘 당장 이용해 보기로 하고 검색에 들어갔다. 컴퓨터에 설치해서 사용하는 방법과 구글 colab을 사용해 설치 없이 사용하는 방법이 있는데 나는 처음이니까 구글 colab을 이용해 봤다. 그리고... 뭔가 구동이 안 됐다.
내가 참고했던 유튜브
조코딩 씨는 일반인도 쉽게 따라 할 수 있도록 설명을 세세하게 잘해주었는데 문제는 stable diffusion이 오픈 소스고 여러 개발자들이 자신의 버전을 끝없이 업데이트한다는 것이었다. 영상과 실제 코드가 달라서 이게 맞나 싶었지만 정답은 그냥 아무것도 만지지 말고 코드를 하나씩 구동하는 것이었다. 제일 처음 코드는 구글 드라이브 액세스 관련 코드인데, 개인정보가 털릴까 봐 드라이브에 아무것도 없는 계정을 연동해서 stable diffusion을 열어봤다.
stable diffusion 1.5v UI
사진에서 볼 수 있다시피 1.5v에 deforum은 없었다. deforum은 또 다른 개발자가 stable diffusion 오픈 소스를 가지고 만든 모드 중에 하나여서 따로 깔아야 했던 것이다. 약간 실망스러웠지만 구동을 한 김에 txt2img를 활용해 모자를 쓴 펭귄을 하나 만들어 봤다.
같은 명령어를 midjourney v5에 적용했을 때
역시 개인적인 취향으로 이미지는 미드저니의 압승이다.라고 말하기엔 사실 stable diffusion은 튜닝을 하나도 안 한 상태다. 공정한 비교가 아닌 것이다. 이 두 가지 방식을 컴퓨터로 비유하자면 midjourney는 맥 OS 같다. 사용자 환경이 모두 세팅되어 있고 유저가 할 수 있는 건 제한적이다. 바꿀 수 있는 건 프롬프트(텍스트)밖에 없다. 반면에 stable diffusion은 윈도우 환경처럼 여러 가지를 변경시킬 수 있다. 비전문가가 사용하기엔 midjourney가 훨씬 편하지만 stable diffusion에는 무궁무진한 커스텀의 가능성이 있다는 게 다른 점으로 보인다.
결국 오늘은 deforum 모드를 사용해보지 못했다. 코딩을 모르는 일반인도 손쉽게 따라 할 수 있는 다른 ai 프로그램과 다르게 stable diffusion의 ui는 솔직히 정말 복잡하게 생겼다. 그리고 설정해야 할 것도 많다. 하지만 릴스에서 봤던 그런 영상을 만들어보고 싶으니까 colab 환경에서 모드를 추가하는 법을 배워서 내일 다시 도전해 봐야겠다.