생성형 AI를 처음 써보는 사람의 어도비 파이어플라이 체험기
요즘 IT업계뿐만 아니라 전 세계적으로 제일 핫한 단어가 뭐냐고 묻는다면 바로 AI일 것이다. 나한테 이게 연관이 있을까 싶었지만 아니나 다를까 AI가 등장하자마자 생성형 AI가 등장하면서 이미지 합성 및 보정을 단 몇 초만에 뚝딱 해치우더니 곧이어 내가 원하는 이미지까지 만들어준다. 디자이너 입장에서는 AI는 경쟁상대 또는 써볼 수밖에 없는 툴(tool)이 되었다.
내가 업계에 몸담고 있는 동안 디자이너가 주로 사용하는 툴은 끊임없이 바뀌었다. 어도비에서 제공하는 프로그램(포토샵, 일러스트레이터 등) -> 스케치(sketch) + 제플린(Zeplin) -> 피그마(Figma)로 변동이 있었다. 물론 내가 회사에서 맡은 역할에 따라서 툴이 바뀌기도 했다. 왜냐하면 이미지를 다루는 일을 할 때에는 어도비 포토샵을 꼭 사용했기 때문이다. 근데 이번에는 심상치 않다. 이대로 가다가는 포토샵도 내려놓을지도 모른다. 그 어떤 디자이너보다도 퀄리티 높은 결과물을 빠르게 내놓는 생성형 AI를 깊게는 아니라도 얕게(?)라고 써봐야 할 것 같았다.
현재 내가 알고 있는 생성형 AI는 미드저니(https://www.midjourney.com/home), 스테이블디퓨전(https://stablediffusionweb.com/ko), 어도비 파이어플라이(https://www.adobe.com/kr/products/firefly.html)가 있다. 미드저니와 스테이블디퓨전은 plusX의 변사범 디자이너님의 브런치와 인스타를 보면서 종종 얘기를 들은 프로그램이며, 파이어플라이는 어도비 회사 계정이 있기 때문에 어느 정도 정보를 알고 있었다. 뭐부터 써볼까 하다가 아래와 같은 나 나름의 기준을 정리하고 파이어플라이(firefly)부터 써보기로 했다.
1. 미드저니 : 이 3가지 프로그램들 중 제일 좋은 퀄리티를 내는 것 같지만, 프롬프트(prompt, 명령어)를 어느 정도 공부해야 할 것 같고, 무조건 유료 라이선스를 구매해야 한다. 프로그램에 진입했을 때 UI가 전혀 익숙지 않은 당황함을 마주함.
2. 스테이블디퓨전 : 오픈소스 프로그램이지만 더 고도화된 기능을 사용하려면 금액을 지불해야 한다. 영어 프롬프트만 지원한다. 미드저니보다는 UI 접근성이 괜찮아 보였다.
3. 파이어플라이 : 어도비 CC 라이선스가 있다면 누구나 사용 가능하다. 한글 프롬프트도 지원한다. 스테이블디퓨전과 UI가 비슷했다.
*참고로 나는 구조나 스타일 참고하는 이미지를 전혀 사용하지 않고 기본 기능과 프롬프트만으로 이미지 생성을 테스트해보았다. 참고 이미지를 추가하는 것은 이후에 점진적으로 테스트해보려 한다.
*해당 글의 이미지는 모두 어도비 파이어플라이에서 내가 이미지를 생성하는 과정에서 캡쳐 및 이미지 다운로드한 사진들이다.
처음으로 만들어본 이미지는 동물 이미지. 제일 쉽고, 글로벌 통용화(?) 되어 있고(어느 나라에 가도 고양이는 고양이고, 강아지는 강아지니까), 귀여우니까 제일 접근성이 좋아보았다. 그래서 파이어플라이로 내가 원하는 프롬프트를 한글로 입력해 보았더니...
오오 생각보다 퀄리티 높은 이미지가 생성되었다. 프롬프트를 자세히 적은 것은 아닌데도 불구하고 꽤 퀄리티 있는 이미지가 나왔다. (이 [벚꽃과 함께 있는 고양이] 프롬프트로 만든 이미지 중 하나는 이 글의 브런치 표지로 쓰임)
사심을 담아서 하나 더 만들어 보았다. 이번에는 하늘 배경에 꽃밭과 화관을 추가했다. 비록 머리에 화관을 쓴 고양이는 몇 개 나오지 않았지만, 내 예상보다 훨씬 좋은 퀄리티의 사진에 놀랐다. (머리에 쓰기도 하고 목에 달기도 함. 이것도 아마 프롬프트로 추가하면 제대로 나오지 않을까)
이렇게 동물 이미지를 파이어플라이로 생성해 보았다. 일단 너무너무 귀여운 동물들을 보면서 내내 흐뭇했고, 내가 딱 원하던 강아지와 고양이의 모습을 하고 있어서 AI의 학습력에 놀랐다. 대신 매의 눈을 가진 디자이너가 봤을 때 꽃이나 개체가 동물의 털과 접하는 부분이 좀 어색하다든지 오류가 보이긴 했다. 그러나 일반인의 눈으로 봤을 때에는 실제 촬영한 사진이라 해도 믿을 것 같다.
그렇다면 동물 말고 일반 사진은 어떨까? 일단 물체만 있는 이미지를 생성해 보았다. 위의 사진은 파이어플라이 메인 페이지에서 예시 프롬프트에서 약간의 변형을 주고 생성한 이미지다. 역시나 어색함 없이 잘 만들어진다. 대신 이 이미지는 이미 만들어진 프롬프트에서 크게 수정을 거치지 않고 생성 명령을 내린 거라서 퀄리티가 높게 나온 것일 수도 있다.
내가 작성한 프롬프트로 만든 이미지. 마케팅 디자인 같은 경우 개체가 모두 온전히 합쳐진 이미지보다는 배경이미지를 이미지 소싱 사이트에서 찾아 쓰는 경우가 많기 때문에 파이어플라이가 이 배경이미지를 만드는데 유용하지 않을까 싶었다. 그래서 배경이미지 사용을 목적으로 만들어 보았다. 숲과 바구니+돗자리의 조명 방향이 다소 어색한 감은 있지만 나름 잘 만들어졌다 생각한다.
사진 스타일이 아니라 다른 텍스쳐 느낌을 내고 싶다면 이런 것도 가능하다. 다만 나는 이미지 배경이 많이 비어있는 배경을 원했는데, 이는 한계가 있는 듯했다. 영어 프롬프트로는 가능할까 싶기도 하고, 아니면 더 연장된 배경이미지를 원한다면 포토샵의 AI 배경연장 기능을 활용해도 좋을 것 같다.
동식물, 일반 물건의 배경으로는 생성형 AI 생초짜도 원하는 이미지가 생성 가능했다. 그런데 사람 이미지를 생성하려 하니 이때부터 내 지식의 한계가 느껴졌다.
*주의 : 해당 파이어플라이 테스트는 그 어떤 인종 차별적 의도가 절대 없음을 알려드립니다
아까의 꽃+하늘 배경 명령어에서 동물 -> 아기로 바꿔보았다. 여기서 내가 생각한 아기는 외국 아기였는데, [푸른 눈 아기]의 명령어를 썼음에도 불구하고 아시아인 아기를 생성했다. 사실 이전에 그냥 아기라고 썼다가 아시아인 아기가 나와서 [푸른 눈]을 추가했는데도 이런 결과물이 나왔다. 아무래도 파이어플라이가 어도비 계정 라이선스를 받아 운영되다 보니 사용자의 나라를 미리 파악하고 있어서 그런 것 같았다. 사소한 부분이지만, 옷깃이나 물체의 경계에서도 뭔가가 깨진듯한 오류가 보였다.
아까의 명령어에서 [미국인]이라는 단어를 추가했다. 내가 원하는 외국인 아이의 모습이 보였다. 아무래도 외적 묘사보다는 국가를 표기하는 게 좀 더 파이어플라이가 인지하기 좋은가 보다. 실제로 커뮤니티에서 파이어플라이를 이용해 생성한 사람의 이미지에서는 국적이나 인종을 설명하는 프롬프트 단어가 보였다.
하지만 사람이 포함된 이미지들을 계속 생성하다 보니 오류가 끊임없이 보였다. 이번에도 역시 국적을 표시하지 않는 한 아시아인(내가 한국 계정으로 파이어플라이를 사용하고 있어서 아마 한국인 소녀로 인지했겠지) 소녀를 만들어냈지만, 이번에는 얼굴의 눈, 코, 입이 많이 일그러진 것이 보였다. 이번 말고도 다른 명령어에서도 마찬가지였다. 물론 제대로 나오는 경우도 많았지만 한쪽 눈이 일그러졌다든지 하는 AI의 오류를 심심치 않게 발견할 수 있었다.
이번에는 사진이 아닌 일러스트를 만들어 보았다. 이 사진은 이전에 작성한 브런치 글 <프로젝트 회고의 중요성>의 표지를 만들어 보려고 파이어플라이를 사용해 보았다. 내가 원하는 이미지는 계단을 밟고 한 단계씩 성장하는 디자이너의 일러스트였다. 이 당시 진짜로 파이어플라이를 처음 써 봤던 나는 그냥 단어만 툭툭 던졌더니 이런 결과물이 나왔다. 일러스트 스타일은 참조이미지대로 잘 나왔으나, 회사원은 내가 원하는 디자이너 이미지와는 다르게 딱딱한 회사 정장을 입은 여성이었고 이 역시 눈코입이 제대로 그려져 있지 않았다.
그래서 나는 회사원 이미지를 포기하고 게임 캐릭터스러운 이미지를 얻어내려 했다. 여기서 스타일 참조 이미지만 바꿔서 생성한 것이 바로 지금 라이브 되고 있는 페이지다. 첫 파이어플라이 사용은 일러스트 이미지 생성이었는데 내가 원하는 일러스트를 생성하기 어려워서 아쉬웠다.
일러스트에서도 인종과 나라에 대한 AI의 오류는 계속되었다. 회사원 이미지에서 탈피시키고자 후드티 이미지를 넣은 건데, 내가 생각한 한국인 디자이너는 나오지 않았다. (물론 한국인이라고 생각할 수도... 있다!) 그리고 이번에도 묘하게 눈코입이 이상한 이미지가 껴있어서 또 한 번 실망했다.
우리가 미국인과 영국인 그리고 다른 서양인을 구별하지 못하는 것처럼, 외국 프로그램도 한국인 일본인 그리고 다른 아시아인을 구분을 못할 수도 있다. 인종에 관련된 이슈는 정말 정말 민감한 사항이라서, 이는 앞으로 생성형 AI가 고쳐야 할 문제이거나, 내가 이미지 생성을 위해 참고 이미지를 이것저것 추가해서 해결할 일이라고 생각한다.
이런 AI의 문화적 오류는 사람뿐만 아니라 음식에서도 보였다. 배민 앱에서 페이지를 만들다 보면 음식 이미지를 꽤 자주 사용하는데, 스톡 이미지에서 한국 음식 이미지를 찾기 쉽지 않다. 그래서 파이어플라이로 생성이 가능할까? 해서 만들어 봤는데 분명 마라탕 이미지를 요청했는데 면만 주는 파이어플라이... 이건 솔직히 한국인뿐만 아니라 마라의 본토 중국인도 보고 분노할지도.
이번에는 마라탕 말고 한국인의 소울푸드 떡볶이를 만들어 보았다. 이미지가 생성되자마자 경악했다. 떡볶이에 아이스크림이 왜 올라가??? 그리고 떡볶이 옆에 고추장 넣은 저 아이스크림 셰이크 음료는 뭐야? 떡볶이 이미지는 잘 만들었지만, 보통의 떡볶이 이미지에 비해 다소 부실했으며 떡볶이와 아이스크림이라는 생뚱맞은 조화까지 여러 오류를 범했다. 그리고 프롬프트에 순대도 넣었지만 순대는 보이지도 않았다. 아마도 파이어플라이는 한국의 순대를 모르나 보다.
위의 예시들처럼 사람과 그 사람의 생활상, 그리고 음식에서는 파이어플라이가 제대로 이미지 생성을 하지 못하는 오류를 자주 발견했다. (된장찌개를 불렀더니 알 수 없는 국이 나온 것에 관하여) 지금 내가 파이어플라이에서만 이런 오류를 보고 있는데, 미드저니나 스테이블 디퓨전은 어떨지 기대 반 걱정 반이다.
파이어플라이도 그렇고 생성형 AI 사이트에 들어가 보면 해당 AI로 만든 다양한 이미지들을 볼 수 있다. 옛날 도시 배경이미지, 동물 이미지, 내가 안 가본 유럽의 자연 이미지, 디스토피아 이미지, 이 세상에 없는 불사조 이미지 등등. 대체로 현재 내 눈앞에 없는 환상 속 이미지를 생성하는 데에 AI만큼 유용한 것은 없을 것이다. 이거 실제로 촬영한 거 아니냐 생각될 정도로 AI는 퀄리티 높은 이미지를 만들어낸다.
다만 위에서 얘기했던 것처럼 실제로 내가 사는 생활 속의 이미지를 구현해 내기에는 AI는 한계가 있었다. AI는 우리가 실제로 맞닿고 있는 트렌드(예 : 후드에 청바지를 입고 자유롭게 일하는 직장인)보다는 누구에게나 통용화될 수 있는 고착화된 이미지(정장을 입고 서류가방을 든 채로 딱딱하게 일하는 직장인)를 디폴트로 생각하는 듯하다. 그리고 음식이나 의복 등 특정 문화에 대한 오류 역시 마찬가지이다.
위의 오류를 뛰어넘어서 내가 원하는 이미지를 만들고 싶다면, 제일 중요한 것은 프롬프트에 대한 공부가 필요해 보였다. 현재 나는 파이어플라이에서 한글로 프롬프트를 입력했지만, 대부분의 생성형 AI는 영어 프롬프트만 허용하고 있으며 파이어플라이에서도 영어 프롬프트를 더 잘 인지한다고 한다. 이렇게 강제 영어공부를 하게 생겼지마는, 내 머릿속에 떠오르는 퀄리티 좋은 이미지를 만들려면 프롬프트 공부는 불가피해 보인다.
지난번 참석했던 어도비 메이크잇 행사에서 제일 큰 화두는 역시 AI 프로그램(파이어플라이, Express)이었는데, 여기서 참여 연사들은 디자이너들의 경쟁 상대는 AI가 아니라 AI를 잘 활용하는 디자이너라고 했다. 그만큼 앞으로는 이 생성형 AI를 가지고 얼마나 퀄리티 좋은 결과물을 내는지가 디자이너들의 실력을 판가름하는 척도가 될 수 있다. 물론 AI가 내 경쟁상대가 될 수 있겠지만 AI는 어디까지나 tool이기 때문에 이를 그 누구보다 잘 활용하는 디자이너가 되어야 한다.
나 역시 그런 디자이너가 되기 위해서 프롬프트뿐만 아니라 다른 생성형 AI(미드저니, 스테이블디퓨전)도 공부해 보려 한다. 올해 목표 중 하나가 이미지 생성형 AI 툴 공부였는데, 올해 막바지가 되면 내가 AI로 만드는 이미지들 퀄리티가 지금보다 훨씬 높아졌으면 한다.