brunch

You can make anything
by writing

C.S.Lewis

by 호몽 이용호 Nov 24. 2023

AI 그림 툴, DALL-E 3는 한국도 잘 표현한다

이용호가 말하는 ‘생활 속의 인공지능’

[DALL-E 3로 그린 '설날 할머니 댁에서']

지난 3월말 출간된 “나는 시니어 인플루언서다”라는 졸저의 마지막 장에서 작년 말에 우리 곁에 쓰나미처럼 다가온 챗gpt를 소개하면서 동시에 생성형 AI로 그림을 그려주는 ‘미드저니’도 같이 소개한 바 있다. 책 집필 중에 갑작스럽게 등장한 생성형 AI라는 큰 파도를 인지하고 급히 자료를 수집하고 공부하여 책의 마지막 부분에 추가한 것이었다. 그리고 시대를 리드하는 인플루언서라는 콘셉트에 맞추어 미드저니로 직접 시니어 인플루언서 캐릭터를 그려서 책표지에 삽입을 하기도 했다. 


미드저니를 사용하기 위해서는 직접 미드저니 홈페이지에 들어가거나 프로그램을 설치해서 사용하는 방식이 아니고 ‘디스코드(Discord)라는 플랫폼을 거쳐 들어가서야 사용할 수 있어 무척 불편했다. 그리고 한글 사용이 되지 않는다는 점, 프롬프트에 글을 올리고 다른 사람의 프롬프트와 결과물을 보다가 내 결과물이 완료된 후 신호가 오면 그것을 보려고 한참 위로 스크롤을 해야 하는 점 등이 무척 번거로웠다. 하지만 불편함에 비해 그 결과물은 이전에 경험하지 못한 신속함과 편리함을 제공해 주었기에 번거로움을 감수하고서도 한동안 미드저니의 사용에 푹 빠져 살아왔고 유료로 월 결제를 하면서 지금까지 이어오고 있었다.


지난 9월 20일 미국에서 처음 발표된 Open AI사의 DALL-E 3에 대한 뉴스를 접하고 이전 버전의 DALL-E 2의 미비한 기능에 선입감이 앞서서 큰 기대감 없이 관망만 하고 있었다. 하지만 이번 3버전은  챗gpt 유료 사용자에게만 사용할 수 있게 해준다고 해서 내심 얼마나 변화가 있었을까하는 궁금증은 가지고 있었다. 며칠 전 드디어 내게도 GPT-4 메뉴 밑에 DALL-E 3의 선택할 수 있는 기능이 열려서 얼리어댑터의 본능에 이끌려 즉시 몇 시간동안 DALL-E 3을 탐구하는 시간을 가졌다.


결과는 놀라움 그 자체였다. 이전 버전의 DALL-E 2와는 비교를 할 수 없을 만큼 큼 변화가 있었고 무엇보다도 결과 도출까지의 접근성이 매우 편리해졌다. 이번 글에서는 DALL-E 3을사용하기 위한 방법을 설명하기 보다는 며칠 동안 경험해 본 편리한 기능을 중심으로 하나 씩 설명해보고자 한다.


첫 번째, 매우 디테일한 프롬프팅이 가능하다는 것이다, 내가 테스트 삼아 "보름달이 뜬 가을 밤 캠핑장에서 장작불을 켜고 이야기 하고 있는 중년의 한국 부부는 와인 잔을 들고 있고,  테이블에는 잘 구운 소고기 스테이크, 야채, 과일이 플레이팅 되어있으며 그 뒤에는 하얀색 캠핑카와 어닝이 보이는 그림을 실사형식으로 그려라"라고 프롬프팅을 하고나서 약 30초를 기다리니 아래의 결과물과 유사한 4개의 그림을 멋지게 펼쳐준다. 그림을 살펴보면 알겠지만 보름달, 캠핑장, 장작불, 한국 중년부부,  와인 잔, 테이블 위의 고기와 야채 과일, 흰 캠핑카, 어닝 등 내가 요구한 대부분의 요소를 포함시킨 그림을 그려주었다. 


인공지능으로 그림을 그려본 경험이 없는 사람들은 잘 모르겠지만 현재 미드저니나 기타 그림을 그려주는 프로그램에서는 위와 같이 많은 요소들을 요구하면 거의 절반 이상은 적용하지 않은 채 그림을 그려주는 게 일반적이다. 이번 DALL-E 3의 변화 요소 중 가장 큰 부분이 이와 같은 상세한 프롬프트에도 성실하게 반응을 해준다는 것이다.

[DALL-E 3로 그린 ‘캠핑하는 중년부부’]

두 번째, 한글 입력이 가능하다는 것이다. 미드저니는 영어로 입력을 해야 하므로 영어에 익숙하지 못한 사용자들은 원하는 프롬프트를 한글로 적어서 구글 번역기나, 파파고를 이용해 영어로 번역된 문장으로 프롬프트를 해야 비로소 결과물을 얻을 수 있다. 더구나 모든 메뉴와 참조할 만한 글들이 영어로 되어 있어서 불편함이 컸다. 하지만 DALL-E 3에서는 한글로 프롬프트를 적어도 자동으로 번역해서 결과물을 턱하고 내 놓으니 한글 사용자로서 편리하기 그지없다.


세 번째, 한국적인 요소를 요구하는 프롬프팅을 해도 재대로 그려준다는 것이다. 여태껏 미드저니에서는 한국인이나 전통 건물, 복장을 그려달라고 하면 우리나라 것이 아니고 뭔가 중국, 일본이 같이 혼재된 결과물 우리나라 사람만이 제대로 구분할 수 있는 묘한 이질감이 드는 결과물이 나오곤 했었다. 할리우드 배우가 한국을 배경으로 연기를 하면서 나오는 어색함과 유사하다고 할 수 있겠다.  


“모든 가족이 한복을 입고 궁궐 앞을 나들이 하는 한국 삼십대 부부와 여자와 남자 아이 그림을 실사형식으로 그려라” 라고 프롬프팅해서 얻은 그림은 아래와 같다. 비록 궁궐 현판의 한글이 조금 이상하게 표현되었다고 하지만 한국인 가족과 한복 그리고 궁궐의 모습이 거의 이질감 없이 잘 표현되었고, 이전에 미드저니에서 경험했던 중국이나 일본이 같이 혼재된 느낌도 찾아보기가 어렵다고 할 수 있다. 이제 유튜브 콘텐츠를 제작하면서 저작권이 없는 이미지를 찾기 위해 ‘픽사베이’ 같은 유무료 사이트를 힘겹게 찾아다닐 필요가 없을 것 같다. 유튜버들이 자주 이용하는 픽사베이에서도 한국스타일의 이미지를 찾기가 쉽지 않아 영상을 보다보면 외국인들이 자주 등장하는 것이 이러한 이유 때문이다

[DALL-E 3로 그린 ‘한복 입은 가족’]

네 번째, 그림이 마음에 들지 않으면 다시 그리라고 하거나 마음에 든 특징 그림 중 하나를 다른 요소를 주어서 다시 그리라고 하면 쉽게 해준다는 것이다. 예를 들어 4개의 그림 중 “첫 번째 그림에서 성인남자 2명 중 한명을 6살 여자아이로 교체하고, 여자용 한복을 입은 남자아이의 복장을 남아용 한복으로 교체해서 그려라”고 프롬프팅 하면 다시 그려준다. 단 이 기능은 아직도 100% 만족스럽지는 않다, 아래의 두 그림이 수정 전후 그림이다. 이 그림을 얻기 위해서 몇 차례 반복해서 프롬프팅을 했다. 

[DALL-E 3로 그린 ‘한복 입은 가족 수정 전후’]

다섯 번째, 그림에 문자 삽입이 가능하다. “초콜릿과 블랙칼라 두 마리의 닥스훈트 강아지를 그려라  단, 상단에 한글로 '우리끼리' 라고 간판을 달고, 강아지 주위를  장미꽃 모양으로 장식을 하라. 그림은 실사 형식의 16:9 화면 비율로 만들어라.” 결과는 이상한 한글이 나온다 하지만 간판을 영어인 'Woori & Kkiri' 로 바꾸라고 하면 비교적 정확하고 그려준다. 아직도 한글 문자 표기는 정확하지 않지만 그래도 간단히 프롬프팅만 해도 인스타용 사진이나 이벤트 사진을 만들어 주기에 결과는 매우 만족스럽다고 할 수 있다. 몇 년 전만 하더라도 이정도 작업은 일러스트레이터 같은 프로그램으로 몇시간씩 작업을 해야 얻을 수 있는 결과이고 그나마도 프로그램에 어느정도 숙련된 작업자 많이 가능한 영역이었다.

[DALL-E 3로 그린 ‘ 닥스훈트, 우리끼리’]

비교적 짧은 기간이었지만 DALL-E 3을 여러 가지 관점에서 테스트 해본 결과 예상보다 훨씬  만족스러웠다고 평가할 수 있다. 즉시 미드저니 정기 구독을 해지하는 것에 전혀 후회스럽지 않을 정도라고 감히 말할 수 있다. 비록 한글 문자가 제대로 구현이 되지 않아 아쉬웠지만 전체적으로 한국적인 이미지는 만드는 작업에 충분히 활용할 수 있다고 판단된다. 이제 오픈 초기라서 인공지능의 특성 상 빠른 시간 안에 한글 문자 구현문제도 해결이 되리라고 예상된다. 


| 작가 프로필


호몽 이용호는 스마트 공장에서 주로 사용되는 ‘머신비전’ 전문회사인 ‘호연지재’를 경영하고 있으면서 다양한 분야에 관심이 많아 메타버스와 유튜브 인플루언서로 활동하고 있다. 특히 ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 AI 분야에 대해서도 해박한 지식을 가지고 있다. 또한 SKT 메타버스 플랫폼인 이프랜드(ifland)에서 매주 월요일 오후 9시에 정기적으로 ‘호몽캠프’를 진행하고 있으며 86회 이상 진행된 밋업에는 작가, 강사, 가수, 연주가, 아티스트, 사업가 등 여러 분야의 전문가들이 초대되었고 최근에는 게스트를 초대하는 토크쇼 외에도 각 지역, 박물관, 유적지 답사 여행 등과 같은 다양한 컨텐츠로 호몽캠프를 이어가고 있다. 


주요 강의 분야는 “챗gpt 시대 생활 속의 인공지능 발견하기”, “시니어와 MZ세대 간의 원활한 커뮤니케이션”, “시니어 세대 인플루언서 활동으로 인생 이모작”, “워라밸 시대 워크닉으로 행복한 인생 만들기” 등이 있으며, 저서로는 『나는 시니어 인플루언서다』가 있다. 

작가의 이전글 꿈의 레벨 5 완전 자율주행차는 언제 만날 수 있을까?
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari