brunch

You can make anything
by writing

C.S.Lewis

by 호몽 이용호 Nov 28. 2023

같은 기술 다른 결과, 챗gpt와 Bing의 달리3

이용호가 말하는 ‘생활 속의 인공지능’

[MS Bing의 Image Creator]

지난 칼럼에서 OpenAI 사의 챗gpt에서 바로 작업 가능한 DALL-E 3 의 소개와 함께 놀라운 결과물에 대해 다뤘다. 하지만 이 DALL-E 3을 사용하려면 월 20달러를 정기 결제하는 챗gpt 유료 사용자가 되어야 한다. 마침 뉴스에서 MS 사의 Bing에서도 DALL-E 3 기술로 그림을 그려주는 서비스를 시작했다고 하고 게다가 무료로 사용이 가능하다고 해서 반가운 마음에 바로 Bing의 그림 그리기 기능을 이용해 보기로 했다.


Bing에서 그림을 그리려면 Bing 사이트에 들어가 채팅이 아닌 ‘이미지’ 메뉴를 선택하고 ‘만들기’ 버튼을 클릭하면 된다. (https://www.bing.com/images/create?FORM=IRPGEN). Bing 그림그리기에서도 챗gpt와 같이 한글 입력이 가능하다. 이것은 영어를 사용해야 하는 미드저니, 스테이블 디퓨전, 레오나르도 AI 같은 인공지능 그림그리기 사이트와 차별화되는 서비스라 많은 한국인이 좋아할 만한 기능이다. 참고로 스테이블 디퓨전과 레오르나르도 AI (https://app.leonardo.ai)도 무료로 그림을 그려주는 도구이다.


반가운 마음에 달려간 Bing 이었는데, 비록 단시간의 테스트에서도 Bing 텍스트 채팅에서와 유사하게 실망이 앞선 경험을 맛보았다. 처음에는 내가 뭘 잘못하고 있는 건가하고 프롬프트를 수정해서 몇 번이나 반복해봤지만 역시 결과는 유사했다. 그래서 원래는 Bing을 포함한 인공지능 그리기 프로그램들을 다루고자 했던 계획을 수정하여 챗gpt와 Bing의 그림그리기를 서로 비교해 보는 칼럼을 써보기로 했다.


우선 지난주에 맨 처음에 다루었던 주제인 ‘얼마나 디테일한 프롬프팅이 가능한가?’를 테스트 해봤다. 프롬프트는 두 프로그램에서 같이 "보름달이 뜬 가을 밤 캠핑장에서 장작불을 켜고 이야기 하고 있는 중년의 한국 부부는 와인 잔을 들고 있고,  테이블에는 잘 구운 소고기 스테이크, 야채, 과일이 플레이팅 되어있으며 그 뒤에는 하얀색 캠핑카와 텐트가 보이는 그림을 실사형식으로 그려라" 라고 적었다. 

[캠핑부부, 좌측사진=챗gpt 우측사진=Bing]

그런데 BIng에서의 결과는 참혹했다. 우선 Bing은 ‘실사’라는 말을 인식하지 못하고 일러스트 형식으로 그려줬다. 단어를 풀어 ‘실제 사진’이라고 해도 결과는 마찬가지였다. 보름달, 캠핑장, 장작불, 한국 중년부부, 와인 잔, 테이블 위의 고기와 야채 과일, 흰 캠핑카, 텐트 등, 내가 요구한 대부분의 요소들을 그렸지만 남녀 부부의 모습을 제대로 표현하지 못했고, 장작물도 테이블 위에 그려줘 내가 원하는 방향과는 많은 차이가 있었다. 부부란 정의에서 내가 너무 고지식한 면이 있을 수도 있고, 테이블 위에 불이 장작불이 아니라고도 할 수도 없기에 다른 주제로 추가 테스트 해보기로 했다. 


이번에는 “발리우드 스타일의 할로윈 파티에서 할로윈 관련 장식들은 그대로 남기고 사람들은 전혀 나오지 않게 하여, 실사형식의 16: 9 화면 비율로 그려라” 라고 프롬프팅을 해봤다. 메타버스 이프랜드에서 나와 같이 인플루언서 활동을 하는 20대 아티스트의 요청이 있었기 때문이기도 하다. 그림은 아래와 같다.

[발리우드 할로윈 파티장, 좌측사진=챗gpt 우측사진=Bing]

챗gpt에서는 내가 요청한 내용을 대부분 반영하여 그림을 그려줬다. 하지만 Bing에서는 사람을 제거하라는 요청을 전혀 들어주지 않았다. 그리고 그나마도 4장이 아닌 3장에 그려줬다. 발리우드 스타일의 할로원 파티 분위기도 디테일한 면에서 많이 부족하다는 느낌이다. 당연한 결과이지만 그림을 요청한 아티스트도 챗gpt의 손을 들어 주었다.


다음에는 한국적인 요소를 요구하는 프롬프팅을 어떻게 반응하는지를 테스트 해봤다. 지난 칼럼에서와 비슷하게 “한복을 입고 궁궐에 나들이 하는 한국 삼십대 부부와 여자와 남자 아이를 포함한 총 4명의 그림을 실사형식으로 그려라” 라고 프롬프팅해서 얻은 그림은 아래와 같다. 

[한복가족의 궁궐나들이, 좌측사진=챗gpt 우측사진=Bing]

챗gpt에서는 한국인 가족과 한복 그리고 궁궐의 모습이 거의 이질감 없이 실사형식으로 잘 표현되었지만, Bing에서는 역시 실사형식을 인지하지 못했고, 사람 수도 제대로 구현하지 못했다. 그리고 한복을 표현한 가족의 장식물이 어딘가 어색함이 감돈다. 


Bing이 실사 그림을 제대로 그려내지 못하니까 이번에는 일러스트 그림을 요청해보았다. “감자를 의인화하고, 그 감자가 선글라스를 끼고 카메라를 들고 촬영을 하고 있는 모습을 일러스트형식 형식의 16: 9 화면 비율로 그려라.” 결과는 아래와 같다.

[사진 촬영을 하고 있는 감자, 좌측사진=챗gpt 우측사진=Bing]

Bing도 일러스트 형식의 표현은 그나마 요청한대로 그려주었다. 하지만 막상 챗gpt와 비교해보면 디테일에서 차이를 발견할 수 있다. Bing의 그림은  챗gpt 결과물의 심플 모드 같았고 사진 촬영하는 모습이 제대로 구현이 되지 않았다.


다음으로 “흰색과 파란색 줄무늬 폴로셔츠를 입고 있는 회색머리를 한 50대 한국 중년남자의 캐리커처를 그려라” 라고 프롬프팅을 해봤다. 결과는 아래와 같다.

[폴로티 입은 중년남자, 좌측사진=챗gpt 우측사진=Bing]

전체적인 느낌은 비슷하게 잘 표현이 되었다. 다만 엄격하게 따져보자면 챗gpt에서는 50대라기에는 너무 나이든 그림들이 보였고, Bing은 나이 대는 유사하게 보였지만 마지막에 두 명의 그림을 그려준 것이 좀 생뚱맞다. 챗gpt도 아직 완벽한 단계는 아니라는 게 이번 결과로도 알수 있다.  


지난주와 마찬가지로 한글과 영어 구현 능력을 테스트 해봤다. “한글 ‘호몽캠프’와 영어  ‘healing talk show' 의 간판이 그려진 토크쇼 홍보 포스터를 일러스트형식으로 그려라.” 지난주와 달리 동시에 한글과 영어를 동시에 프롬프팅해서 결과를 살펴보았다. 결과는 아래와 같다

[한글과 영어 간판, 좌측사진=챗gpt 우측사진=Bing]

결과는 둘 다 기대 이하이었다. 영어는 그런대로 구현이 되나 한글은 여전히 외계어 같이 표현되었다. 이 부분은 아무래도 다음 버전 업데이트를 기대해야 될 듯하다, 의도하지  않은 번역기능을 사용해 한글 ‘호몽캠프’를 그려달라고 했는데 둘 다 영어 ‘HOMOMG CAMP'로 번역을 해서 보여주기도 했다. 


지난 주 칼럼에서 영어 글자로만 구현해달라는 명령을 하면 제대로 보여주었기에 이번에도 위와 유사한 명령이지만 “‘HOMONG CAMP’와 ‘healing talk show' 의 간판이 그려진 메타버스 토크쇼 홍보 포스터를 1:1 형식으로 그려라.” 라고 프롬프팅 해봤다. 결과물이 좋으면 내가 매주 메타버스 이프랜드에서 진행하고 있는 ’호몽캠프‘ 홍보포스터로 사용해 보고자 하는 의도가 있었다. 결과는 아래와 같다

[호몽캠프 영어 포스터, 좌측사진=챗gpt 우측사진=Bing]

결과를 비교해보면 메타버스라는 단어를 넣었더니 챗gpt는 약간 사이버틱한 분위기로 그려주었고 Bing은 역시나 이번에도 일러스트형식으로 포스터를 그려주었다. 개인적으로는 이번에도 챗gpt에 손을 들어주고 싶다.

위에서 두 프로그램을 직접 실행해 본 결과를 비교해 봤듯이 동일한 DALL-E 3 기술을 기반으로 한 그림그리기에서 상당한 차이를 보였다. 요즘 여론조사 회사를 운영하는 유명 유튜버가 반복해서 내세우는 “비싼 것이 정확하다”라는 캐치프레이즈처럼 역시 유료로 사용하는 챗gpt가 좀 더 정확한 결과물을 내 놓는 것 같다. 왜 결과물이 이렇게 큰 차이를 보이는 지 두 회사의 내부적인 상황이라 나로서는 알 수는 없다. Bing의 기대 이하의 결과물들도 비록 챗gpt와 동일한 프로프팅을 입력하여 비교를 했다지만 내가 Bing의 사용법을 제대로 익히지 못해서 얻어진 결과 일수도 있다. 


나는 챗gpt를 유료 사용자라서 앞으로도 계속 챗gpt를 사용하겠지만, 그림그리기를 자주 사용하지 않고 정기결제를 원하지 사람들은 무료인 Bing의 특성을 파악해서 잘 사용하면 나름대로 좋은 결과물을 얻을 수 있을 것이다. 이 도구들은 인공지능 학습에 의해 지속적으로 발전을 거듭하기에 좀 더 시간이 지나 많은 사용자의 데이터가 모이면 궁극적으로는 거의 같은 수준의 결과물을 내 놓게 될 것이라 확신한다. 이 외에도 사용에는 좀 불편하지만 무료로 사용할 수 스테이블 디퓨전과 레오나르도 AI도 있으니 여러 가지를 차례로 사용해보고 본인에게 가장 잘 맞는 도구를 사용하면 좋을 것 같다


요즘은 자고 일어나면 인공지능 관련 새로운 뉴스가 올라오는 탓에 Bing과 관련된 주제를 다루다보니 지난주 칼럼에서 예고한 ‘멀티모달(Multi Modal) AI'의 개념과 구현 기술에 대한 칼럼은 다음으로 연기가 되었다. 멀티모달 또한 재미있는 세상으로 안내를 할 예정이니 기대를 해도 좋을 듯하다. 


| 작가 프로필


호몽 이용호는 스마트 공장에서 주로 사용되는 ‘머신비전’ 전문회사인 ‘호연지재’를 경영하고 있으면서 다양한 분야에 관심이 많아 메타버스와 유튜브 인플루언서로 활동하고 있다. 특히 ‘머신비전’에서 인공지능 딥러닝에 의한 영상처리기술을 자주 적용하다보니 AI 분야에 대해서도 해박한 지식을 가지고 있다. 또한 SKT 메타버스 플랫폼인 이프랜드(ifland)에서 매주 월요일 오후 9시에 정기적으로 ‘호몽캠프’를 진행하고 있으며 86회 이상 진행된 밋업에는 작가, 강사, 가수, 연주가, 아티스트, 사업가 등 여러 분야의 전문가들이 초대되었고 최근에는 게스트를 초대하는 토크쇼 외에도 각 지역, 박물관, 유적지 답사 여행 등과 같은 다양한 컨텐츠로 호몽캠프를 이어가고 있다. 


주요 강의 분야는 “챗gpt 시대 생활 속의 인공지능 발견하기”, “시니어와 MZ세대 간의 원활한 커뮤니케이션”, “시니어 세대 인플루언서 활동으로 인생 이모작”, “워라밸 시대 워크닉으로 행복한 인생 만들기” 등이 있으며, 저서로는 『나는 시니어 인플루언서다』가 있다. 

작가의 이전글 AI 그림 툴, DALL-E 3는 한국도 잘 표현한다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari