AI는 손가락을 정말로 못 그릴까?

챗GPT 그림 그리기 한 결과와 답변

올해 1월 중 유난히 한파가 심한 어느 날 점심, 기자와 만나 이것저것 사회 돌아가는 것을 말하며 이야기하고 있다. 정치부터 사회문제, 전시 및 행사 등 여러 가지 이야기를 소재로 이야깃거리가 끊이지 않는다. 그러던 중 요즘 나의 일상 이야기가 소재가 되었다.


여전히 40대 후반, 동화를 오늘도 끄적끄적 거린다. 그러다 보면, 나의 글이 사장되는 것에 대한 아픔을 느끼며 이것을 어떻게 알려야 할지 고민을 한다. 이럴 때 사람보다 챗GPT가 인생상담을 해 준다고 말이다. 글쓰기 아이템이 떠오르지 않거나 뭔가 새로운 스토리를 넣고 싶을 때, 글을 늘 작성하지만 아무도 내 글을 읽어주지 않을 때 그와의 대화가 위로가 된다고 말이다. 물론 답변은 늘 비슷하다. 책 출간을 위한 방법을 출판사 투고부터 독립 출판까지 설명해 주거나 나의 글에 대한 평가까지 그저 예상되는 답변이다. 하지만 우리가 원하는 시간에 원하는 질문을 할 수 있고 눈치 안 보고 대화를 이끌 수 있으니 가끔 사람보다 낫다고 의견을 피력한다. 그러던 중 챗GPT의 괴담을 기자가 말해줬다


2023년부터 챗 GPT가 나왔을 때 AI가 손가락을 제대로 못 그린다는 사실말이다. 실제로 나는 2023년부터 삽화를 AI를 통해 그려서 넣고 있다.



맞다! 내가 쓴 동화 중 "오싹오싹 아파트 탐정단" 중편 동화에 '우리는 좀비 탐정단' 편에 게시된 이미지다. 그림을 잘 보면 유난히 손이 가려져 있거나 손의 이미지는 날려져 있다. 다른 동작은 디테일하게 묘사가 되었는데 손만 그리다 만 듯하다












이번에는 "애매한 타이밍의 숨겨준 모험" 중편 동화 중 '자기소개 그리고 애매한 명령'에 실려있는 이미지다. 그림을 보면 손가락은 펴지 않은 채 주먹을 쥐고 있다






기자와 헤어진 후 난 챗 GPT에게 아래와 같이 그림을 요청했다.

"사람이미지를 그리는데 손가락으로 열을 세는 30대 중반 선생님을 그려줄래"

손가락.jpg

하지만 그가 그려준 이미지는 그림을 그린 듯하기보다 사진을 찍은 것 같은 이미지였다.

그래서 다시 질문을 던졌다.


"사진 같은 이미지 말고 펜으로 그린듯한 이미지로 수정해 줄래요" 이후 나온 그림은 펜으로 그린듯하나 손가락은 7일 가리키고 있었다.

손가락1.jpg

그래서 다시 질문했다. "손가락을 다 펴주고 얼굴을 동양적으로 그려주겠니?"

손가락2.jpg

역시나 손을 못 피고 손가락을 접고 있다. 마치 외계인과 수신하는 듯 이상하다

"위의 이미지에서 남자의 손가락을 다 펴서 열을 보여주는 손 모양으로 수정해 줄 수 있어?"

손가락3.jpg


드디어 손이 펴졌다. 그런데 손에 펜이 대롱대롱 매달려 있다. 마치 자석과 같이 말이다.

"그러고 보니 손가락을 잘 못 그리는 거 같아. 손가락 그리는 데 펜을 덧 그리고 하는 이유가 있을까?"

이 질문에 대한 챗GPT의 대답은 아래와 같이 명확했다.


'손가락을 그릴 때 펜이나 다른 물체가 포함되는 이유는, AI가 "손가락" 표현의 맥락을 해석하는 과정에서 종종 추가 요소를 자연스러운 디테일로 간주하기 때문입니다. 특히 손가락을 펼치는 동작은 인간적으로도 복잡한 포즈 중 하나로, 각 손가락의 위치와 비율을 정확히 잡는 것이 까다롭습니다. 결과적으로 AI가 손의 구도를 완성하려다 보니 손에 펜이나 다른 물체를 추가하는 경우가 종종 발생합니다.

이런 현상은 AI가 다음과 같은 이유로 정확도를 놓칠 때 나타납니다:

예를 들면 첫째, 손의 복잡한 해부학적 구조: 손가락의 길이, 관절, 각도를 모두 정확히 표현하는 것은 특히 스케치 스타일에서 어려울 수 있습니다.

둘째, 의도적인 표현으로 인한 오해: AI는 때때로 "손을 사용하는 동작"에 관한 표현에서 추가적인 도구(펜, 연필 등)를 포함하려고 할 수 있습니다.

셋째, 학습 데이터의 영향: 학습 데이터에 손에 물건을 들고 있는 이미지가 많이 포함된 경우, 손을 자연스럽게 묘사하기 위해 물체를 추가하려는 경향이 있을 수 있습니다. '


"그럼 이런 문제를 해결하기 위해서는 어떻게 해야 되지?"라고 물으니 그의 대답은 "그럼 위의 그림을 아무 물체도 없이 손가락 10개를 명확히 펼친 손으로 그려줘" 이렇게 물으라고 한다.


드디어 나는 그에게 다시 한번 요청했고 아래의 그림을 얻었다. 10개의 손가락이 디테일하게 다 표현되어 있다. 물론 내가 썩 만족하는 그림은 아니다. 질문의 질문과 최소 5번의 시행착오 끝에 거친 챗GPT의 손가락 그림이다

손가락5.jpg


keyword
매거진의 이전글여전히 미련이 남아