Dall-e 인공지능(AI) 아트

개발자 생각 #34

by Vintage appMaker

Feb 11. 2023

AI 솔루션( ChatGPT 등등)들이 이슈화 되며 지인들의 sns가 핫해지기 시작했다.

내용이 딥해지며 딥러닝과 강화학습 전문가 입장에서 ai가 예술분야에 어떻게 적용되는 지 논문수준의 내용들이 포스팅되고 공유가 되고 공감이 채워진다. 그러나 비전공자 입장에서 읽어보니 도대체 무슨 말인지 모르겠다. 머신러닝, 강화학습, 딥러닝의 구분조차 힘들기에 읽다보면 정신 줄을 놓게 된다. 그래서 그들이 언급한 ai 예술 플랫폼 dall-e를 실행해보았다. 그나저나 이름을 보니 “살바도르 달리”의 오마주라는 생각이 든다.

인공지능 로직쪽은 학자의 영역이지만, 인공지능 서비스는 개발자의 영역이다. 그렇기 때문에 대부분의 AI는 개발자를 위한 소스코드를 오픈하거나 API만 제공하는 것이 common sense이다.

위의 예제는 Python이다.개발자, 과학자, 학생 모두에게 Python은 필수로 권장된다. 비교적 쉬운 언어이다.

빠르게 경험하고 기능정리

일단 사이트에 들어가서 사용자 입장에서 테스트를 해보았다. 그래서 다음과 같은 기능이 제공됨을 확인했다.

(1) 문자요청을 분석, 적합한 이미지 제공 (2)이미지 내 Object 분석 (3)이미지 재구성의 기능을 제공한다

이미지 내에서 Object를 분석하는 것에 그치는 것이 아니라 layout도 분석한다고 판단된다. 심지어 질감과 색감까지 원작자의 의도에서 크게 벗어나지 않게 구현하고 있다. 간단히 말해 이미지 내에 어떤 것들이 존재하는 지 AI가 판단하며 그 틀에 벗어나지 않게 새롭게 만든다. 이런 로직으로 풍경에 사람이 있는 것인지 헝클어진 사람의 얼굴인지를 판단하고 "같은 구성"으로 새롭게 창조한다.

테스트 내용

다음은 내가 그린 그림을 Dall-e 에 업로드하여 재구성한 것이다. 참고로 맨 좌측이 원본이고 우측부터 Dall-e가 재구성한 이미지들이다.

원래 이렇게 다양한 얼굴을 그리고 싶었다.

여자인물 그림을 재해석 한 것이 너무 마음에 든다. 이 결과만으로 dall e를 다시보게 되었다. 내가 원래 저렇게 시리즈로 그리고 싶었기 때문이다.

닭을 완벽하게 이해했다.

닭을 그렸건만, “형, 뀡같아” 라고 말한 후배님들에게 인공지능님께서 인정한 닭이라고 말해주고 싶다. 단지 문자인식은 shape만 인식하고, 아무말 대잔치를 하는 것 같다.

만화같은 곳에서 많이 유용하지 않을까라는 생각을 해본다.

사람과 배경은 재대로 인식하는 것 같다.특히 패턴을 그대로 유지하고 사람의 위치와 옷, 헤어스타일을 변경하는 것을 보아서는 그림의 오브젝트를 재대로 인식한 것처럼 보인다. 아쉽게도 고양이는 분석 못 했다.

연속된 의미가 있는 작품으로 보였다. 마치 작가가 의도한 듯한...

농도의 차이를 가진 단일색 그림임을 파악하고 그 유형의 틀을 벗어나지 않은 채, 길과 나무 산의 레이아웃과 크기를 변형했다.

핵심 Object만 깔끔하게 정리한 것에 놀랐다.

다양한 색과 패턴이 있음에도 불구하고 달,산,건물,나무,인장을 구분했다. 그리고 재배치 했다.

Object 분석이 완벽하지 않은 모델도 보였다.

조이패드는 큰 틀은 이해했으나 진동스틱, 냥발,십자키,버튼에 대한 이해가 없었다. 여기서 이해라고 말한 이유는 각각의 object는 인식하고 분석한 듯 한데 그것들이 밖으로 떨어지면 안된다는 것(위치의 중요성)을 모른 것 같다.

참고로 모든 그림 중

"1개의 그림 외에는 내가 평소쓰는 인장(玩)이 인식되지 않았다"

Object로 분석하지 못했다. 가치가 없다고 판단한 것이다.

Dall-e와 chat gpt의 open api를 이용한다면 4컷 시사만화나 딜버트 같은 풍자만화를 만드는 앱이 조만간 출시될 것이라 판단되었다. 개발자 입장에서는 흥미로운 일들이 생길 것이라는 기대가 크다.

Dall-e는 사진에서는 더욱 놀라운 결과를 보여주었다. 단순한 이미지 프로세싱이 아님을 직감적으로 알 수 있었다. 어딘가에 미리 높은 수준의 학습이 완료된 데이터가 존재함이 느껴졌다.

아무리 보아도 동일 고양이의 샘플이다. 이미지 업로드를 하지않고 cat으로 검색하여 재구성한 것이다.

AI가 사진 속 인물(2개의 다른 사진)을 일본인으로 판단하는 듯하다. 전반적인 분위기가 일본인 샘플이다. 테스트를 위해 remove BG라는 앱으로 원본 배경을 편집했다. 예상대로 뒷배경의 문자를 판독한 것일까? 소위 말하는 와꾸(테두리)만 같고 내용물은 전혀 다른 데이터(일본인)로 재구성되었다.

느낀점

Dall-e는 정말 놀라왔다. 작가가 어떤구상이 있다면 나머지는 ai가 처리하며 작품을 만들 수 있다는 생각을 해보았다. 가치관을 달리하면 생산성이라는 측면에서 놀라운 결과를 얻을 수도 있다. 결국 자문을 해보았다. ai가 인간의 고유영역이라 믿고있는 예술영역을 침범하지 못한다고 단정할 수 있을까? 2023.02 현재,나는 yes를 쉽게 말 할 수 없다. Dall-e의 경쟁 또는 업그레이드 버전이 우후죽순 생기고 있기 때문이다.

이런 식이라면 ai가 빠른시간 내에 인간의 영역을 잠식할 것이다. 조만간 코타나 같은 존재에 충성을 맹세하는 인간들이 나오지 말란 법도 없다.

결국 인류를 지킬 수 있는 자들은 스파르탄과 마스터 치프 뿐일까? 이런 황당한 잡념이 현실화되지 않기를 바랄 뿐이다. 참고로 윈도우에서 제공하는 음성인식 프로그램인 코타나가 이 게임에서 나오는 코타나와 기능만 다른 동일제품이다.

https://namu.wiki/w/Microsoft%20Cortana

keyword

Vintage appMaker 직업 개발자

30년차 개발자입니다.소프트웨어 개발, 컨설팅, 때때로 잡다한 일(강의, 책)을 합니다.

팔로워 128

매거진의 이전글chatGPT 1달 사용기인공지능 글쓰기 결과는?(Dall-e, ChatGPT)매거진의 다음글