brunch

You can make anything
by writing

C.S.Lewis

by 손톱을 먹은 쥐 May 20. 2023

이미지 생성 AI 사용 원칙 만들기 1/n

Stable Diffusion을 중심으로

스테이블 디퓨전으로 이미지를 생성해내기 위한 환경 구성 난이도는 그리 높지 않습니다. 프로그램 설치 방식은 아니라 생소할수도 있지만 가이드를 보고 그대로 따라하면 누구나 할 수 있을 것입니다. 

완전하지는 않지만 생성한 이미지는 어떤 프롬프트로, 어떤 설정으로 생성한 것인지 쉽게 알아낼 수 있습니다. 저작권 문제 해소에 실마리가 될 수 있지 않을까요?

스테이블 디퓨전으로 이미지를 생성하는 것은 대부분의 스타일을 섭렵한 작가에게 무제한 수정 요구를 할 수 있는 커미션을 주문한 개념이라고 느껴집니다.

결과물은 랜덤요소가 있어서 가챠나 슬롯머신같은 느낌이 든다. 프롬프트에 Moon, Lunar 키워드를 바꿔 사용했을 때 상관없는 부분에서 변화가 생기기도 합니다. 우연성을 어느정도까지 허용할 수 있을까요?

저작권 문제는 크게 두 부분에서 문제가 될 것 같은데 1. 이미지를 생성하는 주모델이 학습한 데이터가 저작권 문제에 자유롭지 않을 거라는 것, 2. 프롬프트 자체에 작가 이름을 넣어 스타일 생성을 요청하는 것 입니다.



ChatGPT와 '이미지 생성 AI 사용 원칙'을 만들어보려고 합니다. 직접 원칙을 만들도록 프롬프트를 주지 않고 논의를 전개하면서 보완할 점과 새롭게 생각할 부분을 다듬도록 하여 생각의 보조수단으로 사용합니다. 논의가 끝나면 그동안의 대화를 정리해 최종 원칙 목록을 만들어내도록 할 생각이었는데 의외로 대화 자체가 즐거웠기 때문에 일부를 기록해두려고 합니다. 

1차 대화는 번역기를 사용하여 영어로 대화했고, 두번째는 1차 대화의 내용을 참고하여 한국어로 대화했습니다. 대화 상대는 GPT-4 입니다. '나'의 대화는 일반 본문으로, 'GPT-4'의 대화는 인용으로 표시했습니다.

대화는 좋은 응답을 골라 일부 편집되었습니다.



나: 이제 당신은 '이미지 생성 인공지능으로 이미지를 만들 때 고려해야 할 원칙 만들기'를 주제로 이루어지는 대화의 대담자가 되었습니다. 당신은 다른 관점을 제시하거나 미처 고려하지 못했던 부분을 채워 대화를 풍성하게 만드는 데 능숙합니다. 먼저 인공지능으로 이미지를 만드는 것을 과거 카메라가 처음 발명된 시점의 사진찍기를 비교하여 새로운 기술이 창작으로서 인정받게 된 과정을 역사적 맥락과 비교하여 논의해 보겠습니다.


GPT: 그러한 비교는 매우 흥미롭습니다. 사진의 발명 이후, 그것이 창작의 형태로 인정받기까지 많은 논란이 있었습니다. 초기에는 사진이 단지 현실을 기록하는 도구라고 생각되었지만, 시간이 지남에 따라 사진작가들의 창의적인 비전과 기술적 기교가 독특한 예술 형태를 만들어냈습니다.

AI 이미지 생성에 대한 현재의 논의는 이와 비슷한 맥락에서 이루어질 수 있습니다. 처음에는 이 기술이 단순히 데이터의 패턴을 따라서 이미지를 생성하는 도구라고 생각되었을 수 있지만, 이러한 도구들이 창작에 더 많이 활용되며 그것 자체로서의 예술적 가치와 가능성이 인정받게 될 수 있습니다.

물론, AI로 만들어진 이미지에 대한 적절한 원칙을 설정하는 것은 중요합니다. AI가 창작하는 과정에서 사람의 창의성과 인간적인 감성을 어떻게 반영할 것인지, 그리고 그것이 사회적, 문화적 맥락에 어떻게 들어맞는지를 고려해야 합니다. 이러한 원칙은 AI가 더 창의적이고, 독창적인 작품을 만들 수 있도록 돕는 동시에, 미적 표현의 다양성과 광범위한 표현의 자유를 유지하도록 해야 합니다.


먼저 AI 이미지 생성 원칙을 만들 때 고려해야 할 점을 목록으로 만들어볼까요? 이 목록을 중심으로 논의를 이어나가 보려고 합니다.


아주 좋은 생각입니다. 이전 대화에서 제시된 관점을 고려하여 목록을 업데이트하면 다음과 같습니다:

- 원본 존중과 복제 가능성: AI는 원본 이미지나 예술작품의 저작권을 존중해야 합니다. 동시에, AI가 생성한 이미지는 무한히 완벽하게 복제될 수 있음을 인지하고, 이에 대한 적절한 저작권 처리 방식을 고려해야 합니다.

- 의도성과 창조성: AI는 새로운, 독특한 이미지를 만드는 데 사용되어야 하며, 이는 사람의 창조성을 보완하고 확장하는 역할을 합니다. 그러나 AI의 모든 결정을 제어하지 않는 경우, AI의 의도성이 어떻게 반영될 수 있는지에 대한 원칙을 고려해야 합니다.

- 명확성과 투명성: AI가 생성한 이미지는 항상 그렇게 표시되어야 하며, 사용자는 AI가 작업에 어떤 부분을 참여했는지 알 수 있어야 합니다.

- 문화적 고려와 윤리와 편견: AI는 다양한 문화적 배경과 민감성을 고려해야 하며, 학습 데이터의 편향을 고려하고 공정하고 포용적인 이미지 생성을 보장해야 합니다.

- 진정성과 진실성: AI로 생성된 이미지는 실제로는 없는, 그러나 실제처럼 보일 수 있는 이미지를 만들 수 있습니다. 이는 시각 미디어의 진정성과 진실성에 대한 원칙을 필요로 합니다.

- 접근성과 민주화: AI 도구의 증가와 함께, 누구나 전문가 수준의 시각적 콘텐츠를 제작할 수 있는 기회가 확대되었습니다. 이는 예술 참여의 민주화를 의미하며, 이를 고려한 원칙을 설정해야 합니다.

- 윤리적 책임: AI는 피해를 줄이고, 공정하며, 윤리적으로 적절한 이미지를 만드는 데 사용되어야 합니다. 이는 특히 민감한 주제나 표현에 대해 중요합니다.

각 원칙은 서로 연관되어 있으며, 때로는 상충하는 경우도 있습니다. 예를 들어, 창조성과 독창성은 접근성과 민주화와 상충할 수 있습니다. AI 도구를 사용하여 누구나 전문적인 이미지를 만들 수 있게 되면, 결과적으로 시장에서 독창적인 작품이 과도하게 만들어지고 평가 절하가 발생할 수 있습니다.
그러므로 이 원칙들은 가이드라인이며, 이들 간의 균형을 찾는 것이 중요합니다. 또한 이 원칙들은 다양한 문화적, 사회적 맥락에서 적용되므로, 이러한 다양성을 고려하는 것도 중요합니다.

마지막으로, AI 이미지 생성에 대한 원칙은 유동적이며 시간에 따라 변화할 수 있습니다. 새로운 기술이 개발되고, 사회적 가치와 기대가 변화함에 따라 이 원칙들도 계속해서 업데이트되어야 합니다. 그러므로, 이 원칙들을 정기적으로 검토하고 업데이트하는 것이 필요합니다.  
작가의 이전글 DeepLearnung.AI의 프롬프트 엔지니어링
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari