brunch

You can make anything
by writing

C.S.Lewis

by 손톱을 먹은 쥐 May 22. 2023

이미지 생성 AI 사용 원칙 만들기 2/n

Stable Diffusion을 중심으로

최근 시사인 전혜원기자의 기사에 관련 내용이 잘 정리되어 있네요.

https://www.sisain.co.kr/news/articleView.html?idxno=50287


ChatGPT와 '이미지 생성 AI 사용 원칙'을 만들어보려고 합니다. 직접 원칙을 만들도록 프롬프트를 주지 않고 논의를 전개하면서 보완할 점과 새롭게 생각할 부분을 다듬도록 하여 생각의 보조수단으로 사용합니다. 논의가 끝나면 그동안의 대화를 정리해 최종 원칙 목록을 만들어내도록 할 생각이었는데 의외로 대화 자체가 즐거웠기 때문에 일부를 기록해두려고 합니다. 

1차 대화는 번역기를 사용하여 영어로 대화했고, 두번째는 1차 대화의 내용을 참고하여 한국어로 대화했습니다. 대화 상대는 GPT-4 입니다. '나'의 대화는 일반 본문으로, 'GPT-4'의 대화는 인용으로 표시했습니다.

대화는 좋은 응답을 골라 일부 편집되었습니다.



나: 의도성에 대해 먼저 이야기해 보겠습니다. 사진은 물리적 빛의 화학 반응으로 현실을 정확히 재현한 것이지만 원본으로 저작권이 보호됩니다. 여기에는 카메라의 종류, 각도, 렌즈 선택, 셔터 속도 등 여러 가지 요소를 제어하고, 의도한 것과 유사한 사건이나 조건(예: 바람이 불거나 동물이 특정 행동을 하는 것)이 현실에서 일어나기를 기다리는 것까지 포함하며, 이 모든 것이 결합되어 고유한 특성을 가진 결과물이 만들어집니다. 이러한 관점에서 볼 때, AI 이미지 생성은 스테이블 확산을 기반으로 모델을 선택하고, 스텝 및 CFG 수준과 같은 파라미터를 조정하고, 의도를 표현하는 프롬프트를 작성하는 것입니다. 우연의 요소인 시드를 다양하게 변경하여 원하는 장면을 생성하는 시드를 찾는 것입니다.

이러한 관점에서 볼 때, AI 이미지 생성은 사진 촬영에서 인식되는 의도를 반영해야 하지 않을까요? 오히려 역사적으로 사진이 처음 등장했을 때 그 고유의 가치를 인정받지 못했던 사례도 있습니다.


GPT: 맞는 말씀입니다. 사진 촬영과 AI 이미지 생성 모두 다른 방식이긴 하지만 최종 결과물의 독창성에 기여하는 의도적인 요소와 의사 결정이 포함됩니다. 두 경우 모두 크리에이터는 특정 결과를 얻기 위해 사진 촬영의 카메라 설정과 타이밍, AI 이미지 생성의 모델, 매개변수, 시드 선택 등 의도적인 선택을 합니다. 이러한 점에서 AI 이미지 생성은 창작 과정과 크리에이터의 역할 측면에서 사진과 유사하다고 볼 수 있습니다. AI 이미지 생성에 있어 시드를 변화시킴으로써 도입되는 우연의 요소는 조명의 변화나 돌발적인 사건과 같은 사진의 예측할 수 없는 요소에 비유할 수도 있습니다. 하지만 질문자께서 올바르게 지적하신 것처럼 사진의 역사는 여기서 귀중한 교훈을 제공합니다. 사진이 처음 등장했을 때 사진이 예술 형식으로 즉시 받아들여지거나 창의적인 가치를 인정받은 것은 아니었습니다. 많은 사람들은 사진이 단순히 현실을 포착하는 기계적인 과정일 뿐, 전통적인 예술 형식에서 요구되는 창의성과 기술이 부족하다고 주장했습니다. 사회가 사진의 예술적 잠재력을 이해하고 감상하고, 구도, 조명, 타이밍과 관련된 창의성을 인정하고, 저작권을 보호할 가치가 있는 예술적 표현의 한 형태로 받아들이는 데는 시간이 걸렸습니다. 오늘날 AI 이미지 생성에 대해서도 비슷한 논쟁이 벌어지고 있습니다. 일부에서는 AI가 생성한 이미지의 창의적 가치에 의문을 제기하며 단순한 알고리즘의 산물로 간주하는 반면, 다른 한편에서는 예술적 표현을 위한 새로운 매체로서 이러한 도구의 혁신적인 잠재력을 높이 평가합니다. 그렇기 때문에 의도성에 대한 논의가 매우 중요합니다. AI 이미지 생성의 의도를 인식하는 것은 사진의 경우와 마찬가지로 그 창의적 가치를 이해하는 단계입니다. 이는 저작권 및 소유권 문제를 포함하여 AI 이미지 생성에 관한 원칙과 규범을 형성하는 데 도움이 될 수 있으며, AI 이미지 생성을 그 자체로 예술적 표현의 한 형태로 이해하는 데도 도움이 될 수 있습니다. 물론 그렇다고 해서 모델의 잠재적 편향성, 진위 문제, 초현실적 이미지 제작의 윤리적 함의 등 AI 이미지 생성이 제기하는 고유한 문제를 무시하는 것은 아닙니다. 이러한 문제는 새로운 크리에이티브 환경을 탐색할 때 해결해야 할 복잡한 문제입니다. 하지만 AI 이미지 생성의 의도성을 인정하는 것이 중요한 출발점입니다.


그렇다면 AI 이미지 생성은 사진촬영과 비슷한 의도성을 가질 가능성이 있으며, 이것은 사진처럼 결과물에 대한 예술적 가치를 인정받을 가능성을 가지기도 하지만 의도가 포함되었으므로, 결과물에서 발견되는 윤리적 문제들을 AI 모델 사용자가 다루어야 한다고 정리할 수 있을까요?


네, 공정하고 통찰력 있는 평가입니다. 사진 촬영과 마찬가지로 AI 이미지 생성에는 최종 결과에 영향을 미치는 어느 정도의 의도적인 의사 결정이 수반됩니다. AI 모델 선택, 매개변수 조정, 프롬프트 제작 등 제작자가 내린 선택은 AI가 생성한 이미지의 독창성과 예술적 가치에 영향을 미칩니다. 이러한 의도성은 AI의 혁신적인 기능과 결합하여 예술적 표현과 창의성을 위한 새로운 가능성을 열어줍니다. 그러나 이러한 의도성은 AI 모델 사용으로 인해 발생할 수 있는 윤리적 문제와도 관련이 있습니다. AI가 생성한 이미지가 저작권이 있는 저작물을 복제하거나 편견을 포함하거나 현실을 잘못 표현한 것으로 밝혀질 경우, 그 책임은 사용자에게 있습니다. 사용자가 AI를 안내하고 해당 이미지를 생성하는 데 필요한 선택을 했기 때문입니다. 이는 책임감 있고 윤리적인 AI 도구 사용의 중요성을 강조합니다. 사용자는 AI 이미지 생성과 관련된 잠재적인 함정과 문제를 인식해야 하며, 저작권을 존중하고 편견이 지속되지 않도록 하며 진정성과 무결성을 유지하는 방식으로 이러한 도구를 사용하도록 노력해야 합니다. 본질적으로, 의도성과 예술적 장점이 있는 만큼 윤리적 문제를 해결하고 완화할 책임이 있습니다. 이는 사용자가 이 새로운 영역을 책임감 있고 윤리적으로 탐색하는 데 도움이 될 수 있는 AI 이미지 생성 도구 사용에 대한 지침 원칙과 규범의 필요성을 강조합니다.


네 그럼 AI 이미지 생성 모델의 사용 원칙을 만들어나가기 위한 논의를 이어나가봅시다. 다음은 독창성과 복제 가능성에 대해 이야기해 봅시다. 생성된 이미지를 무한히 완벽히 복제할 수 있으며, 수정할 수 있다는 것은 디지털 카메라로 촬영된 이미지도 같다고 생각됩니다. 파일을 무한히 복제할 수 있으며 포토샵 같은 도구를 사용해 수정할 수있습니다. 그렇다면 '원본'을 보는 방식과 저작권 처리 방식은 디지털 카메라의 사례를 참고해볼 수 있지 않을까요? 미처 고려되지 않은 차이점이 있나요?


실제로 AI가 생성한 이미지와 디지털 사진의 디지털 특성은 복제 가능성과 수정 가능성의 특성을 공유한다는 것을 의미합니다. 그러나 두 가지를 구분하는 몇 가지 미묘한 차이가 있으며, 이는 각 사례에서 '독창성'을 바라보고 저작권을 처리하는 방식에 영향을 미칠 수 있습니다. 창작 과정: 디지털 사진과 AI가 생성한 이미지의 생성 과정은 근본적으로 다릅니다. 사진은 카메라로 촬영한 실제 장면을 디지털로 표현한 것입니다. 반면에 AI가 생성한 이미지는 입력 데이터에 대한 알고리즘의 해석을 기반으로 처음부터 만들어집니다. 이러한 생성 방식 차이는 우리가 작품의 독창성을 인식하는 방식에 영향을 미칠 수 있습니다. 예측 불가능성: AI 이미지 생성은 알고리즘과 무작위성(예: 시드 값)에 의존하기 때문에 예측할 수 없는 요소를 도입합니다. 동일한 모델을 동일한 프롬프트와 다른 시드로 두 번 실행하면 완전히 다른 이미지가 생성될 수 있으므로 독창성과 복제의 개념에 복잡성이 더해집니다. 수정 및 파생: 디지털 사진은 포토샵과 같은 도구를 사용하여 수정할 수 있지만, 그 결과는 일반적으로 원본 사진의 2차 저작물로 간주됩니다. 반면, AI 모델의 매개변수나 시드를 약간만 수정해도 원본 결과물과 상당히 다른 이미지가 생성될 수 있습니다. 따라서 이러한 이미지를 '원본' 또는 '파생물'로 분류하는 것이 복잡해질 수 있습니다. 소유권 및 저작권: 디지털 사진의 저작권은 일반적으로 사진 작가에게 있습니다. 그러나 AI로 생성된 이미지의 소유권은 입력을 제공한 제작자, AI 모델 개발자, 학습 데이터를 제공한 기업 등 여러 당사자가 관여하기 때문에 소유권이 명확하지 않을 수 있습니다. 이러한 모호성은 저작권 처리 방식에 영향을 미칠 수 있습니다. 따라서 디지털 사진은 몇 가지 유용한 유사점과 교훈을 제공하지만, AI 이미지 생성의 고유한 특성과 과제는 독창성과 저작권의 개념에 다른 각도에서 접근해야 할 수도 있음을 의미합니다. 디지털 사진과 같은 관련 분야의 기존 관행에서 학습하는 동시에 AI 이미지 생성의 특수성을 고려한 새로운 프레임워크 또는 원칙을 개발해야 할 수도 있습니다.


AI 이미지 생성 원칙을 만들기 위해서 각각의 사례마다 생각할 부분은 다음과 같습니다. Creation Process:디지털 사진과 AI가 생성한 이미지의 생성 과정의 차이중 중요한 것은 AI 생성의 경우 결과에 학습된 모델이 개입한다는 점입니다. 이 모델을 선택하는 권한은 생성자에게 있지만, 모델의 학습 대상은 불명확하고 이미지가 선택되고 튜닝하는 과정에 포함된 의도도 불명확합니다. 생성자는 모델이 생성해내는 이미지의 일부를 보고 경향을 추측하여 프로세스에 포함시키게 됩니다. 이는 우연의 요소를 의도적으로 포함시키는 것과 달리 다른 행위자를 결과물 도출에 참여시키는 것입니다. 때문에 AI 이미지 생성 원칙에는 어떤 모델을 사용하였는지 표기해야 한다는 내용이 포함되는 것이 타당하다고 판단됩니다. Unpredictability: 시드를 찾아가는 과정은 무작위성에 기대지만, 같은 시드를 사용하면 같은 이미지가 생성됩니다. 이는 오히려 같은 설정의 디지털 카메라로 다른 대상을 촬영하는 행위로 볼 수 있지 않을까요? Modification and Derivation: 매개변수나 시드를 약간만 수정해도 원본 결과물과 상당히 다른 이미지가 생성될 수는 있지만 프롬프트의 의도를 반영한 결과물이 나옵니다. 디지털 촬영에 비유하면 비슷한 다른 대상을 찍거나 촬영 방향을 바꾸는 행위에 비교될 수 있습니다. '원본' 또는 '파생물'로 분류하는 것은 적절치 않아보입니다. 디지털 사진에서 참조할 만한 내용이 있을까요? Ownership and Copyright: AI로 생성된 이미지의 소유권은 생성자(입력을 제공한 제작자), AI 모델 개발자, 학습 데이터를 제공한 기업 등이 관여하는 것은 명백합니다. 때문에 AI 이미지 생성 원칙에는 모델에 대한 정보 공개가 포함되어야 하며 모델의 활용 권한을 따라 생성된 이미지를 활용해야 합니다. 현재 대부분의 모델은 상업 사용을 제한하고 있기 때문에 원칙에 모델의 정책을 따라 상업적 사용을 제한받을 수 있다는 내용이 포함되어야 합니다.


당신의 분석은 이 대화에 새로운 차원의 깊이를 더해 주었고, 저도 지적에 동의합니다. 이제 이러한 관찰 결과를 AI 이미지 생성 도구의 사용을 안내할 수 있는 구체적인 원칙으로 재구성해 보겠습니다: 모델 선택의 투명성: 말씀하신 것처럼 AI 모델 선택은 최종 결과물에 큰 영향을 미칩니다. 따라서 사용자는 이미지를 생성할 때 어떤 모델을 사용했는지 항상 공개해야 합니다. 이는 투명성을 높일 뿐만 아니라 모델 개발자에게도 정당한 인정을 받을 수 있습니다. 예측 불가능성에 대한 인정: AI 이미지 생성의 예측 불가능한 특성은 크리에이티브 프로세스의 고유한 부분으로 인정하고 이해하며 포용해야 합니다. 시드 값을 사용하면 무작위성을 도입하는 동시에 동일한 카메라 설정으로 촬영할 피사체를 다르게 선택하는 것과 같이 일종의 제어가 가능합니다. 독창성과 파생의 재정의: AI 이미지 생성은 '원본' 및 '파생' 작품에 대한 전통적인 개념에 도전합니다. 사진에서 촬영 방향을 바꾸는 것과 마찬가지로 매개변수나 씨앗을 조금만 변경해도 완전히 다른 이미지가 생성될 수 있습니다. 따라서 이러한 용어를 재정의하거나 AI가 생성한 이미지의 고유한 특성을 반영하는 새로운 범주를 만드는 데 개방적이어야 합니다. 명확한 소유권 및 저작권 가이드라인: AI가 생성한 이미지의 소유권 및 저작권에 관한 명확한 가이드라인을 수립해야 합니다. 여기에는 정보를 제공한 제작자, AI 모델 개발자, 학습 데이터를 제공한 주체의 역할을 인정하는 것이 포함됩니다. 사용자는 모델과 관련된 사용 권한을 존중하고 상업적 사용에 대한 모든 제한 사항을 준수해야 합니다. 인공지능의 역할 존중: 지적하신 바와 같이 인공지능 모델은 단순한 도구가 아니라 이미지 제작에 적극적으로 참여하는 주체입니다. 따라서 사용자는 AI의 역할을 존중하고 AI를 창작 과정의 협력자로 간주해야 합니다. 이는 AI 이미지 생성에 대한 보다 윤리적이고 책임감 있는 접근 방식을 촉진하는 데 도움이 될 수 있습니다. 이러한 원칙은 AI 이미지 생성의 복잡하고 미묘한 특성을 반영하며, 사용자가 이 새로운 분야를 책임감 있고 윤리적으로 탐색하기 위해 따를 수 있는 프레임워크를 제공합니다. AI 기술이 계속 발전함에 따라 이러한 원칙은 새로운 도전과 기회를 해결하기 위해 조정되어야 할 수도 있습니다.


작가의 이전글 이미지 생성 AI 사용 원칙 만들기 1/n
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari