brunch

You can make anything
by writing

C.S.Lewis

by AI러 이채문 Oct 14. 2024

파일이름으로 그림을 만든다고?

Flux AI 모델, 간단한 파일명 프롬프트로 놀라운 사진 생성 능력

최근 Stable Diffusion 커뮤니티에서는 AI 이미지 생성 모델 Flux의 놀라운 능력이 화제가 되고 있습니다. 


사용자들은 "IMG_1234.JPG"와 같은 간단한 파일명 형식의 프롬프트만으로도 매우 사실적인 사진을 생성할 수 있다고 보고하고 있습니다.


Reddit 사용자 idunno63는 이 현상을 직접 테스트해보고 그 결과를 공유했습니다. 그는 Flux Dev FP8 모델을 사용해 "IMG-7587.JPG Christmas party"와 같은 프롬프트로 이미지를 생성했고, 놀랍도록 자연스러운 파티 사진들이 만들어졌습니다.


이 기법은 단순히 파일명만 입력하는 것이 아니라, 파일명과 함께 간단한 설명을 덧붙이는 방식으로 사용됩니다. 예를 들어 "IMG_7587.JPG vacation"이라고 입력하면 휴가 사진이, "IMG-7587.JPG Graduation"이라고 입력하면 졸업식 사진이 생성됩니다.


초기 반응은 대부분 긍정적이었습니다. 많은 사용자들이 이 기법으로 생성된 이미지의 높은 품질과 사실성에 감탄했습니다. 한 사용자는 "이건 정말 대단해요! AI의 특징적인 흔적을 찾으려면 정말 자세히 들여다봐야 할 정도예요."라고 평가했습니다.


그러나 일부 사용자들은 이 효과의 일관성에 의문을 제기했습니다. ThenExtension9196라는 사용자는 "복제하기 어렵고 효과가 일관적이지 않아요. 아직은 아니라고 봅니다. 일주일 후면 아무도 신경 쓰지 않을 일시적인 현상일 뿐이에요."라고 주장했습니다.



저도 한번 로컬로 돌려서 만들어 봤습니다.



이 새로운 프롬프트 기법이 어떻게 작동하는지에 

대해 커뮤니티 내에서 다양한 가설과 

실험이 이루어졌습니다.


일부 사용자들은 이것이 단순한 무작위 노이즈 문자열 효과일 뿐이라고 주장했습니다. Pretend_Potential이라는 사용자는 "그냥 무작위 문자열일 뿐이에요. 아무 글자나 숫자를 입력해도 똑같은 효과가 날 거예요."라고 말했습니다.


그러나 다른 사용자들은 이 효과가 단순한 무작위성 이상의 의미가 있다고 보았습니다. Zugzwangier라는 사용자는 SDXL 모델에서 파일명의 의미를 인식한다는 것을 확인했다고 주장했습니다.


IncomeResponsible990이라는 사용자는 더 자세한 설명을 제시했습니다: "AI가 학습 데이터에서 'IMG_XXXX.JPG' 태그가 있는 수많은 아마추어 사진들의 구도를 학습한 것 같아요. 각 이미지 태그 아래의 사진들이 매우 다양했기 때문에, 숫자들이 일종의 랜덤 서브시드 역할을 하게 된 거죠."


이 기법의 효과를 더 자세히 알아보기 위해 다양한 실험들이 진행되었습니다. areopordeniss라는 사용자는 "graduation" 예시를 바탕으로 각 단어의 가중치를 비교하는 이미지 그리드를 만들었습니다.


DoctorDiffusion이라는 사용자는 다양한 파일 확장자와 장치명을 실험해보았습니다. 그 결과 "IMG_0067.CR3", "DSC01987.ARW", "GOPR0034.MP4", "MAVIC_0007.JPG" 등 실제 카메라나 기기의 파일명 형식을 사용했을 때 각각의 특징적인 이미지 스타일이 생성된다는 것을 발견했습니다.


Vagrant_Toaster라는 사용자는 더 복잡한 프롬프트 기법을 제안했습니다. 그는 중괄호 안에 단어와 무작위 숫자를 함께 넣는 방식(예: {man on a bike, 20748294})을 사용해 이미지의 세부 사항을 미세하게 조정할 수 있다고 주장했습니다.




원본링크:


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari