최근 공을 들이고 있는 '인형옷 갈아입히기(Doll Dress-up)' 프롬프트 앱 작업이 꽤 흥미로운 국면에 접어들었습니다.
단순히 예쁜 그림 한 장을 얻는 것은 어렵지 않습니다. 하지만 실제 서비스 레벨로 넘어가면 이야기가 달라집니다. 사용자가 원하는 옷을 선택했을 때, 캐릭터의 정체성(얼굴, 체형, 분위기)은 유지하면서 의상만 정교하게 교체하는 작업에는 생각보다 까다로운 허들이 많았습니다.
처음에는 욕심을 내서 모든 요소를 한 번에 생성하려고 시도했습니다. 하지만 프롬프트가 길어질수록 AI는 갈피를 못 잡고 전체적인 톤이 어긋나기 일쑤였습니다.
결국 해결책은 '시스템적 분해'에 있었습니다. 이미지를 요소별로 쪼개서 생성하고, 이를 일정한 톤으로 병합하며 고해상도로 끌어올리는 워크플로우를 구축했습니다. 덕분에 이제는 캐릭터의 고유한 분위기를 해치지 않으면서도, 옷감의 질감까지 세밀하게 살아있는 고퀄리티 소스(Paper Doll Sheet)를 얻을 수 있게 되었습니다.
요즘 저의 최대 관심사는 Nano Banana 2와 Duck Tape의 조합입니다.
나노바나나2(Gemini 3 Flash Image): 텍스트 이해도가 놀라운 수준입니다. 파스텔 톤의 미묘한 색감이나 "Frilled pastel pink blouse" 같은 구체적인 묘사를 시각화하는 능력이 매우 탁월합니다.
덕테이프: 일관성을 단단하게 붙잡아주는 가이드라인 역할을 합니다.
사실 이 두 모델은 아직 "둘이 합쳐 하나가 될까 말까" 하는 밀당의 단계에 있습니다. 한쪽이 감성을 풍부하게 표현하면 다른 한쪽이 논리적으로 구조를 버텨줘야 하는데, 이 접점을 찾는 것이 현재 제 프롬프트 진화의 핵심 과제입니다.
이제 앱의 개발 방향성은 명확해졌습니다. 단순히 전체 이미지를 새로 만드는 단계를 넘어, '의상(Outfit)'만 전문적으로 갈아입히는(Inpainting/Swapping) 프롬프트 엔진으로 고도화하는 중입니다.
공개한 UI 레이아웃에서 보시는 바와 같이, 캐릭터의 기본 설정(Name, Age, Concept)은 고정값으로 유지하고 의상 아이템(Upper, Bottom, Footwear)만 동적으로 변환하는 구조입니다. 여기에 제가 찾아낸 고해상도 구현 노하우까지 입혀지니 제법 완성도 높은 결과물이 나오고 있습니다.
요즘 고민은 앱으로 이전하기 전에 어떤 방식으로 요즘 친구들이 좋아하는 것을 찾는 것입니다. 저희 출판사의 리소스를 잘 이용해서 앱으로 제공하는 방법을 테스트 하고 있습니다.