소설『숨겨진 제단』주인공 3D 피규어 만들기
『챗GPT를 실험실로 쓰는 인간의 노트』는 단순한 AI 활용 가이드가 아니다. GPT를 단순한 질문-대답 기계가 아닌, 조건을 설계하고 실험하는 '실험실'로 바라보는 시선에서 출발한다.
이 시리즈는 GPT 사용법을 넘어 사고와 언어를 어떻게 구조화하고, 흐름을 어떻게 설계하는지 실험자 시점에서 기록한 디지털 사고의 기록이다. AI와 함께하는 새로운 사고방식, GPT를 '설계'하는 경험을 공유한다.
GPT는 언어로 사고하는 도구지만, 때때로 그 언어가 '형태'를 부를 수 있다. 이번 실험은 텍스트에서 비주얼로 넘어가는 과정, 즉 단어가 이미지가 되는 순간을 실험했다. 앞서 5화 '텍스트 실험'에서 만들었던 소설 『숨겨진 제단』을 바탕으로 GPT에게 이미지 생성을 요청해보자.
GPT는 아래와 같은 구체적인 구성을 자동으로 제시했다.
● 주인공 '엘라린'이 마법서를 펼치고 있는 모습
● 배경은 고풍스러운 마법사 길드의 도서관 혹은 비밀스러운 제단
● 엘라린은 젊고 밝은 표정, 귀엽고 약간 동글동글한 스타일
● 주변엔 마법 불꽃이나 빛나는 마법진 효과
● 그리고 오래된 책들과 마법 도구들이 흩어져 있는 연출
단순히 '그림을 만들어줄게'가 아니라, 어떻게 구성할지를 먼저 상상하고, 그에 맞는 장면을 언어로 설계해 보여준 것이다. 이제 우리는 텍스트를 넘어서 비주얼을 설계하는 단계로 진입했다.
하지만 이건 단지 '그림'을 그리는 일이 아니다. GPT가 제안하는 장면 구성은 그대로 3D로 구현할 수도 있다.
예를 들어 GPT가 설명한 구성—'엘라린이 마법서를 펼치고 있는 모습, 고풍스러운 제단, 빛나는 마법진'—은 2D 일러스트뿐 아니라, GPT 내부에서 바로 '3D적 사고'로도 시뮬레이션해볼 수도 있다.
예를 들어 GPT에게 '피규어로 만들면 어떤 포즈가 좋을까?' '3D 캐릭터 구도처럼 자세를 짜줘'라고 요청하면, 입체 조형을 전제로 한 캐릭터 설명을 만들어준다.
위의 이미지를 기반으로 "이걸 피규어로 만들면 어떤 포즈가 좋을까? 3D 캐릭터 구도처럼 자세를 짜줘"라고 실제로 요청했다. 다음은 GPT가 GPT 스타일로 응답한 텍스트박스 '3D 피규어 구도 제안'이다.
GPT는 이 포즈는 단순히 앉아 있는 정적인 형태가 아니라 '마법을 펼치고 있는 중'이라는 순간을 동세로 포착한 설계라고 했다. 덕분에 3D로 조형했을 때도 생동감이 잘 살아날 수 있는 구성이라고 GPT는 설명했다. 또한 이를 굿즈 설계, AR(증강현실) 캐릭터, 게임 내 모델링 구조로 확장할 수도 있다고 했다. 원하면 '이 피규어가 움직인다면 어떤 애니메이션 시퀀스가 어울릴까?' '이 장면을 AR 캐릭터로 구현하면 어떤 인터랙션이 자연스러울까?' 등의 흐름으로 확장을 할 수 있다는 것이다.
2D 이미지에서는 엘라린이 마법서를 펴고 있긴 했지만, 손끝의 불꽃은 '상징'처럼 작고 단순했다. 3D 피규어에서는 오른손이 앞으로 크게 뻗고, 손끝에 마법불꽃이 공간 안에서 떠 있다. 그냥 '불꽃을 그렸다'에서 → '불꽃을 띄우는 순간을 포착'한 조형으로 변화를 한 것이다.
공간 배경은 입체 무대가 됐다. 2D에선 배경이 '마법 도서관'이라는 암시만 있었지, 구조적으로는 평면이었다. 3D에서는 받침대 전체가 미니어처 도서관처럼 구현됐다. 책이 층층이 쌓여 있고, 촛불과 연금술 도구까지 입체적으로 배치됐다. 관객 입장에서 엘라린이 '어디에 서 있는지'까지 감각적으로 느낄 수 있다.
2D망토와 머리카락도 실제 흐름을 가진 곡선 구조가 됐다. 2D에서는 머리카락과 망토가 고정된 이미지처럼 표현됐지만, 3D에서는 바람에 날리는 듯한 곡선으로 구현됐다. 특히 망토는 뒤쪽으로 흐르며 균형 잡아주는 구조 역할까지 한다. 이건 단순히 예쁘게 보이기 위해서가 아니라, 조형의 안정성과 동적 리듬을 동시에 잡는 설계다.
표정과 시선에서는 감정이 있는 조형이 됐다. 2D에서도 밝은 표정은 있었지만, 3D에서는 시선이 살짝 위를 향하며 마법진을 바라보는 느낌이 살아있다. 눈의 위치, 입꼬리의 방향까지 계산돼서, 그냥 귀여운 게 아니라 '몰입 중인 얼굴'이 된 것이다.
또 2D에선 마법진이 종이 위에 평면적으로 떠 있었다. 3D에선 반투명한 오렌지빛 이펙트 파츠로 재현됐고, 마법서에서 살짝 떠오른 듯한 각도로 배치됐다. 이것은 단순한 묘사 수준을 넘어 '시선 유도 + 주제 강조'라는 시각적 중심을 잡아주는 장치다.
예를 들어 '마법 도서관'이라는 표현은 단지 배경이 아닌, 관객의 시선을 이끄는 무대로 기능한다.'책, 연금술 도구, 촛불'은 디테일처럼 보이지만, 이는 실제로 이 캐릭터가 어떤 세계에 살고 있는지를 감각적으로 설명하는 도구가 된다.
2D는 장면을 보여준다. 하지만 3D는 "그 순간, 그 자세, 그 감정"을 응축해서 고정시킨다. GPT에게 설계한 구성은 단순한 그림으로 끝나지 않는다. 형태를 만들고, 감정을 담고, 서사를 입히고, 결국 입체적 조형으로 구체화되는 창작의 한 흐름이 된다.
그리고 GPT는 거듭 강조했다. 지금 우리가 만든 이 피규어 구조는, 단순한 조형에 그치지 않는다. GPT가 설계한 '포즈, 표정, 배경'이라는 요소는 그대로 AR 캐릭터 인터랙션, 게임 속 3D 모델링 자산으로도 확장될 수 있다고 GPT는 설명했다.
GPT는 한 장의 이미지로 '움직임이 느껴지는' 장면 — 즉, 모션 포즈나 스킬 연출의 순간 장면은 아주 구체적으로 만들 수 있다고 했다. 앞에 형성된 3D 이미지를 기반으로 마법 시전 순간의 스냅샷 이미지 (예: 에너지 구체 날리는 장면, 땅에서 빛나는 마법진)로 만들 수 있다는 것이다.
GPT가 제안한 예시 둘 중 엘라린이 에너지 구체를 날리는 스킬을 쓰는 장면을 3D로 요청했다.
이번 챕터는 애니메이션과 3D 비주얼 구조를 다루는 만큼, 비전공자 입장에서는 특히 난이도가 높게 느껴졌다. GPT가 자세히 안내해주긴 했지만, 용어 자체에 익숙하지 않거나 '움직임'을 언어로 설계하는 감각이 낯선 경우에는 따라가기가 쉽지 않다. 또한 GPT를 활용한 3D 이미지 생성 실험은 기술적으로는 분명 가능하지만, 매우 많은 시간이 소요되는 작업이기도 했다.
이미지가 한 장 만들어지는 데만 수 분씩 걸리는 경우도 많다. 세부 구성에 대해 반복적으로 요청하거나 수정해야할 경우 그만큼 기다리는 시간도 누적된다.
결론적으로 이번 실험은 다음 두가지 사실을 함께 보여줬다.
비전공자가 이 같은 것을 다루기에는 아직 장벽이 존재하며, GPT의 설명을 통해 이해하는 데도 약간의 배경지식이나 시각적 감각이 함께 요구되는 챕터였다. 애니메이션과 3D 구조에 익숙하지 않은 사람에게는 '움직임을 언어로 설계하는 일' 자체가 낯설 수 있다.
하지만 바로 그렇기 때문에, 이 실험은 GPT의 한계가 아니라 '어디까지 가능한가'를 탐색하는 실험이었다.
GPT는 텍스트 기반 생성 도구이기 때문에, 이미지 자체를 직접 생성하거나 고품질 시각 자산을 만드는 데에는 한계가 있다. 따라서 피규어 스타일 캐릭터나 게임 일러스트처럼 정교한 비주얼 작업이 필요한 경우, 전문 이미지 생성 AI 툴을 함께 활용하는 것이 훨씬 효율적이다. GPT가 제안하는 최적의 구조는, GPT로 '구성'을 설계하고, 다른 이미지 툴을 통해 그 구성을 '시각화'하는 방식이다.
7화 'GPT 로고 만들기'로 넘어가기 전 번외 편으로 대표 이미지 생성 AI 툴들을 소개하고, 각 툴의 실제 서비스 특성과 장단점을 정리해보겠다.
#GPT실험실 #프롬프트설계 #AI활용법 #GPT사용법 #인공지능 #AI실험 #언어설계 #조건입력 #AI시뮬레이션 #메타인지 #AI브랜딩 #프롬프트엔지니어링 #디지털사고 #AI실험노트 #창의적AI #AI철학 #GPT와나 #AI