AI로 만드는 캐릭터 인터랙션

구글 Gemini의 나노 바나나 전격 활용기

by 조이엄

인사이트

- 일관성 유지에 탁월한 신규 이미지 생성 모델, '나노 바나나'가 탑재된 구글의 Gemini가 이미지 생성 판도를 바꾸고 있습니다.

- 어제는 불가능했던 것이 오늘은 가능해지고 있습니다. 다양한 AI 툴은 각자 특화된 기능을 가지고 있습니다.

- 여러 AI를 조합해 원하는 결과물을 만들어낼 수 있는 창의력과 문제 해결능력이 중요해질 것입니다.

1) 캐릭터 생성에는 레퍼런스를 잘 참조해 높은 퀄리티를 만들어낼 때는 미드저니

2) 일관성을 유지한 채 이미지에 원하는 것을 추가하거나 변형할 때는 Gemini

3) 이미지의 크기 변경을 위해 배경을 새로 생성하거나 특정 요소만 제거할 때는 포토샵 생성형 AI




들어가며

쓰레기통에 눈을 달았을 뿐인데, 길거리에 버리는 쓰레기가 줄어들었다는 사실 들어보셨나요? 사람들은 눈이 달려 있는 무언가를 보고 친근함을 느낀답니다. 다양한 서비스에서 캐릭터를 활용한 브랜딩을 하는 이유입니다.


저는 저가항공 중 제주항공을 자주 이용하는데, 생각해보면 제주항공 로고에 눈과 코가 달려서 그런게 아닐까? 싶은 생각이 들더군요ㅎㅎ 마찬가지로 그래서 다른 저가항공이 캐릭터 콜라보레이션을 자주 하는 것 같습니다.

_HyQvNuSFdbc_veEXyrHBXwwxzkY764w8s38jAWz-HzKShr2Rz4hZzCdvQB_VLhXDGAknlX9ZSTs7QV7tHghMA.webp
banner_airplane_pickachu02.png



실무 활용 과정

최근 한 학습 어플에 캐릭터 활용을 제안했습니다. 캐릭터가 공부를 독려하는 세계관이라면? 하는 아이디어가 떠올랐거든요!


우선, 미드저니를 통해 필요한 캐릭터를 생성했습니다. 박사님 같은 중후한 느낌의 캐릭터가 필요했기에 레퍼런스를 찾아 여러 가지를 시도해가며 마음에 드는 이미지를 뽑았습니다. 그 후 구글 Gemini를 통해 인물의 고유한 특성을 유지하면서 표정만 변하게 해 달라고 요청했습니다.

시장님.png
스크린샷 2025-09-04 오전 12.30.39.png
미드저니로 만든 이미지(좌), 구글 Gemini에 이미지 일관성을 유지하며 표정을 변화하는 모습(우)


구글 Gemini는 이미지 생성 씬에서 최근 가장 핫한 서비스입니다. 이미지를 생성하고 활용할 때 가장 어려운 점이 바로 이미지의 일관성을 유지하는 것인데요, 어느 날 '나노 바나나'라는 익명의 프로그램이 전례 없던 일관성 유지 능력으로 큰 관심을 받았습니다. 이 '나노 바나나'가 바로 구글이 만든 프로그램이었고 현재 Gemini에서 서비스 되고 있는 이미지 생성 모델입니다.


**프롬프트는 아티클 'How to prompt Gemini 2.5 Flash Image Generation for the best results'를 참고했습니다.



그 결과 놀라울 정도로 일관성을 유지하며 요청한 부분에 대해서만 바뀐 이미지를 받아볼 수 있었습니다.

Gemini_Generated_Image_l95znxl95znxl95z.png
Gemini_Generated_Image_4nl1uf4nl1uf4nl1.png


진행을 하면서 캐릭터에게 다양한 포즈를 요청하다보니 기존과 조금씩 다른 부분이 생기기도 했는데요. 예를 들어 기존의 캐릭터는 손가락이 없고 팔이 굉장히 짧지만, 양 손을 들고 춤을 추거나, 엄지 척을 한 포즈 등을 요청하다보니 캐릭터에게 손가락이 생기고 팔 다리의 길이가 조금씩 늘어나는 모습을 볼 수 있었습니다.


점프.png
정면.png
포즈를 요청하던 중 손가락이 생긴 최초의 이미지(좌), 이를 기본으로 두고 다양한 포즈와 표정 변화 요청(우)


이번에는 다양한 포즈를 시도해보려고 했기에, 손가락이 생긴 캐릭터를 기본으로 하여 다시 다양한 포즈를 만들어갔습니다. 이미지를 만들면서 머리카락이 잘린 채 형성된 경우도 있었는데요. 그 경우에는 포토샵의 생성형 만들기를 통해서 잘린 이미지 부분을 생성하거나, 필요 시 세부적인 부분을 다듬었습니다.

스크린샷 2025-09-03 오후 4.14.21.png 포토샵으로 잘린 머리 부분 생성형 늘리기



결과물

그렇게 해서 만들어진 결과물입니다. 결과물은 피그마나 포토샵을 통해 '배경 제거'를 진행했습니다.

스크린샷 2025-09-03 오후 10.15.11.png


이제 이 캐릭터를 활용해서 레이아웃에 얹어 여러 작업을 해 보려고 합니다.


이렇게 만든 캐릭터는 영상 AI를 활용해 영상화를 할 수도 있습니다. Kling ai를 통해 시범적으로 만들어 본 영상입니다.



나가며

기존에 이런 캐릭터를 만들기 위해서는 블렌더 같은 툴을 배우고, 직접 캐릭터에 관절을 넣어 리깅(움직이게 하는 작업)을 해야 했습니다. 그리고 그 툴을 배우기까지 시간과 노동량이 매우 많이 들어갔습니다.


AI의 발전으로 퀄리티 높은 작화나 캐릭터 생성은 가능해졌지만 일관성을 유지하는 건 매우 어려웠습니다. Comfy UI같은 툴을 배울 수도 있었지만, 이 역시 진입장벽이 높았습니다.


AI가 정말 빠르게 발전하고 있습니다. 몇 달 전까지 하지 못했던 것을 이제는 할 수 있게 되었습니다. 변화의 속도가 빠른 가운데, 각 AI 툴은 특화된 기능이 다르기 때문에 필요한 것은 여러 AI를 조합해 원하는 결과물을 만들어낼 수 있는 창의력과 문제 해결능력이라는 생각이 듭니다.

keyword
이전 10화UX기획자가 나만 알고 싶은 AI 서비스