brunch
매거진 오늘도 AI

이게 진짜 되네? 일관된 AI 이미지 생성!

안 쓰면 손해 보는 Gemini 2.0 Flash - 뮹작가

by WAVV

읽기 전에,


✅ 이 글은 이런 분께 추천해요:

Google Gemini 2.0 Flash의 핵심 기능을 빠르게 알고 싶은 분

퀄리티 좋은 AI 이미지를 생성하는 프롬프트 팁을 알고 싶은 분

AI를 재미있게 활용하는 사례가 궁금한 분




AI로 이미지를 만들어 본 경험 있으신가요? 원하는 대로 안 나오거나 캐릭터 얼굴이 계속 바뀌어서 답답했던 경험, 저도 많았습니다(ㅎㅎ). 특히 연속된 이미지를 만드는 건 정말 어려웠는데요. 이런 고민을 해결해 줄 최신 AI 모델이 나왔습니다. 바로 구글이 최근 선보인 Gemini 2.0 Flash입니다!


(이미지 출처: Google)


✨ Gemini 2.0 Flash, 도대체 뭐가 다른 거야?


Gemini 2.0 Flash의 가장 큰 특징은 "정확하고 일관된 이미지 생성" 능력입니다. 텍스트로 원하는 이미지를 간단히 설명하거나 기존 이미지를 손쉽게 편집할 수 있어요. 무엇보다 중요한 건 여러 이미지를 연속적으로 만들 때도 캐릭터나 배경, 스타일이 끝까지 일관되게 유지된다는 점이에요!


특히, Gemini Flash는 단순한 이미지 생성 그 이상입니다. AI가 이미지를 통해 스토리를 이해하고 시각적 이야기를 구현할 수 있도록 도와주니까요. (흥분!!)



기억력 장착한 AI 등장


Gemini 2.0 Flash는 한번 생성한 캐릭터나 장면을 끝까지 기억하고 유지하는 놀라운 능력을 보여줍니다.

기존의 AI는 각 프롬프트마다 따로 놀다 보니, 같은 캐릭터라도 얼굴이나 스타일이 매번 달라졌어요. 하지만 Gemini 2.0 Flash는 텍스트 이해부터 이미지 생성까지 한 모델 안에서 이루어지기 때문에, 이미지 시리즈를 만들 때도 처음 설정된 캐릭터가 변하지 않고 계속 유지됩니다.


예를 들어, 첫 번째 이미지에서 주인공이 빨간 모자를 썼다면 다음 이미지에서도 동일한 빨간 모자 주인공을 볼 수 있어요.


텍스트와 이미지가 따로 노는 게 아니라 '한 뇌'로 생각하는 거죠.

실제로 Gemini 2.0 Flash Experimental은 이미지 한 장을 평균 4초 만에 만들어낼 정도로 빠르답니다!


✅ 핵심 요약!
- 빠른 속도 (DALL-E 3보다 빠름)
- 이미지 품질 유지 및 향상


Gemini 2.0 Flash 사용법

1️⃣ Google AI Studio에 접속해 모델을 Gemini 2.0 Flash Experimental로 설정합니다. 2️⃣ 출력 형식을 'image and text'로 바꿔줍니다. 3️⃣ 이미지를 업로드하거나 원하는 편집 내용을 자연어로 입력하면 끝!



✅ 실제로 써본 이미지 생성 팁 5가지


1. 스토리텔링에 딱!


Gemini Flash는 일회성 일러스트에 그치지 않고, 연관된 이미지 시리즈를 생성하여 시각적 이야기를 만들 수 있어요. 사용자는 AI에게 특정 스토리를 요청하고, 각 장면별로 이미지를 생성하도록 지시할 수 있으며, 생성된 스토리의 특정 부분을 수정하면 해당 이미지도 함께 재생성되어 일관성 있는 결과물을 얻을 수 있습니다.


나의 반려동물이나 자녀가 주인공인 동화책도 쉽게 만들 수 있답니다. 예를 들어, “영웅적인 아기 고양이가 요정 여왕을 악한 마법사로부터 보호하는 이야기”를 3D 만화 스타일로 요청하고, 각 장면에 대한 이미지를 생성하도록 할 수 있어요.




2. 구체적으로 말할수록 더 예쁜 이미지


Gemini Flash는 구체적인 프롬프트에 더 잘 반응하며, 세부사항을 많이 제공할수록 이미지의 품질이 향상됩니다. “비 오는 날, 카페에서 커피를 마시는 사람”보다는 “비 오는 날 오후, 창밖 빗방울을 바라보며 커피와 노트북이 놓인 테이블에 앉은 여성”처럼 더 구체적일수록 멋진 이미지가 탄생해요.



3. 대화형 피드백으로 완벽하게


이미지가 마음에 안 들면 피드백을 바로바로 줄 수 있어요. 색상 변경, 캐릭터 추가, 조명 조정 등 다양한 편집 요청을 AI에게 직접 요청할 수 있어 결과물이 상상한 것과 가깝게 생성돼요.


예를 들어, “푸른 바다가 보이는 테라스, 화분이 가득한 정원, 편안한 라탄 의자가 놓인 여유로운 공간”을 요청한 후, “노을 지는 하늘로 분위기를 바꿔 줘”, “의자 옆 탁자에 커피 한 잔과 책을 추가해 줘”, “전체적으로 지중해 스타일을 더 강조해 줘”와 같이 연속적인 요청을 통해 이미지를 개선할 수 있어요.


티키타카 대화하며 수정할 수 있습니다. 근데 배경이 약간 아쉽게 바뀌었네요 ㅎㅎ



4. 역사적 사실도 정확히 구현


Gemini Flash는 역사적 맥락과 디테일까지 정확히 구현합니다. 실제 역사적 지식을 활용하여 역사적으로 정확한 이미지를 생성할 수 있으며, 현실적인 문화적 디테일과 사실에 부합하는 이미지를 제공합니다.


예를 들어, “조선시대 장군”과 같이 일반적인 요청 대신 “16세기 조선 중기의 장군, 정교하게 수 놓인 갑옷, 호랑이 문양이 새겨진 전통 투구 착용, 붉은 깃발을 든 모습”과 같이 구체적인 정보를 제공하면 더욱 정확한 이미지를 얻을 수 있어요.



5. 이미지 속 텍스트까지!


Gemini Flash는 이미지 내에 텍스트를 깔끔하게 통합하여 빠르게 생성해 줘요.


이미지에 원하는 텍스트만 추가 가능합니다. 덤으로 머리 장식도 만들어주었네요.



마치며,


보기만 해도 재미있는 Gemini 2.0 Flash의 새 기능,
현재 Google AI Studio에서 무료로 체험해 볼 수 있습니다.


일관된 이미지 생성이라는 강력한 도구를 손에 넣은 만큼, 이제 해보고 싶었던 아이디어들을 마음껏 시도해 보세요. 직접 AI에게 이야기를 들려주며 그림책을 만들어 보기도 하고, 우리 집 반려동물을 주인공 삼아 모험 일지를 꾸며보는 건 어떨까요? 특별한 개인적인 선물을 만들고 싶어 하는 분께도 추천드려요! ✨





keyword
매거진의 이전글'MBTI F형'이 된 GPT-4.5 근황