brunch

구글 Nano Banana 2가 깨뜨린 벽

AI의 조용한 진화

by 들여쓰기


구글이 드디어 Nano Banana 2를 공개했습니다. 얼핏 보면 이전 버전과 크게 달라 보이지 않지만, 발표 이후의 반응은 예상보다 훨씬 뜨겁습니다. 도대체 어떤 변화가 있었기에 이렇게까지 관심이 쏠리는 걸까요? 오늘은 Nano Banana 2가 특히 주목받는 이유와 함께, 이번 업데이트를 통해 Nano Banana 2가 기존 Nano Banana 보다 얼마나 진화하였는지 차근차근 짚어보도록 하겠습니다.


Frame 1422235528 (13).png




AI로 그리기 어려운 ‘꽉 찬 와인잔’

이미지 생성형 AI를 통해 그동안 유독 생성하기 어려웠던 이미지가 바로 ‘꽉 찬 와인잔’입니다. 생각에는 단순해 보이지만, 현실의 와인잔은 굴절, 반사, 표면 장력, 유리 두께와 같은 물리적·광학적 요소가 아주 정교하게 맞물려야 비로소 자연스럽게 보이기 때문이죠. 인간이라면 이런 요소들을 무의식적으로 인지하지만, AI에게는 이 복잡한 조합을 이해하고 구현하는 일이 쉽지 않았습니다. 대부분의 기존 모델들은 ‘잔의 형태를 그리고 그 안을 붉은색 액체로 채운다.’는 식의 단순한 패턴 조합 방식에 의존해 왔기 때문에, 와인이 반만 차 있거나 굴절이 엉뚱하게 표현되는 등 어색한 결과가 반복되었습니다. 게다가 고품질의 ‘꽉 찬 와인잔’ 이미지 자체가 훈련 데이터에 충분히 존재하지 않았기 때문에(현실에서 와인잔을 꽉 채우는 사람은 없으니...), AI는 애초에 제대로 학습할 기반이 없었습니다. 이처럼 ‘꽉 찬 와인잔’은 단순한 사물 묘사가 아니라, AI가 현실 세계의 물리 규칙을 제대로 이해하지 못하면 결코 표현할 수 없는 대표적인 난제였습니다. 그래서 이미지 생성 AI의 발전 수준을 가늠할 때 ‘꽉 찬 와인잔’은 늘 시험대처럼 여겨져 왔고, 많은 AI 모델들은 이 벽을 넘지 못하였습니다.




Nano Banana 2가 해냈다

그런데 Nano Banana 2는 이 문제를 해결했습니다. 기존 이미지 생성형 AI 모델들이 어려워하던 와인잔의 굴절·반사·표면 장력·액체 경계 같은 요소들이 Nano Banana 2에서는 자연스럽고 정교하게 표현됩니다. 마치 실제 카메라로 촬영한 것처럼 유리 내부에서 빛이 정확하게 휘고, 액체의 곡률이 미세하게 살아 있으며, 유리의 두께와 투명도의 표현도 현실성 있게 구현됩니다. 이는 단순히 디테일이 조금 좋아졌다는 수준의 변화가 아니라, AI가 ‘세상이 어떻게 작동하는지’에 대한 규칙을 조금 더 깊이 이해하기 시작했음을 보여주는 신호에 가깝습니다.


Gemini_Generated_Image_4k29wu4k29wu4k29.png Nano Banana 2로 그려 본 ‘꽉 찬 와인잔’




사소한 변화가 만든 큰 전환점

사실 와인잔 문제는 텍스트 정합성, 거울 반사, 손가락 표현 등 지금까지 AI가 자주 실수해 온 난제들과 같은 뿌리를 가지고 있습니다. 모두 AI의 물리·기하학적 이해 부족에서 비롯된 문제들이죠. Nano Banana 2가 보여준 변화는, 이러한 문제들이 단순한 오류가 아니라 AI가 현실 세계의 구조를 충분히 이해하지 못해 생긴 보다 본질적인 문제였음을 확인시켜 줍니다. 동시에 Nano Banana 2가 와인잔 표현을 자연스럽게 해결했다는 사실은, 앞으로 다른 물리 기반 문제들 역시 충분히 개선될 가능성이 있음을 시사합니다. 겉으로 보기엔 와인잔 하나를 제대로 표현한 것처럼 보이지만, 이 변화가 결코 사소하지 않다는 것이지요. AI의 발전은 늘 이런 방식으로 이루어져 왔습니다. 작은 결함 하나가 해결되며, 어느 순간 예상치 못한 도약을 만들어내는 방식으로요. Nano Banana 2가 보여준 정교한 물리 표현은 바로 그 조용한 변화의 순간을 알려주는 신호처럼 보입니다. 이제 AI는 단순히 ‘그럴듯한 그림을 생성하는 기술’에서 벗어나, ‘세상이 작동하는 원리’를 배우는 존재로 진화하고 있습니다.




새로운 가능성

Nano Banana 2의 사소하지만 큰 변화가 이제 보이기 시작하셨을까요? 겉으로는 단순한 품질 개선처럼 보이지만, 이번 업데이트는 AI가 그동안 어려워했던 물리적 일관성을 실제로 해결하기 시작했다는 점에서 의미가 큽니다. ‘꽉 찬 와인잔’처럼 복잡한 광학·물리 요소를 자연스럽게 표현했다는 사실은, 텍스트 정합성이나 반사, 손가락 표현 같은 다른 난제들까지 앞으로 개선될 가능성이 높다는 신호이기도 합니다. 아직 거대한 혁신이라고 말하긴 이르지만, 분명한 건 AI가 단순한 패턴 조합을 넘어서 점점 더 정교한 세계 모델을 구축해 나가고 있다는 점입니다. 앞으로 Nano Banana 2와 같은 모델들이 어떤 방식으로 발전해 갈지, 그리고 이런 작은 진전들이 어떤 새로운 가능성을 만들어낼지 기대해 볼만한 시점인 것 같네요.




그밖에

1. 이 글을 보고 Nano Banana 2의 성능과 활용 사례가 더 궁금해지셨다면, 아래 링크에서 Nano Banana 2의 다양한 활용 사례들을 직접 확인해 보세요!

https://github.com/muset-ai/awesome-nano-banana-pro?tab=readme-ov-file

image 9.png


2. Figma에서 이제 Gemini 3 Pro와 Nano Banana를 활용해 이미지를 바로 생성할 수 있게 되었습니다. 여러 이미지를 자연스럽게 합성하는 기능까지 지원되어, 더는 다른 툴로 옮겨 다닐 필요도 없어 보입니다. 이 기능은 유료 플랜 사용자부터 순차적으로 적용될 예정이니, 조금만 기다려주세요.

https://www.youtube.com/watch?v=XD3SoHHDeP4




keyword
작가의 이전글AI, 실험을 넘어 확장으로