제미나이의 혁신이 놀라운 이유
제2의 지브리 열풍이 부는 듯하다.
SNS에 구글의 인공지능 제미나이(Gemini)가 만든 연예인 풍의 프로필 사진이 넘쳐나고 있다. 카톡 프로필을 제미나이가 만든 프로필 사진으로 바꾼 사람들도 보인다. (나 포함) 마치 챗GPT를 통해 지브리 풍의 프사를 만들던 열풍을 보는 것만 같다.
제미나이를 통해 연예인이 찍을 법한 프로필 사진을 만드는 방법은 아주 간단하다.
먼저 제미나이에 접속한다. 웹으로도, 앱으로도 가능하다. 그리고 나의 프로필 사진을 업로드한 후, 아래와 같이 프롬프트를 작성한다. 제미나이의 버전은 2.5 플래시로 하면 되며, 아래 프롬프트 창에 이미지 기능을 반드시 켜줘야 한다.
AI로 연예인 프로필 사진을 만드는 제미나이용 프롬프트는 <AI Matters>에서 정리한 아래 기사에 아주 자세히 나와있다. 나 역시 그중 하나를 차용하였다. 아래 링크에서 입맛에 맞는 연예인 프로필 사진 만들기 프롬프트를 가져다 쓰면 된다.
과연 결과는 어땠을까?
아래에 아주 기괴한 사진을 볼 수 있으니 주의 바랍니다!!
왼쪽의 사진은 위 프롬프트를 그대로 실행했을 때이다. 검은색 터틀넥이 마음에 들지 않아 옷만 바꿔달라고 요청해 보았다. 옷을 바꾸는 김에 옆머리에 스크래치를 내고 꽁지머리도 길러달라고 요청을 했다. 그러니 오른쪽과 같은 결과가 나왔다.
일반 사진만 있으면 누구나 배우 프로필 사진 한 장을 뚝딱 만드는 시대가 열린 것이다!!
SNS에 넘쳐나는 제미나이가 만든 연예인풍의 프로필 사진을 보면 자연스레 지브리풍 프로필 사진 열풍이 떠오른다. 평범한 셀카 한 장을 올리면 순식간에 지브리 애니메이션의 한 장면으로 바꿔주는 AI 기술. 챗GPT를 통해 지브리풍 이미지 생성이 가능한 것을 알게 되자 전 세계가 난리가 났다. 출시 일주일 만에 1억 3천만 명이 7억 장의 이미지를 생생했을 정도였다.
지브리 열풍이 식은 후 새로운 놀이가 등장했다.
'나노바나나'라는 장난스러운 코드명으로 불리던 이 AI는 사진을 정교한 3D 피규어처럼 만들어주는 놀라운 능력을 가지고 있었다. 손흥민 선수 사진을 넣고 "피규어로 만들어줘"라는 프롬프트를 넣으면 귀여운 피규어가 뚝딱 만들어졌다. 나 역시 우리 아이 사진을 나노바나나를 통해 피규어 이미지로 만들어 카톡 프사에 걸어둔 바 있다. 지인들은 이를 보고 실제로 피규어를 만든 것이냐며 물어볼 정도로, 나노바나나의 성능은 대단했다.
처음엔 정체불명의 신생 모델로만 알려졌지만, 곧 구글의 '제미나이 2.5 플래시 이미지'라는 사실이 밝혀졌다. 하지만 피규어 이미지 생성은 제2의 지브리까지 가지는 못했다. 피규어 이미지가 SNS에 넘쳐났긴 했지만, 본인 사진을 피규어로 바꾼 결과는 다른 사람에게 보이기는 조금 부끄러웠다.
지브리풍 이미지는 현실을 미화했기에 남들에게 보여주기 좋았지만, 피규어 이미지는 자신의 모습을 그대로 압축한 형태로 나오기에 뭔가 기괴하고 어색했기 때문이다. 결국 '미화'라는 측면에서 부족한 결과를 보인 피규어 이미지 생성 열풍은 금방 끝나고 말았다.
그리고 다시 시작된 제미나이 열풍, "연예인 화보 느낌 프로필 사진" 만들기.
이는 피규어보다 더 유행할 것으로 보인다. 자신을 살짝 미화한 프로필 사진이 나오기 때문이다. 적절한 피부 보정과 조명 효과로 한층 돋보이게 만들어준 AI 프로필 이미지의 등장. 거기에 평소 시도할 엄두도 못 내었던 패션이나 헤어 스타일도 바로 적용 가능하다. 이에 많은 이들이 앞다투어 결과물을 SNS에 올리며 새로운 밈(meme)처럼 즐기는 추세다.
밈으로만 즐기기에는 제미나이의 능력이 정말 놀랍다. 특히 가장 놀라운 기술적 혁신은 바로 맥락(context)을 기억한다는 것이다. 기존 AI들은 편집할 때마다 얼굴이 미묘하게 달라지거나, 옷 색깔만 바꾸려다 엉뚱하게 얼굴까지 변형되는 문제가 있었다. 하지만 제미나이는 달랐다. 배경을 바꾸든, 의상을 갈아입히든, 원본 인물의 얼굴과 체형은 그대로 유지한다.
운동복 차림 사진을 올리고 서울숲에서 조깅하는 모습으로 바꿔달라고 지시하면 포즈는 바뀌어도 그 사람임을 알아볼 수 있는 자연스러운 합성 사진이 나온다. 두 장의 사진을 합쳐서 전혀 새로운 장면을 만드는 것도 가능하다.
예전 같으면 포토샵으로 몇 시간씩 '누끼'따고, 레이어 겹치고 난리를 쳐야 했을 작업이 이제는 자연어 한 줄로 끝난다. 이제 포토샵을 배울 필요가 있을까?
결국 이는 AI가 '장기 기억'을 가지게 되었다는 것을 의미한다.
기존 생성형 AI는 기억력이 형편없었다. 오래 지속되는 작업을 하면 앞선 지시들을 까먹고 엉뚱한 결과를 내놓곤 했다. 하지만 제미나이 2.5는 이 한계를 완전히 뛰어넘었다. 무려 100만 개의 토큰을 한 번에 처리할 수 있다. 이는 기존 모델의 수백 배 수준이다. 이게 가능한 이유는 'MOE(Mixture of Experts)'라는 특수한 구조 덕분이다. 필요한 부분만 선택적으로 활성화해서 엄청난 양의 정보를 효율적으로 처리한다.
더 중요한 건, 텍스트와 이미지를 하나의 통합된 맥락으로 이해한다는 점이다. 예전 AI들은 언어 모델과 이미지 생성기를 억지로 붙여놓은 수준이었다면, 제미나이는 처음부터 멀티모달로 설계됐다. 그래서 "아까 그린 그림에서 꽁지머리를 넣어줘"라고 하면, 정말로 아까 그린 그림을 기억하고 꽁지머리만 추가하게 된다.
물론 이런 강력한 기능에는 어두운 면도 있다. 누구나 손쉽게 사실 같은 합성 이미지를 만들 수 있게 되면서 딥페이크 악용 우려가 커지고 있다. 구글도 이를 의식해서인지 유명인 얼굴 사진 생성을 제한하고, 모든 AI 이미지에 워터마크를 넣는 등 안전장치를 마련했다. 기술의 무한한 가능성만큼이나 윤리적 논의도 중요해진 시점이다.
초현실적이던 AI 이미지 생성 기술이 이제는 우리의 일상적인 놀이 문화로 자리 잡았다. 지브리풍 프사에서 시작해 피규어 사진, 화보 프로필까지. 전문 디자이너의 영역이었던 작업들이 일반 대중에게 개방되고 있다. 기술은 도구일 뿐이다. 어떻게 활용하느냐에 따라 그 가치가 결정된다. 지브리 주인공도, 피규어도, 영화배우도 될 수 있는 이 멋진 도구를 현명하게 활용한다면, 우리의 디지털 생활은 더욱 풍부하고 창의적으로 변모할 것이다.