brunch

라이킷 11 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 박영민 Jul 03. 2024

Gen-3 Alpha - Preview

Gen-3 영상생성 테스트

드디어 어제(202.7.2), 예상보다 빠르게 GEN-3 알파 서비스가 오픈 되었습니다.

그간 생성형 AI 영상 부문의 대표 주자였던 Runaway의 Gen-2로도 다양한 영상을 만들 수는 있었으나 광고 영상(상업적)으로 활용하기에는 AI 맛이 너무 나는 어딘가 부족한 부분이 많았으나(사실 그럼에도 대단한 기술이긴 하나) 올 해 2월 OpenAI에서 Sora를 발표하면서 생성형 AI로 생성한 실사 영상의 충격과 기대감을 동시에 가져다 주었었습니다. - OpenAI Sora Page

이 후 Raunway도 6월에 GEN-3를 발표하면서-Gen-3 Page Sora와 유사한 실사 영상 퀄리티를 선보이며 역시 기대감을 주었습니다. 그랬던 GEN-3가 예상보다 빠르게 오늘 알파버전을 발표해 설레는 마음으로 바로 사용해 보았습니다. (GEN-3의 서비스 발표로 Sora도 속도를 내지 않을까 싶습니다만)

# Gen-3 demo video

https://youtu.be/nByslCkykj8

Gen-3에서 제시한 알파 프롬프트 가이드를 참고하여 여러 영상들을 생성해 보았습니다.

#1

프롬프트에 여러 요소를 삽입하긴 했습니다만, 간단하게 말하면 '도시를 걷는 패셔너블한 한국 여성'을 생성해 달라는 것이었습니다. 이번 버전까지의 인물 표현시 가장 문제였던 얼굴 변형이 일어나지 않아 다행이라 생각했습니다만, 실사 느낌이 나지 않았습니다.

Prompt

Low angle tracking shot: A Korean woman with long, straight black hair walks confidently through a bustling city street. She is wearing a stylish short outfit, complemented by high heels. The city's modern architecture and neon lights create a vibrant backdrop, with pedestrians and vehicles moving around her. The lighting is diffused, emphasizing her fashionable look while capturing the dynamic energy of the urban environment.

프롬프트를 일부 조정해 다시 생성해 보았습니다.

Prompt

Fashion Photography, Urban street scene with skyscrapers and bustling crowd, A fashionable woman smiling as she walks confidently, Golden hour lighting, Slow motion, Tracking shot, Modern and chic style

역시 실사 느낌은 나지 않았습니다. (제가 프롬프팅을 잘 못 했을 수도 있습니다.) 그래도 예전 버전에 비해 크게 얼굴 변형 없이 많이 자연스러워 졌습니다.

#2

향 후 광고 영상 생성이 목표라 테스트 차원에서 화장품 광고 영상 포커스로 프롬프트를 작성해 보았습니다.

이번에는 프롬프트를 클로즈 업으로 잡았더니 모션은 조금 어색해도 기대 이상으로 얼굴이 실사 느낌으로 나와 다소 놀라웠습니다.

(사실 제품 중심으로 클로즈업 하자고 했으나 사람이 중심이 된)

Prompt

Close-up shots, product-focused, showcasing the cosmetics in use, vibrant colors and smiling faces, bright and cheerful atmosphere, soft diffused lighting, smooth and steady movements, uplifting and modern style, no text

프롬프트를 수정해 다른 스타일로 수정해 보았습니다.

Prompt

Close-up, beautiful Korean woman's face among lush greenery, vibrant makeup highlights, natural and elegant look, soft and diffused lighting, slow motion, subtle and gentle movement, fresh and serene aesthetic

이번에는 얼굴을 대상으로 클로즈업 했더니 놀라울 정도로 실사에 가깝게 생성되었습니다. 웃고 나서 생김새가 조금 달라지기는 하나 배경도 자연스럽고 어색함 없이 잘 생성된 듯 합니다.

#3

산 정상을 기준으로 360도 샷을 찍어 보고싶어 생성해 보았습니다. 와이드 앵글과 360도 샷 느낌은 좋은 정상에 서 있는 사람 느낌이 다소 아쉽습니다.

Prompt

Wide-angle lens, panoramic shot of a man standing atop a majestic mountain, snow-capped peaks in the background, clouds drifting by below the horizon, golden sunlight illuminating the scene, steady and slow rotation, capturing the full 360-degree view, ultra-realistic and dramatic style.

#4

빠른 스피드로 하늘에서 도시로 진입해 달리는 1인칭 시점의 영상을 생성해 보고자 했습니다. (5초 기준으로 생성하다 보니 진입하면서 영상은 끝난) 원하는 방식으로 연출?은 잘 되었으나 디테일과 사실감이 좀 떨어지긴 합니다.

Prompt

Aerial view, entering a bustling city from the sky with cars running on the roads, tall skyscrapers and bright billboards, daytime, bright sunlight, hyperspeed, first-person perspective, futuristic cyberpunk aesthetic

#5

우주를 빠른 속도로 날아가는 영상을 생성해 보았습니다. soso,

Prompt

Wide Angle, flying through space at hyperspeed from a first-person perspective, stars and cosmic dust zooming past at incredible speed, creating streaks of light and colors, bright and vivid lighting, ultra-realistic visuals, rapid acceleration, smooth gliding movements, sleek and futuristic aesthetic

#6

이번에는 영화 느낌을 살려 보고자 호러 또는 스릴러 영화의 한 장면을 생성해 보았습니다. 촬영기법이나 캐릭터의 흐트러짐 없이 기대 이상으로 잘 생성 되었습니다.

Prompt

Wide-angle shot, dark forest at night, a woman walking alone, fog creeping through the trees, eyes glinting in the darkness, low-key lighting, slow and tense movements, eerie and suspenseful style, no text

#7

마지막으로 저의 바램인 하늘을 나는 남자의 모습을 생성해 보았습니다. 카메라 앵글은 좋으나 디테일이 아직은 부족한 느낌입니다.

Prompt

Low angle, Establishing wide shot of a person soaring through the sky with the cityscape below, The person is dressed in a sleek, futuristic suit with glowing accents, Silhouette lighting, Dynamic motion, Ascends gracefully, Cinematic

기다렸고, 기대했었기에 다양한 형태로 시도하며 영상을 생성해 보았습니다.

전반적인 느낌은 솔직히 기대했던 만큼 '와우'까지는 아니어도(Sora를 보고 기대감이 너무 높아졌을수도) 사실적인 얼굴을 확인할 수 있었던 것과 프롬프팅이 전보다 원하는 방향으로 잘 생성되는 것을 보며 좋았습니다. 무엇보다도 인물에 있어 가장 큰 문제였던 얼굴 변형이 확실하게 줄어든 것이 가장 좋았습니다.

알파 버전이라 아직 정교함이 떨어질지는 몰라도 프롬프트를 잘 찾으면 현재 버전 안에서도 퀄리티 있는 영상을 뽑아 볼 수 있겠다는 생각도 해 봅니다.

단, 그렇다고 영상을 마구 시도해 보기에는 영상 한 번 생성하는데 비용이 다소 비쌉니다.

Standard 구독료가 월 $12 입니다.(년간 구독시) 현재 환율로 보면 약 16,000원 입니다. 16,000원이면 625 credit을 매월 리셋(누적X)해 줍니다.

Gen-3 영상 생성에 드는 크레딧은 5초 = 50 credit / 10초 = 100 credit 입니다. 즉 나누어 보면 월 단위 받은 크레딧으로 5초 영상은 12개 생성할 수 있으며, 10초 영상은 6개 생성할 수 있습니다. 가격으로 환산하면, 5초 영상 1개 생성 비용 = 1,280원 / 10초 영상 1개 생성 비용 = 2,560원이 됩니다. 이해는 되지만 부담이 되는 가격인 것은 맞습니다.

전 오늘 광고 영상으로 만들어 낼 수 있는 퀄리티가 될 지 확인차, 또 포스팅을 위해 7개의 영상을 생성했으니 여러분들께 보여드린 영상만 8,960원 어치가 됩니다. (사실 날려 먹은 2개까지 합치면 11,520원인 ㅠ)

그래서 Gen-3 에서 그나마 헛발질 수를 줄여주기 위해 간략하게라도 프롬프트 가이드를 제시한 듯 합니다.

영상 하나 생성에도 프롬프트를 시험적으로 마구 날려 볼 수는 없는 노릇이니 Gen-3에서 제시한 가이드를 참고로 Gen-3 프롬프트를 생성해주는 GPTs를 만들어 공유 드리도록 하겠습니다.

Gen-3 Preview 였습니다.

더 많은 이야기는 링크를 클릭하시면 보실 수 있습니다. supermarketing.io