seedance 2.0 모델의 T2V 기능을 활용하는 방식입니다.
출시 전에도 뜨거운 관심을 받았던 씨댄스(seedance) 2.0 모델이 출시된 기념으로 씨댄스 2.0 모델을 사용하여 에어팟 맥스 광고를 제작해 봤습니다. 해당 모델은 한 번 사용하면 저의 기획 수준이 상당히 높아 보이게 만들어주는 효과가 있습니다.
Claude·ComfyUI·Freepik·Kling AI
이번에는 ComfyUI에서 씨댄스 2.0(seedance 2.0) T2V* 템플릿을 활용하여 에어팟 맥스 광고 영상을 제작했습니다. 먼저, 동영상을 생성할 텍스트 프롬프트가 필요합니다. 원하는 동영상을 만들기 위해 장문의 프롬프트를 작성해야 하는데 혼자서 다 작성하실 수 있다면 당신은 천재입니다. 하지만 저는 천재가 아니기 때문에 Claude나 chatGPT, Gemini 같은 텍스트 생성 인공지능을 활용하여 프롬프트를 생성해 보겠습니다. 저는 chatGPT에서 Claude로 전향한 지 이제 한 달이 되어가는 것 같네요. 둘 다 장단점이 있는데요. 글쓰기에서는 압도적으로 Claude가 앞선다는 것이 저의 생각입니다.
* T2V : Text to Video의 줄임말로 키워드, 문장만을 명령어로 입력하여 동영상을 생성해 주는 기술을 뜻합니다.
Claude에 참고할만한 이미지와 프롬프트(ComfyUI 템플릿에서 보여주고 있는 기본 프롬프트)를 함께 입력해서 씨댄스 2.0에 입력할 동영상 프롬프트를 요구하는데요. 이때, 정확하게 내가 원하는 내용이 무엇인지 목적을 뚜렷하게 적어주셔야 합니다.
저는 사람이 나오지 않고 카메라 워크만으로 만들 수 있는 모션 그래픽 영상을 원했고, 레퍼런스와 거의 동일한 톤 앤 매너를 원했습니다. 그래서 해당 내용과 함께 프롬프트 예시에 맞춰 광고영상을 만들 프롬프트를 요구했습니다. 처음으로 받은 프롬프트는 다음과 같습니다.
텍스트 프롬프트
[Style] Ultra-premium product motion graphics, 8K photorealistic CGI, Apple-grade minimalist commercial aesthetic, seamless camera choreography, studio-lit sculptural product visualization, Unreal Engine 5 rendering quality, invisible light sources, micro-texture detail emphasis, Swiss graphic design sensibility, zero human presence.
[Product note]
Apple AirPods Max in Silver — anodized aluminum ear cups with ultra-fine mesh headband, soft over-ear cushions in light grey knit fabric, polished chrome Digital Crown control, matte silver finish with subtle specular highlights. Object floating in zero-gravity space. No surface contact. No shadow grounding.
[Duration] 15 seconds.
[00:00–00:03] Shot 1 — Emergence
Camera: Extreme macro close-up, beginning in total white void. Slow pull-back reveal.
Action: From pure white emptiness, the mesh texture of the headband materializes first-individual fabric threads becoming visible before the full form resolves. The camera glides backward in a smooth arc, revealing the full product floating at a 3/4 angle.
Light: Single soft key light from upper-left. No fill. Specular highlight crawls slowly across the aluminum ear cup surface as camera moves.
Effect: The product assembles from light itself — a soft lens bloom collapses inward into the physical object, as if the headphones crystallized from ambient luminosity.
Background: pure white, completely neutral.
[00:03–00:07] Shot 2 — Orbit
Camera: Continuous 180° orbital rotation around the product, low angle rising to eye level. Steady, deliberate pace — not fast, not slow. Mechanical precision.
Action: Camera circles the AirPods Max in a single unbroken arc. As it passes the rear of the right ear cup, the polished chrome Digital Crown catches the key light and fires a brief, clean specular flare.
Light: As the camera orbits, the light relationship shifts — the mesh headband passes through soft shadow and re-emerges, revealing its woven geometry. The aluminum transitions from warm silver to cool grey and back.
Effect: Extremely subtle depth-of-field breathing — the leading edge of the product sharpens as camera approaches each face, background blurring slightly deeper. The product feels physically present, gravitationally real, despite floating.
[00:07–00:11] Shot 3 — Texture Study
Camera: Three rapid but fluid macro push-ins: ① mesh headband fabric ② ear cushion knit ③ Digital Crown chrome. Each cut is a clean hard cut, not a dissolve.
Action: Static product. Camera moves only. Each macro reveals a different material world — the woven mesh becomes an architectural grid, the knit cushion becomes a soft landscape, the chrome crown becomes a mirror holding the entire studio in miniature.
Light: Each macro has its own micro-lighting shift — warmer on the fabric shots, colder and harder on the chrome shot.
Effect: On the chrome Crown close-up, the reflection inside the metal shows a distorted, abstract version of the full product — product within product. One frame only, then cut.
[00:11–00:14] Shot 4 — Float & Inversion
Camera: Slow crane-down from above, settling into a centered front-facing wide shot. Product centered in frame. Background begins transitioning from white to deep black — not a cut, but a continuous tonal inversion, bleeding in from the edges of frame inward.
Action: The product remains perfectly still at center. The world around it changes. As the background darkens, the silver of the AirPods Max grows progressively more luminous — same object, same light, but now reading as a glowing artifact against the void.
Light: Lighting rig shifts almost imperceptibly — specular highlights intensify, fill light disappears entirely. The product becomes self-luminous in appearance.
Effect: The background reaches full black exactly as the camera settles. The AirPods Max now floats in absolute darkness, lit from no visible source, as if it generates its own light.
[00:14–00:15] Shot 5 — Logo Card
Camera: Static. Locked off. Product centered.
Action: The product holds its final float position. Then, from directly below it, the text —AirPods Max— rises upward in clean Apple SF Pro Display typeface. The text arrives in white. One word per beat: AirPods — then Max.
Effect: At the precise moment the full text settles, the product itself dims softly — not disappearing, but stepping back — allowing the typography to own the frame. A final, barely perceptible specular pulse runs across the aluminum surface once, like a slow exhale. Then: absolute stillness. Black background. White text. Product.
프롬프트의 핵심은 15초라는 길이 내에서 생성할 씬(shot)마다 시간을 지정해 주고, 카메라 워크, 핵심 내용, 효과, 조명까지 상세하게 작성해 주었다는 점입니다. 최근 생성형 AI로 업데이트된 멀티샷 기능을 제대로 활용할 수 있게 설계된 프롬프트입니다.
앞서 설명드린 대로 씨댄스 2.0 모델을 사용하여 동영상을 생성합니다.
저는 ComfyUI 최신 버전을 다운로드하여 씨댄스 2.0 모델의 T2V 템플릿을 사용했습니다.
가장 처음에 생성한 프롬프트를 입력하고 다른 옵션을 조정하여 생성하면 되는데요.
resolution은 720p로 설정했습니다. 모션 그래픽 특성상 720p로 최대한 방어할 수 있는 부분은 그대로 사용하고, 화질이 떨어지는 경우에는 업스케일해서 새로 영상을 생성할 생각이었습니다. duration은 최대로(15초) 설정했고, audio도 자동으로 생성해 주길 원했기 때문에 true로 설정했습니다. seed의 경우 랜덤으로 두고, watermark는 false로 생성되지 않게 설정했습니다.
결과물은 이렇게 나왔습니다.
상당히 마음에 드는 결과였어요. 사운드도 완벽했습니다.
한 번의 생성만으로 완성도가 높은 결과물이 나와서 만족했습니다.
화질이 상대적으로 떨어져 보이는 구간을 보완했습니다. 개선하고 싶은 샷의 가장 첫 번째 프레임을 캡처하고, 마지막 프레임을 캡처해서 Freepik에서 나노 바나나 2를 활용하여 업스케일했습니다. 저는 익스트림 클로즈업샷 위주로 디테일을 개선했어요. 어떤 작업인지는 다음 이미지를 보면 더욱 이해가 빠를 것 같습니다.
방법은 간단합니다. Freepik에서 캡처한 이미지를 불러오고
나노 바나나 2 모델, 비율, 해상도를 2K로 설정한 뒤 아래 프롬프트를 입력하면 됩니다.
프롬프트
업스케일(혹은 영어로 Upscale)
다음 이미지는 제가 Freepik에서 디테일을 개선한 과정을 캡처했습니다.
이미지의 형태를 바꾸지 않고 업스케일만 해주면 되는데, 간혹 이미지를 변형시켜 줄 때가 있는데요. 이럴 땐 왜 나만 안 되냐 당황하지 말고, [원본 이미지 그대로 유지], [업스케일만 해줘] 등으로 프롬프트에 이미지를 그대로 유지할 수 있는 명령어를 입력하면서 원하는 결과를 도출해 내시면 됩니다. 생성형 AI로 이미지를 만들다 보니 인내심이 길러지는 것 같습니다.
이제 Kling AI를 활용하여 시작 이미지와 끝 이미지에 디테일을 개선한 이미지들로 입력하여 동영상을 다시 생성해 주면 됩니다. 완전히 똑같은 동영상이 생성되진 않지만, 시작과 끝을 지정해 주었기 때문에 거의 흡사한 동영상을 결과로 확인할 수 있습니다. 동영상 프롬프트로는 아래 프롬프트를 섞어가며 사용했습니다. :)
프롬프트
AirPods Max commercial
에어팟맥스 광고, 디테일 개선, 심플한 라이팅 효과, 모션그래픽
최종적으로 모든 동영상을 Premiere pro로 편집하였습니다. 이미 잘 생성된 사운드에 맞춰서 동영상 속도를 조절하고, 심플하게 자막처리를 하여 최종본을 완성시킵니다. 원본을 그대로 사용한 부분도 있고, 새로 생성하여 사용한 부분도 있습니다. :)
Comment
매번 새로운 콘텐츠를 매번 새롭고 창의적으로 생성해야 할 때만큼 고통스러운 순간은 없을 거예요. 뇌가 굳어가고, 더 이상 새로운 사고를 하기 힘들 때, 씨댄스에 텍스트 프롬프트만 입력해서 동영상을 생성해 보세요. 결과물이 완벽하지 않을 수 있지만, 적어도 창조의 고통을 덜어주는 건 확실한 것 같습니다.
초기 러프한 디자인을 씨댄스가 해주면, 저희는 완성도를 높이기 위한 작업을 진행하는 거죠.