#5 VEO가 등장하며 판이 바뀌다

나의 고독한 AI 에디터 개발기

Apr 9. 2026

이제는 비디오 생성도 API로 다룰 수 있게 됐다,
이제부터가 통합의 진짜 시작”

통합 구조와 AI의 폭발적인 발전

이제 제 툴은 3D 캔버스와 프롬프트 입력 구조를 중심으로 텍스트 → 이미지 → 3D → 영상까지 하나의 흐름으로 연결되기 시작했습니다.

곧 제 예상대로 수많은 AI 모델들이 API 형태로 쏟아지기 시작했습니다. Fal을 통해 다양한 개발사의 모델들을 모듈화 된 API로 받아올 수 있었고, 툴의 확장 속도는 이전과 비교할 수 없을 정도로 빨라졌습니다.

통합 플랫폼의 등장, 그러나 비디오는 아직..

2024년엔 이미 Krea.ai 등의 플랫폼은 2D 기반의 이미지 생성 모델들의 API를 디자이너들/ 창작자들의 니즈에 맞게 조합하여 보기 좋은 UI와 쉬운 UX로 제공하고 있었습니다. 이들은 통합 AI 크리에이터를 표방하며 요금 구독제 형식의 플랫폼을 구축했습니다.

하지만 비디오 영역은 아직 모호했습니다. 이미지를 넘어 움직이는 비디오 생성 기능까지 제공하기에는 적절한 퀄리티로 제공되는 API가 없었기 때문이었습니다. 영상 영역에서는 당시 현업에서 런웨이, 루마, PIKA의 발전을 주시하고 비교해 가며 사용해 왔습니다. 다만 해당 플랫폼들이 지금과 달리 본인들 모델의 API를 공개하지 않았기에 이들 플랫폼에 여전히 직접 방문하는 것으로 비디오 생성을 의존하고 있었습니다. 혹은 여전히 영상은 ComfyUI 등이나 로컬 리소스로 스테이블디퓨전 비디오 모델 기반이나 animateDiff 등으로 강제로 모션 화하는 시도에 머물러 있었습니다. 모두 프로덕션 퀄리티로는 아직 만족스럽지 못하고 부적절했습니다.

여전히 사람들은 런웨이, 루마, PIKA 등의 소수 개발사가 제공하는 비디오 모델에 의존하면서 OpenAI가 엄청난 퀄리티로 제공한다는 드디어 프로덕션 퀄리티까지 갈 수 있겠다고 기대되는 SORA 비디오 모델을 기다리고 있었습니다.

2024년, 구글 VEO의 등장이 판을 바꾸다

2024년 5월 구글이 비디오 생성 모델 VEO를 공개합니다. 당시까지만 해도 최고의 비디오 모델일 것이라 여겨졌던 OpenAI의 SORA가 아직 폐쇄적으로 서비스를 제한적으로 제공하던 시기에 구글이 기습적으로 새로운 비디오 모델을 발표한 것입니다. 게다가 VEO는 단일 플랫폼 내에서만 제공하는 것이 아닌 드디어 프로덕션 퀄리티로 기대되는 비디오 모델을 API로까지 제공해 주었습니다. 이건 단순한 모델 공개가 아니라 플랫폼 구조 자체를 바꾸는 사건이었습니다.

OpenAI의 SORA 도 훗날 뒤늦게 API를 공개하긴 했으나 구글이 연이어 VEO2, VEO3, VEO3.1을 API로까지 제공하며 우위를 선점하기 시작했습니다.

저로서는 2025년 5월, 구글의 VEO3의 공개가 제 툴을 다양한 미디어 영역의 기능을 빠르게 업데이트할 필연성과 계기를 마련해 주었고 AI 플랫폼 개발 속도에 기름을 붓게 되었습니다. 이전까지는 모션만 생성해 주었다면 VEO3가 이제는 음성, 음악, 효과음까지 한 번에 생성해 주게 됐기 때문입니다.

2025년 9월, 일부 유저를 대상으로만 테스트를 진행하던 VEO3가 정식 버전으로 공개되고 생성 모델을 API로 뿌려주니 너도나도 할 것 없이 각자의 플랫폼에 비디오 생성 기능을 업데이트하기 시작합니다.

VEO 시리즈가 API로 풀리자 Fal과 같은 플랫폼을 통해 빠르게 확산되었습니다. 저를 포함해 Krea.ai 같은 기존 플랫폼들이 빠르게 모듈화 된 api를 활용해 수준 높은 퀄리티의 비디오 생성 기능을 탑재할 수 있게 됐습니다. 이미지 모델에서 벌어졌던 일이 비디오에서도 그대로 반복되기 시작한 것입니다. VEO3가 풀린 2025년 9월부터 저도 드디어 VIDEO 생성 기능을 확신에 차서 툴에 도입하게 됐습니다.

2025년의 툴 업데이트 기록 중 발췌, 2025년 9월 매일 하루 간격으로 비디오 기능을 업데이트했다.

이제 정말로 이미지부터 영상까지 모두 하나의 플랫폼에서 AI를 활용해 작업하는 것이 일반화되기 시작했고 미국의 Veo를 시작으로 중국의 KLING, SEEDANCE 등의 모델들도 API로 공개되기 시작하면서 이전에 다양한 이미지 생성 모델들이 서로 경쟁하고 이들이 하나의 플랫폼 안에서 취사선택할 수 있게 된 것처럼 비디오 생성 모델들 역시 같은 플랫폼 내에서 취사선택해 사용할 수 있게 됐습니다.

그 결과 하나의 미디어 영역 안에 머물러 있던 런웨이 같은 플랫폼들에서 유저들이 이탈해 Krea와 Higgsfield 같은 통합 플랫폼으로 유입되기 시작합니다. 그야말로 AI 크리에티브 플랫폼의 전성기가 시작됐습니다.

더불어 TOPAZ와 같은 프로덕션 퀄리티를 가능케 했던 업스케일링 모델들 역시 API로 제공되기 시작하며 하나의 플랫폼 안에서 고퀄리티 AI 프로덕션이 정말로 가능하게 됐습니다.

keyword

매거진의 이전글#4 어디서 AI 모델을 가져올 것인가#6 서로 다른 AI들을 어떻게 연결할 것인가매거진의 다음글