brunch

You can make anything
by writing

C.S.Lewis

by 작은 불씨 Jun 08. 2024

AI 비디오 생성 기술의 발전 클링(Kling)과 소라

AI가 생활속으로

https://x.com/AngryTomtweets/status/1798777783952527818

세계가 OpenAI의 소라(Sora)를 기다리는 동안, 중국의 틱톡 경쟁사인 콰이쇼우(Kuaishou)가 소라와 유사한 비디오 생성 모델 클링(Kling)을 출시하여 주목받고 있습니다. 클링은 1080p 화질에 30fps로 2분 길이의 현실적인 영상을 생성하며, 누구나 접근할 수 있도록 공개되었습니다. 하지만 전 세계적으로는 접근에 제한이 있을 수 있습니다.


클링의 기술적 특징

클링은 디퓨전 트랜스포머(Diffusion Transformer) 아키텍처를 활용해 풍부한 텍스트 프롬프트를 생생한 장면으로 변환합니다. 독자적인 3D VAE와 가변 해상도 학습을 통해 다양한 비율을 지원하며, 단일 전신 사진으로부터 완전한 얼굴 및 신체 재구성을 구현합니다.


중국의 AI 기술 선도

중국은 AI 모델 개발에서 앞서 나가고 있으며, 클링은 이러한 기술의 일부분을 미리 보여줍니다. OpenAI는 올해 말 소라를 출시할 계획이나, 중국의 텍스트-비디오 모델에 비해 늦을 수 있다는 평가가 있습니다. 클링은 중국의 첫 비디오 생성 모델이 아니며, 지난 4월 비두(Vidu AI)도 출시되었습니다.


AI 비디오 생성 모델에 대한 신뢰성

비디오 생성 모델에 대한 신뢰는 여전히 논란이 있습니다. AI가 생성한 이미지는 수백 장 중 하나를 선택하는 과정이 필요하며, 시간이 지날수록 이러한 과정은 간단해지고 있습니다. 하지만 단 한 줄의 프롬프트로 고화질의 영상을 만든다는 것은 큰 혁신입니다.


사회적 영향과 미래 전망

AI와 휴머노이드의 등장은 사회에 큰 변화를 가져올 것입니다. AI로 그림을 그리고 영상을 만드는 것이 쉬워진다는 것 이상의 의미를 갖습니다. 앞으로 사회가 어떻게 변할지, 그리고 인간의 가치는 무엇인지 깊이 고민해야 할 시기입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari