중국의 Vidu, OpenAI의 Sora에 도전장

중국의 AI

Apr 29. 2024

중국의 Shengshu Technology와 청화대학이 협력하여 텍스트를 비디오로 변환하는 새로운 모델 'Vidu'를 선보였습니다. 이 기술은 단 한 번의 클릭으로 1080p 해상도의 16초짜리 클립을 생성할 수 있는 능력을 갖췄으며, 이는 올해 베이징에서 열린 중관촌 포럼에서 공개되었습니다. Vidu는 OpenAI의 Sora에 대한 강력한 경쟁자로 자리매김하려는 목표를 가지고 있습니다.

Vidu의 가장 큰 특징은 유니버설 비전 트랜스포머(U-ViT) 아키텍처를 기반으로 하고 있다는 점입니다. 이 기술은 실제 물리 세계를 모방하며, 다양한 카메라 앵글에서의 장면 전환을 가능하게 하는 등 동적인 비디오 샷을 생성할 수 있습니다.

개발자들은 Vidu가 현실적인 조명, 그림자 및 표정을 비롯한 복잡한 장면을 자연스럽게 표현할 수 있다고 설명합니다. 또한, 비현실적이고 초현실적인 내용을 깊이 있고 복잡한 방식으로 창조해내는 상상력도 갖추고 있습니다.

하지만, Vidu가 Sora와의 직접 비교에서 완벽하게 대등한 수준에 이르렀는지는 아직 불분명합니다. 초기 데모에서는 Sora가 보여준 비디오의 리얼리즘과 비교했을 때 다소 뒤처지는 것으로 평가받고 있습니다. 이에 대해, Vidu를 개발한 팀은 앞으로의 기술 발전과 세부적인 개선을 통해 더 나은 결과물을 도출할 수 있을 것이라는 기대감을 표현하고 있습니다.

중국이 AI 분야에서 이루고 있는 진전은 주목할 만하며, Vidu와 같은 혁신적인 프로젝트는 향후 글로벌 시장에서의 경쟁력을 한층 강화할 것으로 보입니다. 그러나 중국 제품과 기술에 대한 정보가 종종 제한적이고 일방적인 경향이 있기 때문에, Vidu의 진정한 경쟁력과 혁신성은 시간이 지나면서 더 명확해질 것입니다. 이러한 발전이 기대되는 만큼, Vidu가 어떻게 발전해 나갈지 지켜보는 것이 흥미로울 것입니다.

keyword

매거진의 이전글애플, 차세대 아이폰에 AI 도입 준비 미국 기술 CEO들, AI 안전 위원회 참여매거진의 다음글