중국의 동영상 생성 모델인 Vidu가 유튜브에 데모버전을 공개하면서 오픈 AI 소라의 강력한 경쟁자로 떠올랐다. Vidu는 중국 칭화대학교와 셩슈 테크놀로지가 개발한 AI 모델로 최대 16초 길이, 1080p 해상도의 동영상을 생성할 수 있다. 반면 소라는 60초 동영상을 생성할 수 있다.

내부 개발자들은 Vidu는 자체 개발한 시각 변환 모델 아키텍처인 유니버설 비전 트랜스포머(U-ViT)를 기반으로 하며, 두 가지 텍스트-비디오 AI 모델인 디퓨전과 트랜스포머를 통합했다고 설명했다.