中国电信发布全自研视频生成大模型等
2024-12-05
来源:科技日报
338
科技日报记者 罗云鹏
12月3日,中国电信人工智能研究院(TeleAI)在中国电信“2024数字科技生态大会”期间发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。
本次发布的视频生成大模型打造了“VAST(Video As Storyboard from Text)二阶段视频生成技术”,通过文本描述可精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”(Storyboard),进而生成对应的视频内容。
得益于VAST的创新能力,视频生成大模型可以保证单个或多个主体人物在各视频片段中的外观一致性,实现对复杂动作和交互式动作的精确控制,并让角色和目标物体的运动符合物理规律。
基于此,通过语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程。
大会期间,中国电信人工智能研究院还与华为、中兴、亚信科技等在内的19家合作伙伴发布中国电信人工智能开发者产业联盟计划,旨在聚合各方力量,加快推动人工智能产业发展,提升技术能力与应用水平,并为全球开发者赋能。