中国电信发布全自研视频生成大模型等

2024-12-05 来源：科技日报

969

科技日报记者罗云鹏

12月3日，中国电信人工智能研究院（TeleAI）在中国电信“2024数字科技生态大会”期间发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果，并发布开发者产业联盟计划。

本次发布的视频生成大模型打造了“VAST（Video As Storyboard from Text）二阶段视频生成技术”，通过文本描述可精准勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”（Storyboard），进而生成对应的视频内容。

得益于VAST的创新能力，视频生成大模型可以保证单个或多个主体人物在各视频片段中的外观一致性，实现对复杂动作和交互式动作的精确控制，并让角色和目标物体的运动符合物理规律。

基于此，通过语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作各个环节，覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程。

大会期间，中国电信人工智能研究院还与华为、中兴、亚信科技等在内的19家合作伙伴发布中国电信人工智能开发者产业联盟计划，旨在聚合各方力量，加快推动人工智能产业发展，提升技术能力与应用水平，并为全球开发者赋能。

行业动态

思特威推出3MP高性能车规级CMOS图像传感器新品SC360AT

首季增长5.4%，中国经济乘风破浪向前行

英飞凌XENSIV传感器技术：协同创新与场景化应用探索

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产