海南焦点汽车网
您的位置:首页 > 聚焦 >

生数科技发布多模态高可控视频生成模型

2025-03-30 01:50:53     来源:新华网-北京    阅读量:6000   

3月29日,中关村论坛人工智能日的主题演讲上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布多模态视频生成模型Vidu Q1。该模型聚焦“高可控”,力求解决当前AI视频生成过程“随机性”的痛点。该模型于4月全球上线。

一直以来,AI视频生成过程中的“随机性”是老大难问题。Vidu Q1针对AI视频随机生成的痛点,引入多元素控制,聚焦“可控性”的提升,使AI视频生成的技术迭代满足当前视频制作精品化精细化的趋势。

Vidu Q1在多主体细节可控、音效同步可控、画质增强等方面突破显著。

以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步控制,对所有动作行为进行精准调整。

音效同步可控功能确保了随视频环境与画面转场Vidu Q1能够输出生成相应音效,并可精准控制每段音效的长短区间、精准设置每段音频出现的时间点。如0-2s的风声、3-5s的雨声等。Vidu Q1在节省时间的同时,能显著增强视频的沉浸感与感染力。

此外,Vidu Q1还能进一步增强画质,为用户带去更加清晰、细腻、逼真的视觉体验。

2024年4月,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布了视频大模型Vidu,引发业内关注。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

上一篇:让传统文化火起来赵盼儿的茶楼搬上大剧院的舞台——原创歌剧《梦华录》首演
下一篇:返回列表

精彩阅读
  • 年轻人第一辆车怎么选?ix35升级版MUFASA 沐飒就是最佳答案!年轻人第一辆车怎么选?i
  • 科技现代引领未来出行 北京现代举办Hi Tech超级技术日韩国站活动科技现代引领未来出行 北
  • 购车、用车、养车压力大?全新伊兰特都为你想好了购车、用车、养车压力大?
  • 一见“氢”心,安凯“智”造闪耀世界制造业大会!一见“氢”心,安凯“智”
  • 氢燃料技术:现代汽车决胜未来的砝码氢燃料技术:现代汽车决胜
  • 奇瑞混动双星论剑佛山,看超强实力如何颠覆市场奇瑞混动双星论剑佛山,看