可灵视频正式上线O1模型,宣称这是全球首个统一多模态视频大模型,定位为全能创作引擎,旨在通过单一输入框实现跨模态任务的无缝融合,打破传统视频生成的功能割裂问题。
据介绍,该模型引入MVL(多模态视觉语言)交互架构,并结合Chain-of-thought技术,赋予系统更强的常识推理与事件推演能力。
官方表示,O1模型能够在同一界面下处理照片、视频与文字等多模态输入,用户仅需通过简单对话即可完成复杂的创作编辑。
在功能层面,O1模型支持多主体视角构建与自由组合,确保视频主体在不同镜头间保持一致性与稳定性。
同时,用户可灵活组合多种技能,一次生成多样化创意变化,并可自由设定3至10秒的生成时长,以掌控叙事节奏。
此外,可灵AI宣布自12月1日起至12月14日,将举办为期5天的「全能灵感周」,并推出会员年卡限时6.6折优惠活动,以吸引更多创作者体验该新模型。

扫一扫关注微信