| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 智能>

全球首个大一统多模态视频模型可灵O1发布 让P视频像P图一样简单

2025-12-03 15:38 作者:Aaron 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试

近日,全球首个大一统的多模态视频、图片创作工具"可灵O1"正式上线。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架,配合视频、图片、主体等多模态描述,将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全新的多模态创作流,实现从灵感到成品的一站式闭环。

大一统模型,解决视频创作的所有难题

作为首个大一统多模态视频模型,可灵O1基于MVL(Multi-modal Visual Language,多模态视觉语言)理念,打破了传统单一视频生成任务的模型边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务,融合于同一个全能引擎之中,使得用户无需在多个模型及工具间跳转,即可一站式完成从生成到修改的全部创作流程。

依托可灵视频O1模型的深层语义理解力,用户上传的图片、视频、主体、文字——在可灵O1眼中,皆是指令。模型打破了模态限制,能够综合理解一张照片、一段视频或一个主体,甚至一个角色的不同视角,精准生成各种细节。

可灵O1的多模态指令输入区,让繁琐的剪辑后期变成了简单的对话。用户无需手动遮罩或关键帧,只需输入「移除路人」、「将白天改为黄昏」或「替换主角服装」,模型即可读懂影像逻辑,从局部的主体替换,到整体的视频风格重绘,自动完成像素级的语义重构。此外,如图片/主体参考;指令变换(视频增加、删除内容、切换景别/视角、视频修改任务等)、视频参考、首尾帧、文生视频等能力也一并支持。

针对AI视频难以落地的痛点——角色与场景的一致性,可灵O1底层强化了对输入图像及视频的理解。 它能像人类导演一样,“记住”主角、道具和场景。无论镜头如何流转,主体特征始终稳定如一。 此外,该模型展现了强大的多主体融合能力。用户可以自由组合多个不同主体,或将主体与参考图混搭。即便是在复杂的群像戏或互动场景中,模型也能独立锁定并保持每一位角色或道具的特征,确保“主角”在不同镜头中实现工业级的特征统一。

不再局限于单点任务,而是支持“技能组合”。 用户可以要求可灵O1“在视频中增加主体的同时修改背景”,或者“在图片参考生成时,同步修改风格”。这种一次生成多种创意变化的能力,极大地拓展了创作的自由度,让创意的化学反应成为可能。

叙事时长自由定义,让每一段故事都有其独特的呼吸感。可灵O1将定义时间的权力交还给创作者,支持3-10秒自由生成。无论是短促的视觉冲击,还是悠长的故事铺陈,都由用户自由掌控。 值得注意的是,作为统一模型的一部分,可灵O1的首尾帧能力也将支持3-10秒的生成时长选择(即将发布),这将进一步增强叙事的张弛度。

一同登场的还有可灵图像O1模型,可实现从基础图像生成到高阶细节编辑全链路无缝衔接,用户既可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作。 该模型具备四大核心优势:特征高度保持,让主体元素稳定不偏差;细节修改精准响应,让每一处调整都符合预期;风格调性准确把控,让画面氛围始终统一;超丰富想象力,让创意呈现更具张力,真正实现“所想即所得”。

一个模型,搞定影视、自媒体、广告电商等多视频创作场景

全新的可灵O1集生成与编辑于一体,可广泛适用于影视、自媒体、广告电商等多种场景。无论是从零构建的叙事生成,还是对既有素材的深度重塑,可灵O1都能根据不同需求,灵活调用其参考、编辑的能力,轻松完成创作。

在影视创作领域,凭借可灵O1的超强一致性的图片(主体)参考,配合主体库功能,可以精准锁定每个分镜的角色及服化道,轻松创作生成多个连贯的影视镜头;而对于视频后期、自媒体创作者来说,可通过简单对话式的提示词,如输入“删除背景中的路人”、“让天空变蓝”,就能让可灵O1自动完成像素级的智能修补与重构。

针对传统线下广告实拍成本高,制作周期长的问题。如今用户只需上传商品图、模特图和场景图,配合简单指令描述,即可快速生成多个酷炫的商品展示广告,大幅降低实拍成本。针对模特约拍麻烦、更换背景/服装需要重复拍摄等问题,使用可灵O1,能搭建你的永不落幕的虚拟T台:上传模特 + 服装实拍图,输入指令,完美还原服饰的质感和细节,批量生产高质量的 Lookbook 视频。

据悉,可灵O1能实现上述强大而全面的功能,源于在技术底座上的深层创新。全新的可灵视频O1模型打破视频模型在生成、编辑与理解上的功能割裂,构建了全新的生成式底座。融合多模态理解的Multimodal Transformer和多模态长上下文,实现了多任务的深度融合与统一。

【对“全球首个大一统多模态视频模型可灵O1发布 让P视频像P图一样简单”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
降价!免费!圈地!大模型价格战卷到飞起 降价!免费!圈地!大模型价格战卷到飞起
巨头接连下场!降价!免费!属于大模型赛道的价格战,已彻底陷入疯狂。 近日,百度和……
·OpenAI神秘硬件“IO”首度解密:别刷手机了!
·Gmail 被指“拿用户邮件训练 AI”,谷歌否认
·ChatGPT教唆致多名用户自杀:已出现七宗诉讼
·AI陪伴的狂欢与隐忧,2025年谁在裸泳?
·独家揭秘Meta AI大裁员:Llama 4落后DeepSeek
图文
降价!免费!圈地!大模型价格战卷到飞起
降价!免费!圈地!大模型价格战卷到飞起
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
OpenAI再度拉响安全警报:又一高层离职揭示
ZAO隐私风险 你的脸已经不仅仅是你的脸了
ZAO隐私风险 你的脸已经不仅仅是你的脸了
九号机器人,这次想用AI运载机器人送快递送外卖
九号机器人,这次想用AI运载机器人送快递送
热点
·AI又出了偏门应用:用算法“脱掉”女性衣服
·ZAO隐私风险 你的脸已经不仅仅是你的脸了
·美的AIR空间站|你用过能管理空气的空调吗?
·新橙派果汁机器人引爆中国独角兽孵化合作大会
·民宿房东的辛酸史 用安伴门锁实现了合规运营
旧闻
·AI生态体系再添四名成员 云天励飞闪耀2019安
·欧盟发布AI伦理指南:AI系统要负责任且无偏见
·行业智能化大势所趋,打造机器人无感通行方案
·布局智能财务及中台架构,元年科技携募资启动
·5G赋能 构建未来普惠生态——甜橙金融亮相天
广告
硅谷精选
降价!免费!圈地!大模型价格战卷到飞起
降价!免费!圈地!大模型价格战卷到飞起
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
内容与技术“双引擎”驱动,芒果探索全链路AI创新
内容与技术“双引擎”驱动,芒果探索全链路AI创新
全球AI人才报告曝光:清华第三,北大第六
全球AI人才报告曝光:清华第三,北大第六
外媒称微软将向“欧洲版OpenAI”投资1500万欧元 但面临欧盟审查
外媒称微软将向“欧洲版OpenAI”投资1500万欧元 但面
新春送龙蛋,小度推出龙年首个大模型AI年宠
新春送龙蛋,小度推出龙年首个大模型AI年宠
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>