| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 软件>

破解AI视频转场难题 可灵2.1首尾帧全球上线

2025-08-23 18:32 作者:Aaron 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试

8月22日,可灵AI正式推出基于2.1模型的全新首尾帧功能。该功能通过端到端多模态语义推理能力的升级,显著提升首尾帧功能视频生成效果。据评测数据显示,与此前1.6版本相比效果提升235%,在视频转场、视觉冲击力、复杂运镜及创意营销等维度表现尤为突出。  

攻克转场难题 多场景丝滑衔接

可灵2.1模型首尾帧功能的核心突破之一,是解决AI视频生成中常见的转场难题,如场景衔接生硬“刹车感”强等。测试视频中,一名年轻亚洲女性从堆满书籍与佛像的房间转身,镜头推进至金色装饰逐渐增多的空间……过程中,角色发型(长发自然垂落转为侧梳)、服装(白色长袖衬衫变为无袖上衣)、光线(暖光由散射转为聚焦)均实现无缝衔接,场景切换逻辑清晰连贯。

该案例通过多个首尾帧相接实现连续多个丝滑转场,也验证了模型对艺术风格切换与角色动态衔接的精准把控。

强化视觉冲击效果 打造超燃视觉特效

此次可灵2.1首尾帧可实现强烈的视觉冲击效果,助力轻松打造超燃视觉特效。实测视频中展现了极具张力的人物变身过程,人物轮廓在深蓝背景中逐步蜕变为纯火焰形态,火山岩浆流动、星空背景下的烈焰升腾等细节均清晰呈现,节奏与危险紧张的氛围高度匹配,体现出模型对复杂视觉元素的精准控制。

专业级复杂运镜 全面提升沉浸感

可灵2.1首尾帧可以支持电影级复杂运镜,通过首尾帧连续衔接,实现镜头轨迹与场景逻辑的高度匹配。例如,在模型连续生成的这两个视频中,镜头先快速向左下摇镜,突出趴在地上爬行的破旧机器人,随后快速左摇,拍摄逃窜机器人与爆炸场景……整个过程镜头调度一气呵成,过程丝滑流畅。

创意十足 轻松打造高质感营销素材

全面升级后的首尾帧功能还可快速生成符合品牌调性的创意展示视频,广泛适用于市场营销等领域,显著降低素材制作成本。例如,在这个饮品广告案例中,易拉罐快速从树莓中飞出,周围的树莓如爆炸般散开,果汁向四周飞溅,整个过程丝滑自然,给观众带来身临其境的沉浸式体验。

横评碾压 表现超越MidjourneySeedance

专业评估人员对可灵2.1、可灵1.6、Seedance1.0 mini、Midjourney等模型的首尾帧功能进行了客观的效果评测。结果显示,可灵 2.1首尾帧在整体效果及多个细分维度上均表现优异,与Seedance1.0 mini 对比的整体GSB得分达到2.09,与Midjourney对比的整体GSB得分达到2.30,与可灵1.6对比的整体GSB得分达到3.35。同Midjourney、Seedance1.0 mini 进行两两偏好对比显示,可灵2.1首尾帧的胜率分别达到62%、57%。

注:GSB 指标用于衡量群体意见的一致性和正负倾向,GSB 值越大,说明模型优势越大

这一卓越表现得益于可灵2.1在端到端优化的多模态语义推理能力上的进一步提升。模型能够深度整合用户的提示词与首尾帧图片中的丰富视觉语义及动作意图,高效融合多模态数据,精准捕捉并推理画面元素在时空维度上的演变逻辑。无论是不同艺术风格的切换、角色间的丝滑衔接,还是复杂运镜与场景迁移,都能在语义驱动下生成自然流畅且充满想象力的动态画面。

与此同时,可灵2.1引入了自适应扩散引导与方向重定向机制,进一步提升了视频生成的稳定性和专业质感。该机制在扩散生成的每一步对条件分布进行动态引导和纠正,有效修正偏离语义或视觉逻辑的动态路径,确保动作衔接平滑、运动节奏稳定可控。

此外,模型在生成过程中严格保持人物/物体身份一致性、色彩风格与画面基调的连贯统一,显著提升了视频的专业质感。即使面对高动态场景下的挑战(如局部失真、细节破碎、缩放变形及首尾帧视觉跳变等问题),该机制依然表现出强大的错误抑制与纠正能力,确保生成内容的稳定性和可信度。

作为全球领先的AI创意生产力平台,可灵AI已累计完成30次迭代,服务用户突破4500万,累计生成视频超2亿条、图片超4亿张,覆盖广告、影视、游戏等多个行业。此次2.1模型首尾帧的推出,进一步提升了视频生成一致性和稳定性,广泛适用于广告营销、影视、短剧、动画等创意制作场景,进一步巩固了其在AI视频生成领域的领先地位。  

【对“破解AI视频转场难题 可灵2.1首尾帧全球上线”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
Create 2024百度AI开发者大会:百度李彦宏带来三大AI开发工具 Create 2024百度AI开发者大会:百度李彦宏带
2024年4月16日,在Create2024 百度AI开发者大会上,百度创始人、董事长兼首席执行官李……
·破天荒!OpenAI重新“开源”,还和亚马逊云科
·火狐官宣关闭北京公司、终止Firefox浏览器中
·Windows 11启动声音Bug修复受阻,Beta用户已
·系统差异或致误解 苹果用户再也不敢乱用emoji
·Siri升级迟迟未到,消息称苹果AI投入犹豫不决
图文
微信扫一扫加好友有讲究吗?官方:可以丝滑切换
微信扫一扫加好友有讲究吗?官方:可以丝滑
Create 2024百度AI开发者大会:百度李彦宏带来三大AI开发工具
Create 2024百度AI开发者大会:百度李彦宏
知米背单词APP那些不为人知的小细节(图)
知米背单词APP那些不为人知的小细节(图)
Realme引入广告什么情况 Realme广告怎么设置关闭?
Realme引入广告什么情况 Realme广告怎么设
热点
·群控、云控时代即将终结,智控时代已到来
·106短信群发平台APP,致力于成为领域内佼佼者
·DT小听App:防偷拍,还是用这款国产app(图)
·软件技术行业发展变化非常快,软件人才要按需
·嗨学网一级消防可靠吗?新手妈妈亲生经历告诉
旧闻
·钓鱼网站伪装行骗 360“照妖镜”识别虚假网店
·联想携手微软发布混合云解决方案,开启市场新
·太极iOS 8.4越狱又遭剽窃!越狱巨偷PP助手养
·外媒质疑iOS越狱的必要性:已经接近终点了
·屏奴时代同乡移动社交盛行 乡遇强势上线
广告
硅谷精选
微信扫一扫加好友有讲究吗?官方:可以丝滑切换
微信扫一扫加好友有讲究吗?官方:可以丝滑切换
Create 2024百度AI开发者大会:百度李彦宏带来三大AI开发工具
Create 2024百度AI开发者大会:百度李彦宏带来三大AI
“米家崩了”上热搜 网友连夜反映:米家设备全部离线
“米家崩了”上热搜 网友连夜反映:米家设备全部离线
“2023(第七届)中国软件和信息服务业年度风云榜”重磅揭晓
“2023(第七届)中国软件和信息服务业年度风云榜”重
启动盒马调用位置权限13次,叮咚买菜调权限种类最多
启动盒马调用位置权限13次,叮咚买菜调权限种类最多
实时化与Serverless是开源大数据3.0时代的必然选择
实时化与Serverless是开源大数据3.0时代的必然选择
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>