快手可灵3.0内测:视频生成AI模型全新升级发布
IT之家 1月31日消息,快手今天正式宣布推出新一代视频生成模型“可灵 3.0”系列,该系列目前正处于超前内测阶段。此次发布的系列包含了图片3.0、视频3.0以及视频3.0 Omni三款模型,它们在原有技术基础上实现了多项核心能力的突破与升级。
据了解,图片3.0模型的升级主要集中在以下四大功能板块:
新增了组图生成能力,支持用户通过上传单张或多张输入图像,批量生成逻辑连贯、叙事流畅的系列化画面;
输出分辨率显著提升,最高可支持生成2K与4K级别的高清图像,更好地满足了影视预演、场景设定等专业视觉创作需求;
大幅增强了画面细节的一致性,优化了纹理、光影的呈现效果,有效降低了图像中的“AI感”,使生成结果更加自然逼真;
强化了对构图、视角等画面元素的控制精度,提升了模型在影视类创作场景中的实用性与可控性。
据介绍,此次模型升级采用了视觉思维链技术,辅助生成前的场景解构与推理,并通过Deep-Stack视觉信息流机制增强了模型的细粒度感知能力。在模型训练过程中,研究团队引入了强化学习框架,并融合真实感与电影质感的双重评估标准,持续优化模型的最终输出效果。

此外,新一代视频模型采用了统一的多模态训练框架,支持文本、图像、视频片段等多种输入形式。单次视频生成时长最高可达15秒,并支持用户灵活设置3到15秒的目标时长。其功能改进主要包括:
新增了智能分镜系统,能够根据文本指令自动调度不同的景别与机位,实现更富动态的视觉叙事;
增强了生成主体的身份一致性控制,允许用户通过多张参考图或视频来锚定特定的人物或视觉元素;
升级了音画同步能力,不仅支持中、英、日、韩、西五种语言及多种方言的精准口型匹配,还能实现多人场景下的角色定向发声;
提升了文字生成的清晰度,确保画面中的招牌、字幕等文字信息清晰可辨,细节处理更加到位。
全新推出的视频3.0 Omni版本,额外支持创建视频主体特征库功能。用户只需提供一段包含人物的3到8秒视频,模型即可提取该角色的形象与音色特征,并应用于后续的生成任务中。相关技术文档显示,此次升级在多模态指令解析架构优化、音频采样区间调整以及特征解耦重组方案等方面均取得了进展。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
如何利用AI快速理解并接手遗留项目代码
面对缺乏文档的遗留Java项目,可利用AI工具系统化加速理解:先扫描全项目架构,生成模块摘要与调用图以建立宏观认知;再为核心方法生成语义化注释,提升可读性;一键生成关键方法调用链路,明确影响范围以降低修改风险;同时反向推导并自动生成API与数据库文档;最后将关键业务规则固化为。
可灵AI制作雪地脚印被覆盖效果的详细教程
在可灵AI中实现雪景脚印被自然覆盖的效果,关键在于模拟雪持续堆积的物理过程。可通过四种方法实现:用天气语义驱动结合时间轴描述雪层渐变;采用三层绑定法分层控制降雪、脚印与积雪的交互;通过图生视频叠加,为原视频添加结构化积雪衰减;或直接调用内置模板并微调沉积速率等。
豆包AI用户访谈记录整理归纳方法与定性数据分析
面对海量访谈文本,可利用AI工具进行高效整理。通过主题聚类自动归纳共性观点;预标记关键信息驱动结构化提取;分阶段交互先提取原始行为再映射理论模型;预设对比维度生成矩阵式归纳表。这些方法能将杂乱记录转化为结构清晰的分析素材。
Vue与React前端表单验证代码生成指南
使用CodeBuddy生成带验证功能的前端表单时,需提供清晰上下文:在Figma设计稿中为控件添加语义化命名或验证规则属性;在工具中选择框架并开启验证开关。已有项目可通过配置文件声明规则并手动触发增强,复杂场景还可通过MCP协议集成外部验证服务。明确的结构化指引能显著提升生成代码的完整。
玻璃瓶微缩世界下雨打雷视频制作教程
使用即梦AI制作玻璃瓶内微缩世界下雨打雷视频,需将复杂画面转为精准指令。可采用分层提示词法,清晰描述容器、内部世界、天气与风格;或分镜迭代法,先静态后逐步添加雨、雷动态。量化物理参数、启用物理引擎可提升真实感。若动态与通透感难兼顾,可分别生成内部场景与玻璃瓶素材,再用遮。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

