当前位置: 首页
文章专题列表
视频生成

视频生成

视频生成技术正引领内容创作领域的深刻变革。本专题深入解析AI视频生成的核心技术原理,涵盖文本生成视频、图像转视频等前沿应用。我们汇集行业动态、实用工具评测与创作技巧教程,帮助内容创作者、营销人员及技术爱好者掌握从基础操作到高级制作的完整知识体系。专题聚焦AIGC趋势下的创新场景与实践案例,旨在为用户提供高效、专业的视频生成解决方案,助力提升创作效率与视觉表现力。

2026-02-03 16:10
631
首个Deep Research评测基准:视频理解与开放网络搜索

首个Deep Research评测基准:视频理解与开放网络搜索

来自QuantaAlpha、兰州大学、香港科技大学(广州)、北京大学等机构的研究者联合推出了首个视频深度研究(Video Deep Research)评测基准VideoDR。 在传统的视频问答(Vi

时间:2026-01-25 16:49 来源:网络
MoonMath突破视频AI瓶颈:闪电生成背后的关键技术

MoonMath突破视频AI瓶颈:闪电生成背后的关键技术

这项由MoonMath ai团队的Dor Shmilovich、Tony Wu、Aviad Dahan和Yuval Domb共同完成的突破性研究发表于2025年神经信息处理系统会议(NeurIPS

时间:2026-01-21 17:07 来源:网络
PickStyle指南:用上下文风格适配器实现视频风格转换

PickStyle指南:用上下文风格适配器实现视频风格转换

PICKSTYLE 是一个基于 VACE 构建的视频到视频风格迁移框架,它配备了上下文风格适配器和新颖的 CS-CFG 机制。 利用扩散模型做视频风格迁移,想保留原视频内容的同时渲染成指定风格,但面

时间:2026-01-16 15:37 来源:网络
MultiTalk模型解析:98.7%语音视觉对齐精度的多角色对话SOTA

MultiTalk模型解析:98.7%语音视觉对齐精度的多角色对话SOTA

MultiTalk以DiT(Diffusion-in-Transformer)为基础的视频扩散模型作为其核心骨架。 由中山大学、美团、港科大开源的MultiTalk 可实现多虚拟人对话视频生成。在语

时间:2026-01-08 13:55 来源:网络
华盛顿大学AI突破:视频生成实现“边想边画”创作

华盛顿大学AI突破:视频生成实现“边想边画”创作

这项由华盛顿大学的洪苏成(Susung Hong)与Adobe研究院的葛崇健(Chongjian Ge)、张志飞(Zhifei Zhang)、王瑞贤(Jui-Hsien Wang)合作完成的研究发表

时间:2025-12-30 11:31 来源:网络
阿里与中科院:突破视频生成模型创意边界的关键一步

阿里与中科院:突破视频生成模型创意边界的关键一步

这是一项由中国科学院大学、阿里巴巴高德地图事业部、中国科学院自动化研究所以及清华大学、东南大学的研究团队共同完成的突破性研究。论文由吴美琪、朱家树、冯晓坤、陈楚彬、朱晨等多位研究者撰写,已发表在20

时间:2025-12-24 09:55 来源:网络
豆包视频功能升级,支持同步生成声音与画面

豆包视频功能升级,支持同步生成声音与画面

近日,豆包App视频生成能力升级,支持Seedance1 5 Pro模型,可一键生成声音和画面相匹配的有声视频。打开豆包App对话框,选择“照片动起来”,上传图片并输入提示词,选择“1 5 Pro”

时间:2025-12-22 17:12 来源:网络
字节跳动破解AI记忆难题:视频生成如何实现连续思维

字节跳动破解AI记忆难题:视频生成如何实现连续思维

这项由香港中文大学的郭宇伟、字节跳动的杨策元等研究团队合作完成的突破性研究,于2024年12月发表在计算机视觉领域的顶级会议上。对这项研究感兴趣的读者可以通过arXiv:2512 15702v1查询

时间:2025-12-19 19:01 来源:网络
美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成

美团开源LongCat-Video-Avatar模型,支持情感表达虚拟人生成

IT之家 12 月 18 日消息,据“龙猫 LongCat”公众号今晚的推文,美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。

时间:2025-12-18 19:13 来源:网络
P图级特效?O1视频生成器重塑内容创作未来

P图级特效?O1视频生成器重塑内容创作未来

可灵O1不是那种只会在参数上卷数字的模型,它是奔着解决实际工作流问题去的。虽然它还不完美,但它展示了一种可能性:未来的视频创作,真的可以像现在P图一样简单、直观、随心所欲。 作为一名每天都在和各种A

时间:2025-12-03 12:45 来源:网络
Rolling Forcing技术:用AI生成分钟级长视频的实用指南

Rolling Forcing技术:用AI生成分钟级长视频的实用指南

Rolling Forcing 成功突破了实时长视频生成的不可能三角,在保持 16 fps 实时生成速度的同时,显著降低了长序列生成中的误差累积,实现了分钟级别的高质量视频流生成,为交互式世界模型、

时间:2025-11-05 09:45 来源:网络
美团视频生成模型1360亿参数揭秘,效率提升10倍媲美Sora

美团视频生成模型1360亿参数揭秘,效率提升10倍媲美Sora

美团LongCat团队发布了LongCat-Video的基础视频生成模型,它拥有136亿的参数量,能在数分钟内生成720p、30帧每秒的高质量视频,并且在文本转视频、图像转视频和长视频续写等多个任务

时间:2025-10-30 13:53 来源:网络
Vidu三重进化:AI视频从碎片叙事迈向多线程复杂叙事

Vidu三重进化:AI视频从碎片叙事迈向多线程复杂叙事

2024年9月,Vidu 在全球首个推出@主体参考功能,引领行业迈入“参考生视频时代”,收获全球创作者的广泛认可。10月21日,Vidu Q2 参考生视频再次进化,本次升级聚焦于高一致性,速度更快,

时间:2025-12-06 12:53 来源:网络
爱诗科技B轮融资1亿元 年度收入突破4000万美元

爱诗科技B轮融资1亿元 年度收入突破4000万美元

10 月 17 日,AI 视频企业爱诗科技宣布完成 1 亿元人民币 B+ 轮融资,由复星锐正、同创伟业、顺禧基金等共同投资。此前 9 月 10 日,爱诗科技完成 B 轮融资,总金额超过 6000 万

时间:2025-10-17 18:53 来源:网络
可灵2.5 Turbo 模型上线:价格较上代模型低近30%

可灵2.5 Turbo 模型上线:价格较上代模型低近30%

9月24日消息,9月23日,可灵AI再次迎来重磅升级,推出视频生成可灵2 5 Turbo 模型,同时更新文生视频、图生视频两大功能。模型质量大幅提升,生成效果行业领先。专业评估人员对可灵2 5 Tu

时间:2025-09-24 22:11 来源:网络
  • 日榜
  • 周榜
  • 月榜
最新文章
更多
22 04月
这城有良田琅嬛银香囊使用指南 琅嬛银香囊:队伍生存的关键拼图与能量引擎 在《这城有良田》的宝具体系中,琅嬛银香囊以其独特的定位脱颖而出。作为一件稀有品质的橙色宝具,它并非追求极致的伤害,而是专注于提升队伍的生存与节奏掌控能力。尤其当你的对手以远程攻击见长,或是你的阵容极度依赖主战宝具技能快速启动时,这件宝具的价值便会充分显现。不
22 04月
jQuery中slidetoggle方法的基本使用与效果演示 滑动切换效果的核心机制在网页交互设计中,元素的动态显示与隐藏是提升用户体验的常见手段。其中,平滑的滑动效果因其自然流畅的视觉过渡而备受青睐。jQuery库中的 slideToggle()方法正是为此类需求提供的一个高效解决方案。该方法本质上是一个复合动作,它智能地判断目标元素当前的显示状态。如果元素
22 04月
同人创作平台 AO3 结束 Beta 公测阶段,历时 17 年 同人创作平台AO3结束长达17年的Beta公测,步入新阶段 一则来自科技媒体Engadget的消息,在圈内激起了不小的波澜:知名同人创作平台Archive of Our Own(简称AO3),在历经长达17年的Beta公测后,终于正式告别了测试标签。这几乎算得上是互联网服务史上的一段“马拉松”了。
22 04月
ESL Impact S8前瞻:赛制、参赛队伍、奖金及赛程 ESL Impact S8前瞻:赛制、参赛队伍、奖金及赛程 新一届的女子电竞赛事即将打响。本届ESL Impact第八赛季的线下锦标赛,汇聚了八支顶尖战队。她们将首先分成两个小组展开较量,每个小组积分前二的队伍,才能拿到通往淘汰赛的门票。接下来的决赛阶段将采用紧张刺激的单败淘汰制,并且所有关键对决都
22 04月
win11onedrive有用吗 win11onedrive有用吗 很多朋友在拿到新电脑,尤其是预装Win11系统的设备时,都会发现里面自带了一个叫OneDrive的软件。大家都知道它是个云端备份工具,但心里总有个疑问:在咱们这儿,Win11自带的这个OneDrive,到底实不实用? 先说结论吧:如果你人在国内,那这个OneDriv
22 04月
vivo Y600 Pro浮光金实拍 一眼沦陷的鎏金水波美学 拿到vivo Y600 Pro浮光金的瞬间,像把洞庭湖的落日波光捧在了手里 温润的鎏金质感,在光下流转的水波纹理,没有浮夸的亮面反光,只有东方美学独有的静谧与璀璨。 浮光跃金镜环:航空铝精密雕琢,寓意吸金聚财 其底座环圈以高级制表工艺镌刻齿轮纹理,让整体设计在温润中更显棱角分明。 6 83英寸直屏:
22 04月
WaveSpeedAI- 加速AI图像和视频生成的平台 什么是Wa veSpeedAI? 简单来说,Wa veSpeedAI可以看作是一个为AI图像和视频生成任务“踩下油门”的一站式平台。如果你曾苦恼于本地部署的繁琐或在线生成的漫长等待,这个平台提供的,正是一个集成了多种前沿模型的快速解决方案。它囊括了诸如FLUX Dev、Wan 2 1等多个重量级模型
22 04月
文明创建上半年工作总结 文明创建上半年工作总结 时光飞逝,上半年的文明创建工作已圆满收官。为系统梳理阶段性成果,提炼有效经验,并为下半年工作提供清晰指引,特此对上半年工作进行回顾与总结。 文明创建上半年工作总结【一】 本年度上半年,XX路社区精神文明建设工作坚持以科学理论为指引,紧密对接上级要求,遵循“贴近实际、贴近生活、
22 04月
ZKS币如何买 ZKS币介绍 ZKS币:当隐私遇见效率,Layer-2的潜力代币 说起ZKS币,它的全称是Zero-Knowledge Security Coin,有时也指ZKSwap协议的原生代币。这枚代币背后,是zkSync团队基于区块链技术打造的去中心化资产。其核心依托的ZKSwap协议,本质上是一套巧妙的Layer-2扩
22 04月
不同于CLA,最低配奔驰纯电C级中控台也有“三块大屏” IT之家 4 月 22 日消息 去年,梅赛德斯-奔驰发布了全新CLA。一个有趣的细节是,在没有第三块屏幕的入门车型上,副驾屏的位置被一整片铺满三叉星标识的钢琴黑饰板取代。这种设计是好是坏,向来是见仁见智。毕竟,有人对车内屏幕的增多并不反感,也有人巴不得能偶尔少看几眼屏幕。 不过,到了全新纯电C级这里