当前位置: 首页
科技数码
A16Z观察:视频模型从爆发到分化,谁能抓住产品化机遇?

A16Z观察:视频模型从爆发到分化,谁能抓住产品化机遇?

热心网友 时间:2025-10-28
转载

过去一年,几乎每周都有新的视频生成模型问世,不断刷新基准成绩:生成视频的时长越来越长、物理效果愈发逼真、角色形象与镜头语言也更加协调。我们已经习惯了模型性能一路飙升、持续突破。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

但今年,节奏变了。如果你密切关注基准测试,可能会感觉"进步"放缓了:大多数主流模型都能生成10到15秒带同步音轨的视频,效果已经相当出色,但也不再令人惊艳。

这并非坏事。在A16Z合伙人贾斯汀·摩尔看来,我们正在进入一个新阶段:视频模型的"产品时代"。

简单来说,视频模型的进步不再体现在参数规模或基准分数上,而是转向多样性和专业化发展。例如,我们看到不同模型在特定能力上各有建树:物理模拟、卡通风格、多镜头剪辑……没有任何一个模型能够"通吃全场",但每个模型都在特定维度上变得更擅长。

与此同时,更大的机会开始从模型本身,转向"围绕模型"的产品构建:那些能简化创作流程、抽象出复杂操作的工具,正变得比模型本体更有价值。

今天,就让我们跟随贾斯汀·摩尔来看看视频模型在过去一年的变化。

麻 将

01

视频领域不存在最强模型

过去几年,各大扩散模型实验室不断发布性能更强的新版本,在各种测试榜单上刷新纪录。大家逐渐形成一个共识:总有一天会出现一个"神级模型",在所有视频生成任务中表现最出色,成为行业默认标准。

但这个假设最近被打破了。上个月发布的Sora 2,在LMarena等测试中的表现甚至不如Veo 3,出现不升反降的情况。很多人开始怀疑,扩散模型的技术进步是不是开始变慢了。所谓"最强模型"的概念,在视频领域可能根本不存在。

其实,大语言模型也走过类似路径。2024到2025年,主流模型性能持续上升,之后在各种评测中逐渐趋于稳定。到了这个阶段,各家研究机构开始把重心放在具体场景和垂直领域上,而不是单纯追求更高分。同时,基于这些模型的AI产品也开始快速落地。

回头看,视频模型在公开测试上进展放缓其实也可以理解。过去几年,它们在"真实感"上突飞猛进,现在很多生成视频已经非常逼真。到了这个阶段,再想做得"更真实"就很困难了,因为它已经几乎和现实看不出区别。

这就好比17、18世纪的油画大师们,已经能画出接近照片的肖像和风景。那时大家不再纠结谁更写实,而是开始关注作品的风格和审美取向。

如果"更真实"不再是模型的优势来源,接下来会发生什么?我们可能会看到更多风格化、专业化的模型出现。每个模型不再追求通用,而是各有专长。资源丰富,选择也变多了。视频生成,正在进入一个"百花齐放"的新阶段。

02

视频模型价值开始分化

在聊模型越来越"专业化"之前,先简单回顾一下过去。

2024年初,我写过一篇文章,当时的视频生成技术还很原始。别说一分钟,连生成3到4秒的稳定片段都很难。物理效果经常崩坏,比如人物会突然"融化"到地板上,篮球会以奇怪的轨迹弹来弹去,最后却能神奇地进篮筐。

那时我说:距离AI拍出像皮克斯那样的短片,还有很长的路要走。而现在,一切都变了。

谷歌推出了Veo模型,直接登上多个排行榜榜首;OpenAI正在用30人团队、3000万美元预算,制作一部完整的AI动画长片(虽然不完全由模型生成,但依然是一次飞跃)。如今,视频长度更长,物理细节更真实。篮球从篮板反弹再落地?已经是标配。

不过,虽然整体水平在变好,我们也看到了另一个趋势:模型正在变得专一,各有专长。

为什么会这样?很简单,没有一款模型能满足所有用户的需求,比如有的团队专注提速和成本控制;有的专攻后处理阶段,让模型在某些场景表现得特别好。

比如:

Veo 3:最擅长物理细节、复杂动作,音画同步也做得最好

Sora 2:可以根据一句话生成有趣的多镜头视频,像是在帮你"拍短剧"

Wan:开源模型,支持很多风格化插件(LoRA),适合定制风格

Grok:速度快、成本低,特别适合动画内容

Seedance Pro:可以一次性生成多镜头结构

Hedra:长时间对话类视频的表现最稳

以Veo和Sora为例,两者都很强,但方向完全不同。

Sora适合创作趣味内容,比如用一句话生成一段"霍金打篮球"的视频,或把你和朋友放进某部电影里。它更像是一位"故事导演",适合普通用户和meme创作者。但它在物理表现、音视频同步方面还不太稳定,经常出现嘴型不对、声音延迟等问题。

相比之下,Veo就更"专业"。它缺乏幽默感,需要你提供更清晰的指导,但它的动作、镜头、音画同步更精准,更适合内容创作者、影视工作者这类对质量要求高的用户。

这种"专业化"趋势也带动了整条生态链的发展。像Fal、Replicate这样的AI视频云平台,已经托管了几十种模型,供用户按需选择。Krea这类编缉工具,则提供了一个中心平台,让用户可以和多个模型打交道,并建立自己的工作流程。

当然,一些大公司仍在努力追求"万能型模型",那种什么都精通的"上帝视角"模型。我们当然希望它能早点出现。但在这之前,不同模型在不同场景里"各显神通",已经是一个非常现实、非常值得期待的阶段了。

03

AI视频下一个方向是更好的产品化

熟悉我的朋友都知道,我平时会用各种视频和图像生成模型,去尝试制作一些非常定制化的内容。这个过程往往涉及好几个工具来配合使用。

举个例子:如果我需要制作一个"定制化家具展示视频",我通常会用到Ideogram、nano-banana和Veo3;如果是要在已有视频中添加"产品赠品"的动画片段,那就要靠nano-banana、Hedra,再加上一些编缉工具比如Krea和Kapwing。

这些组合工作流程其实挺复杂的,不是每个人都有时间、精力去折腾这么多工具。我们确实需要更好的一体化产品来简化整个创作过程。现在模型的能力已经很强大,但对应的产品进度,依然有很多"追赶空间"。

很多创作者正在手动拼接多个模型的功能,来完成模型本可以自动做到的事情。

比如,要让角色在不同镜头中保持一致,就需要在每段视频里手动调整人物形象;如果想延续上一个镜头的结尾画面,还得把最后一帧导出来,再作为下一段的起始条件去重新生成;控制镜头运动轨迹,也得先用图像模型画出起点和终点画面,再通过其他工具去"推导"中间的过渡过程;甚至连续做一张故事板,都要靠拼贴、截图、剪辑多个片段才能完成。

这些本可以由模型自动处理的工作,如今却依然依赖创作者手动拼接,正是产品体验和创作效率之间的巨大断层。好消息是,有些团队已经开始尝试解决这些问题。

Runway就发布了一套工具,可以让用户修改镜头角度、生成下一个镜头、切换风格、改变天气,甚至在画面里加东西或删东西。

OpenAI的Sora Storyboard也支持更细致地控制视频中每一帧的动作;而谷歌刚发布的Veo 3.1,更像是"产品更新"而非"模型升级",它围绕视觉控制和视觉效果控制做了很多增强功能。

其实,这就像我们过去看到的大语言模型(LLM)一样:即便模型性能不再突飞猛进,围绕它构建产品的空间依然非常大。视频模型现在也处在这个阶段,能力不缺,缺的是好用的产品。

未来,我相信我们会看到越来越"小而美"的模型,专门为某个行业或某种场景优化,比如室内设计、营销、动画制作等等。

同时,我们也需要更强大的"创意工具包"来打通各种模态,让视频、配音、音乐这些元素的生成与编辑更顺畅,最终形成一套完整的AI视频工作流。

来源:https://36kr.com/p/3527986756983940

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
AI能从单份血样检出多种神经疾病

AI能从单份血样检出多种神经疾病

来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一

时间:2026-04-07 14:55
褪去虚火,脑机接口方能释放长远价值

褪去虚火,脑机接口方能释放长远价值

来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接

时间:2026-04-07 14:55
黎万强、洪锋退出小米科技股东名单

黎万强、洪锋退出小米科技股东名单

人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20

时间:2026-04-07 14:55
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

  新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月  新华社记者张晓茹  美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任

时间:2026-04-07 14:55
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

时间:2026-04-07 14:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程