美团视频生成模型1360亿参数揭秘,效率提升10倍媲美Sora

美团长猫团队正式推出LongCat-Video基础视频生成模型,这款拥有1360亿庞大参数量的模型仅需几分钟便能产出720p分辨率、30帧每秒的高清视频,在文本转视频、图像转视频以及长视频续写等多项任务上均展现出卓越表现。
又是美团!
近期美团在AI领域的开源举措频出,确实令人刮目相看。
就在刚刚,美团长猫团队发布了LongCat-Video的基础视频生成模型,其1360亿的参规模能在数分钟内生成720p、30帧的高质量视频,并在文本转视频、图像转视频和长视频续写等多个任务中都表现优异。

从谷歌的Veo、OpenAI的Sora,到快手的可灵(Kling)及国内外众多开源模型,视频生成的质量、对指令的理解能力以及运动场景的真实感都在飞速提升。
LongCat-Video选择在这个时间点亮相,必然有其过人之处。



该模型的亮点在于其统一的多任务架构、出色的长视频生成能力、高效的推理性能,以及通过多奖励强化学习人类反馈(RLHF)实现的显著效果。
它采用单一模型架构,统一处理文本到视频、图像到视频、视频续写和交互式生成等核心功能。

通过在视频续写任务上的预训练,该模型能够生成分钟级别的长视频,同时保持画面质量与时间连贯性。
针对生成效率问题,模型创新性地采用了从粗到细的生成策略,结合模型蒸馏技术与稀疏注意力机制,显著降低了计算复杂度。
最终,经过精心设计的RLHF训练,LongCat-Video在生成质量上已媲美顶尖闭源模型及领先开源方案。
值得一提的是,团队还开源了完整训练流程,方便社区在自有项目中直接应用。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
谷歌AI转型实绩:传统业务焕新,为互联网企业带来增长新路径
谷歌母公司Alphabet近日公布了最新季度财报,总营收达1023 46亿美元,同比增长16%,超出华尔街预期超20亿美元。分业务线来看,各板块表现均优于市场预期,摊薄每股收益达2 87美元,盘后股
马斯克“硬刚”维基百科:人类知识运营的深层矛盾解析
埃隆·马斯克近期对维基百科发起多轮公开批评,并推出由人工智能驱动的在线百科项目GrokiPedia,引发两大知识平台的隔空交锋。面对科技巨头的挑战,维基百科在最新募捐公告中以独特方式作出回应,强调其
黄仁勋、周鸿祎共论AI:是伙伴非工具,推动经济与个体升级
在近期科技界关于人工智能(AI)发展的讨论中,两位科技行业领军人物对AI本质的认知出现了高度契合的观点。英伟达创始人黄仁勋与360集团创始人周鸿祎不约而同地提出,AI不应被简单定义为技术工具,而应被
谷歌CEO:全力押注生成式AI,Gemini下载量突破65亿次
在最新公布的季度财报中,科技巨头Alphabet交出了一份亮眼成绩单,公司第三季度营收成功突破千亿美元大关。在随后召开的财报电话会议上,首席执行官桑达尔·皮查伊着重阐述了公司对生成式人工智能的战略布
环球音乐与Udio和解:版权纠纷落幕,2026年推AI音乐平台
环球音乐集团(UMG)与人工智能音乐创作平台Udio近日宣布达成一项具有开创性的战略合作协议,这一举措在音乐行业引发广泛关注。此前,双方曾因版权问题陷入法律纠纷,此次合作不仅化解了矛盾,更开启了音乐
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程








