美团开源LongCat虚拟人视频生成模型,打造数字分身新标准
12月18日,美团 LongCat 团队正式对外开源了其 SOTA 级虚拟人视频生成模型——LongCat-Video-Avatar。该消息最早由“龙猫+LongCat”微信公众号发布。

该模型基于 LongCat-Video 基座打造,延续了“一个模型支持多任务”的核心设计理念,原生支持音频/文本生成视频、音频/文本/图像生成视频以及视频续写等核心功能。同时,其在底层架构上进行了全面升级,实现了动作拟真度、长视频稳定性与身份一致性三大维度的显著突破。
据介绍,该模型具备以下几大技术亮点。
告别僵硬,迎接鲜活:它不仅能够精准驱动口型,还能同步指挥眼神、表情和肢体动作,实现丰富饱满的情感表达。
“不说话”的时候,也很像人:美团采用了 Disentangled Unconditional Guidance(解耦无条件引导)训练方法,让模型理解“静音”不等于“死机”。在说话的间隙,虚拟人也会像人类一样自然地眨眼、调整坐姿、放松肩膀。
据介绍,LongCat-Video-Avatar 因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”,虚拟人从此拥有了“真正的生命力”。
在 HDTF、CelebV-HQ、EMTD 和 EvalTalker 等权威公开数据集上的定量测评表明,LongCat-Video-Avatar 在多项核心指标上达到了 SOTA 领先水平。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
北京科博会汇聚800余家企业 展示太空大脑与医疗探针等硬核科技
从刺破苍穹的“太空大脑”,到精准导航人体的“医疗探针”,再到身临其境的“VR巨幕”……第二十八届中国北京国际科技产业博览会(简称“北京科博会”),已然成为一场硬核科技的“阅兵式”。超过800家中外顶尖企业与科研机构携核心成果汇聚于此,共同描绘了一幅从探索宇宙到守护健康的科技创新全景图,集中展现了中国
无意识状态下大脑能否理解他人话语
躺在手术台上,当麻醉师告诉你“睡一觉就好了”的时候,你大概会认为大脑也随之“关机”了。毕竟,醒来后你确实对手术过程一无所知。但“不知道”就等于“没发生”吗?一项最新的研究给出了碘伏性的答案:即便在深度麻醉的无意识状态下,你的大脑,尤其是海马体,可能仍在暗中处理着复杂的信息。 2026年5月,《自然》
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越
2027款宝马i7 M70实车亮相 旗舰纯电轿车迎来全面升级
近日,汽车媒体BMW Blog曝光了一组2027款宝马i7 M70的实车照片,迅速引发了车迷与行业的高度关注。宝马集团CEO奥利弗·齐普策将此次中期改款定义为品牌史上“规模最大的车型改款”,从已披露的视觉信息来看,其改动幅度之大,确实堪比一次全新换代。 这款已于四月底正式亮相的新车,前脸设计采用了近
蔚来回应被约谈传闻称消息不实
近期,部分车企因“锁电”问题引发消费者集中投诉的事件有了新的监管动态。据相关报道,已有8家车企因此被监管部门约谈,其中3家因涉嫌违规操作被正式立案调查。尽管官方尚未公布具体涉事企业名单,但关于“哪8家车企被约谈”的讨论与猜测已在网络平台持续发酵。 针对网络流传的各类信息,多家涉事车企迅速作出官方回应
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

