数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

字节跳动开源多模态AI模型Lance：轻量原生统一架构解析

字节跳动开源多模态AI模型Lance：轻量原生统一架构解析

热心网友时间：2026-05-25

转载

多模态AI领域迎来重要突破。字节跳动正式开源Lance模型，这款轻量级多模态AI仅3B激活参数，却实现了真正的“原生统一”架构，能够同时处理图像与视频的理解、生成及编辑任务。这意味着单个模型即可完成文生图、图生文、视频生成、视觉问答等过去需要多个专用模型协作的复杂工作。

“拼好模”：字节跳动开源轻量原生统一多模态 AI 模型 Lance

与当前主流的“拼接式”方案不同，Lance采用了更彻底的统一设计思路。现有方法通常将视觉理解模块与生成模块分开训练再组合，而Lance从训练初期就将图像理解、视频理解、图像生成、视频生成及跨模态编辑五大能力整合进同一框架。其核心目标是构建一个能处理任意模态输入（文本、图像、视频），并输出文本（X2T）、图像（X2I）或视频（X2V）的通用多模态系统。

实现这一目标面临本质挑战：理解任务依赖高度抽象的高层语义特征，而生成任务则需要保留细节纹理、几何结构与时间动态等底层连续信息，二者需求存在内在矛盾。Lance的创新之处，正是通过精巧的架构设计，在一个模型中平衡并兼顾了这两种看似冲突的目标。

共享上下文与能力解耦并行的架构设计

为实现原生统一，Lance采用了“共享上下文，能力解耦并行”的架构。所有输入的文本、图像和视频首先被转换为统一的交错序列，随后送入一个双流专家架构。其中一条专家流专门处理理解任务，另一条则专注于生成任务，实现能力解耦。

具体实现上：文本标记源自Qwen2.5-VL的嵌入层；对于侧重理解的视觉输入（如图像描述、视觉问答），模型使用Qwen2.5-VL的ViT编码器提取语义化视觉标记；对于侧重生成的视觉输入（如图像/视频编辑参考），则通过Wan2.2的3D因果VAE编码为连续潜在表示，并进行了16倍空间下采样与4倍时间下采样。

在注意力机制方面，模型在完整上下文序列上应用了广义3D因果注意力。文本采用因果注意力（仅可见前文），而视觉标记采用双向注意力（可见完整视觉上下文），从而更好地建模视觉元素间的复杂关系。

解决多模态序列边界模糊的难题

当序列中混合文本、图像块、视频帧等多种标记时，模型容易混淆不同视觉内容的边界。为此，Lance引入了创新的MaPE（模态感知旋转位置编码）技术。

该技术通过为不同模态的标记组添加固定时间偏移，在保持图像空间结构与视频时序连贯性的同时，清晰界定序列中各类视觉标记的起止范围。这相当于为不同来源的数据打上独特标识，使模型能准确识别和处理混合模态信息。

四阶段高效训练与可控算力投入

复杂能力的集成依赖科学的训练策略。Lance的训练分为四个渐进阶段：

预训练阶段：使用约10亿图文对和1.4亿视频-文本对，总计约1.5万亿标记，构建多模态通用基础能力。

持续训练阶段：引入图像/视频编辑、主体驱动生成及复杂多模态理解数据，规模约3000亿标记，塑造专项任务能力。

监督微调阶段：使用720亿标记的高质量指令数据，重点提升模型遵循复杂指令的能力以及在生成任务中保持身份一致性的能力。

强化学习阶段：采用创新的“组相对策略优化”方法，结合PaddleOCR作为奖励模型，专门优化生成内容的文字渲染准确度与图文对齐质量。整个训练过程的算力预算控制在最多128张GPU内，在动辄需要数千张卡的大模型训练背景下，展现出极高的效率与实用性。

基准测试表现与性能评估

在实际评测中，Lance在“统一多模态模型”类别中表现卓越：

图像生成方面：在GenEval基准上获得0.90总分，与优秀模型TUNA并列前茅。

视频生成方面：VBench总分达到85.11，超越TUNA（84.06）、HunyuanVideo（83.43）和Wan2.1-T2V（83.69）。

图像编辑任务：GEdit-Bench得分达到7.30。

视频理解方面：MVBench得分达到62.0，显著高于7B参数量的Show-o2模型（55.7）。

测试数据表明，Lance在保持模型轻量化的同时，在多模态理解与生成的多个关键维度均达到了行业领先的竞争力。

开源信息与获取方式

Lance模型已全面开源，采用宽松的Apache 2.0许可证，模型权重已在Hugging Face平台发布。运行推理需准备Python 3.10以上环境、CUDA 12.4及以上版本，以及至少40GB显存。这为AI开发者与研究人员提供了高效、易用的轻量级多模态基础模型选择。

来源:https://www.ithome.com/0/953/848.htm

上一篇：昆仑万维股价三日跌超7% 景顺长城基金持股市值缩水逾百万

下一篇：发改委发声提振市场信心迅策智谱股价双双大涨创新高

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

华宝基金重仓云天励飞浮亏73万股价下跌3.05%

华宝基金重仓云天励飞浮亏73万股价下跌3.05%

5月27日，云天励飞股价下跌3 05%，收于74 66元。华宝基金旗下上证科创板人工智能ETF重仓该股，一季度末持有31 2万股，此次股价波动致其单日浮亏约73 32万元。该基金今年以来收益率达27 82%，表现居同类前列。

时间：2026-05-27 14:19

WorkBuddy员工知识沉淀与经验共享操作指南

WorkBuddy员工知识沉淀与经验共享操作指南

WorkBuddy通过五步路径帮助企业沉淀和共享员工经验：建立个人知识库并自动归档文件；为知识注入身份与场景信息；封装标准化操作为可复用技能包；接入平台实现跨角色秒级检索与追溯；最后通过智能协同生成结构化经验文档，提升知识梳理效率。

时间：2026-05-27 14:17

CodeBuddy代码异常处理与错误边界优化指南

CodeBuddy代码异常处理与错误边界优化指南

代码写得顺风顺水，一跑起来却总被各种异常“偷袭”？这大概是不少开发者的日常。异常处理和错误边界，就像程序的免疫系统，平时看不见，一旦出问题就是大的麻烦。手动补全这些防御性代码，既繁琐又容易遗漏。好在，现在有了一些智能工具能帮上大忙。比如 CodeBuddy，它就像一位专注代码健壮性的副驾驶，能通过

时间：2026-05-27 14:16

豆包AI分析小说主题与人物关系详细教程

豆包AI分析小说主题与人物关系详细教程

借助豆包AI分析小说时，可采用结构化方法提升精准度：分段输入文本，设定明确人物锚点，聚焦具体互动；通过从行为到模式的递进提问，推导主题内核；构建动态人物关系图谱，追踪演变并标注可信度；预设禁忌词汇，促使AI使用更精确表述；利用未解伏笔设计回收路径，通过细节动作的可行性校

时间：2026-05-27 14:15

CanvaAI二维码打印清晰设置指南与关键要点

CanvaAI二维码打印清晰设置指南与关键要点

在Canva中利用AI生成二维码后，若打印时出现边缘模糊、模块不清、定位点识别困难或颜色不均等问题，通常源于导出参数未达到专业印刷标准。为确保二维码清晰可扫，以下关键设置必须逐一落实。一、选择PDF印刷格式并锁定CMYK色彩与300 PPI分辨率二维码能否被快速准确识别，取决于黑白模块间的高对比

时间：2026-05-27 14:14

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

博德之门3自定义战役第二章延期原因与上线时间

博德之门3最后之光旅店伊索贝尔手套使用技巧

奥特曼英雄决战公测时间确定预约入口与上线日期一览

博德之门3为何因会计问题取消原版开发

冰霜法师选技大乱斗玩法冰暴大招流实战教学

博德之门3主机版模组更新新增猫娘影心与提夫林子种族

异人之下手游开发商与制作工作室背景全解析

博德之门3哈尔辛演员谈熊场景幕后趣事

时空猎人觉醒礼包码最新可用兑换码领取攻略

奥特曼超时空英雄无法登录原因与公测时间解析

漫蛙漫画防走失网页链接

2026年烈焰觉醒真实礼包码免费领取永久兑换

星之破晓4GB运行内存能流畅玩吗游戏配置要求详解

Wizardry Variants Daphne官网地址与游戏攻略指南

0.1折手游超越黎明清凉版官方正版下载

星之破晓集卡活动参与方法与玩法全攻略

小小仙王清凉版官方下载免费获取正版安装包

星之破晓星魂战场位置与玩法全攻略

幻界之境最新兑换码大全免费领取全部礼包码

乱涂彩世界游戏需要多大内存空间

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

红色沙漠纯黑色染料获取方法详细攻略

红色沙漠纯黑色染料获取方法详细攻略发布于 2026-05-27

新区修炼与天策符搭配全攻略

新区修炼与天策符搭配全攻略发布于 2026-05-27

宝宝技能培养指南三招轻松掌握关键能力

宝宝技能培养指南三招轻松掌握关键能力发布于 2026-05-27

奥奇传说手游渡魂之镰阵容搭配推荐

奥奇传说手游渡魂之镰阵容搭配推荐发布于 2026-05-27

奥奇传说手游梦之队哆啦梦梦获取方式详解

奥奇传说手游梦之队哆啦梦梦获取方式详解发布于 2026-05-27

奥奇传说手游水系精灵强度排行榜最新

奥奇传说手游水系精灵强度排行榜最新发布于 2026-05-27

奥奇传说手游弥娅技能强度解析与实战评测

奥奇传说手游弥娅技能强度解析与实战评测发布于 2026-05-27

深海迷航2铅矿高效采集位置与实用技巧

深海迷航2铅矿高效采集位置与实用技巧发布于 2026-05-27

教师资格证考试报名官网登录入口及报考流程指南

教师资格证考试报名官网登录入口及报考流程指南发布于 2026-05-27

三角洲行动4月14日摩斯密码今日最新兑换码分享

三角洲行动4月14日摩斯密码今日最新兑换码分享发布于 2026-05-27

裁决战歌暗器系统详解与玩法全攻略

裁决战歌暗器系统详解与玩法全攻略发布于 2026-05-27

王者荣耀谋士开荒阵容搭配攻略

王者荣耀谋士开荒阵容搭配攻略发布于 2026-05-27

巫师3狂猎新DLC直播活动官宣即将上线

巫师3狂猎新DLC直播活动官宣即将上线发布于 2026-05-27

三国天下归心游戏开发商是哪家公司

三国天下归心游戏开发商是哪家公司发布于 2026-05-27

超级高尔夫大乱斗夏季登陆PS5与Xbox Series主机

超级高尔夫大乱斗夏季登陆PS5与Xbox Series主机发布于 2026-05-27

芳草地Yerba Buena发售超现实解谜平台冒险游戏上线

芳草地Yerba Buena发售超现实解谜平台冒险游戏上线发布于 2026-05-27

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程发布于 2026-05-25

Linux系统修改默认网关命令与永久生效配置教程

Linux系统修改默认网关命令与永久生效配置教程发布于 2026-05-25

麒麟系统开机自启动脚本设置方法详解

麒麟系统开机自启动脚本设置方法详解发布于 2026-05-25

麒麟系统安装IntelliJ IDEA插件扩展开发功能

麒麟系统安装IntelliJ IDEA插件扩展开发功能发布于 2026-05-25

Windows 11 RP预览版25145发布及KB5089573更新日志详解

Windows 11 RP预览版25145发布及KB5089573更新日志详解发布于 2026-05-25

Windows 11 26H1预览版28000.2173更新日志KB5089570详解

Windows 11 26H1预览版28000.2173更新日志KB5089570详解发布于 2026-05-25

Win11预览版26300.8493更新本地文件搜索排序优先

Win11预览版26300.8493更新本地文件搜索排序优先发布于 2026-05-25

Win11预览版8521修复音频与通知问题

Win11预览版8521修复音频与通知问题发布于 2026-05-25

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集