Meta分割一切3.0推出，新增概念提示实现语义分割新玩法

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

Meta分割一切3.0推出，新增概念提示实现语义分割新玩法

热心网友时间：2025-10-13

转载

传统语义分割好无趣好无聊，技能语义分割加入概念提示，好好玩，要爆了。（doge） SAM 3——第三代“分割一切”模型刚刚被发现，已经悄然投稿ICLR 2026。论文还在双盲评审阶段，作者

传统语义分割好无趣好无聊，技能语义分割加入概念提示，好好玩，要爆了。（doge）

SAM 3——第三代“分割一切”模型刚刚被发现，已经悄然投稿ICLR 2026。

论文还在双盲评审阶段，作者匿名中，但标题暴露一切。

简单来说，就是在这个最新新版中，分割模型终于能听懂人话了：只要说出想要的东西，SAM 3就能在图像/视频中分割出对应实例。

比如，输入“条纹猫”，SAM 3自己就能找出并分割图中所有带条纹的猫猫：

值得一提的是，SAM 3处理一张含100多个物体的图片仅需30ms，对视频也有近实时处理能力。

能听懂人话的SAM

SAM 1引入了基于点、框、掩码等视觉提示的交互式分割任务，开辟了分割模型的新范式；SAM 2则在此基础之上，加入了对视频和记忆的支持。

这一次，SAM 3让这种交互式分割更进一步：支持基于短语、图像示例等概念提示的多实例分割任务——对，捎带手突破了前代只能处理单个实例的局限。

论文中，SAM 3的研究团队将这种新任务范式命名为PCS（Promptable Concept Segmentation）。

PCS：可提示概念分割

PCS的定义是，给定图像或视频，模型能够基于短语、图像示例，或者两者结合的方式，分割其中所有匹配提示概念的实例。

相比于传统分割任务，PCS强调：

开放性词汇：不局限于预定义的固定类别，支持用户输入任意名词短语作为分割目标；

全实例分割：找到并分割所有符合提示的实例，在视频中，还能保持不同帧之间的身份一致性；

多模态提示：支持多种提示输入，包括文本提示、视觉提示，以及两者结合的方式；

用户交互：允许用户通过交互进行分割结果的精细优化。

新架构设计

SAM 3为实现PCS设计了新的架构。

主要是在检测与分割模块上，SAM 3的检测器基于DETR（Deformable Transformer）架构，能够根据语言和视觉提示生成实例级的检测结果。

同时，引入了Presence Head模块，解耦物体的识别（是什么）和定位（在哪里）任务——

在传统对象检测框架中，模型往往需要同时判断目标是否存在、位置在哪里，这可能导致冲突，尤其是在多实例分割任务中容易出问题。

Presence Head将两者分开处理，从而进一步提升了模型的检测精度。

大规模数据引擎

为了改进PCS，研究团队还专门构建了一个可扩展的数据引擎，生成覆盖400万独特概念标签、5200万经过验证的掩码的训练数据集。

数据引擎由多阶段构成，能够逐步提升数据的多样性和难度。

整个构建过程中人类和大语言模型会相互检查彼此的工作，保证高质量的同时提升了标注的效率。

SA-Co基准

为了评估模型在开放词汇分割任务中的性能，论文还提出了SA-Co（Segment Anything with Concepts）基准。

SA-Co包含214K独特概念、124K图像和1.7K视频，概念覆盖范围能达到现有基准的50倍以上。

不过需要说明的是，SAM 3对语言的处理还局限于简单的短语提示，不支持复杂的语言表达，并不具备多模态大模型的语言生成、复杂语言理解和推理能力。

实验结果

实验结果表明，SAM 3在可提示分割任务中刷新了SOTA。

在LVIS数据集的零样本分割任务中，SAM 3的准确率达到了47.0，比此前的SOTA 38.5提升不少。

在新的SA-Co基准测试中，SAM 3的表现至少比基线方法强2倍。

另外，在针对视频的PVS（Promptable Visual Segmentation）任务中，SAM 3的性能也优于SAM 2。

研究人员还把SAM 3和多模态大模型（MLLM）相结合，探索解决更复杂的任务需求。

比如分割图片中“坐着但没拿礼物盒的人”。

大模型会先拆解需求，比如先找坐着的人，再排除拿礼物盒的人，然后给SAM 3发指令。

结果显示，SAM 3+MLLM的组合比专门做推理分割的模型效果还要好，并且无需专门的数据做训练。

在H200 GPU上，SAM 3处理含100多个实体的单张图像只需要30ms的时间。在视频任务中，推理延迟随着目标数量线性增加，能在约5个并发目标的情况下维持接近实时的性能。

不过，论文也指出，SAM 3难以通过零样本的方式，将能力泛化到如医疗图像、热成像之类的细分领域。

视频分割任务中，遇到多目标场景，模型的实时性能会下降，需要多GPU并行处理。

论文地址：https://openreview.net/forum?id=r35clVtGzw

来源:https://36kr.com/p/3507076060454021

上一篇：双十一延长至20天，即时零售成电商新增长引擎，满足多元人群需求

下一篇：诺奖成果实现芯片级应用：突破性技术赋能下一代计算

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

一位技工在客户家地下室发现一台属于AMD前CEORoryRead的旧PC，机箱上留有苏姿丰等高管签名，配置为推土机时代硬件且从未开机。这台电脑封存了AMD从推土机失败到Zen架构崛起的关键转折历史。

时间：2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Laravel12延续开发体验优势，在项目结构、查询构建、API开发、调试及性能上持续优化。其生态日趋成熟，形成Reverb、Pulse等完整工具链，覆盖API、SaaS、企业后台及AI应用开发。与Next js的组合逐渐流行，Laravel已演变为现代Web开发平台，保持社区活力。

时间：2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

LinuxKernel6 15重大更新：Rust驱动正式入主线，NOVADRM成为首个实践案例；io_uring新增零拷贝网络接收，降低CPU开销与延迟；Btrfs增强实时zstd压缩、DirectIO及稳定性。内核同步推进安全化与高性能网络化。

时间：2026-07-10 10:06

谷歌Gemini进入Agent时代打造全天候AI助理

Google推出GeminiSpark、Omni等新功能。Spark可全天候在后台运行，主动处理邮件、日历等任务；Omni侧重视频理解与环境推理，布局世界模型。AI正从被动回答转向主动观察、规划与执行，标志着竞赛进入新阶段。

时间：2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z2 20 2正式版发布，新增支持IntelPantherLake、WildcatLake、BartlettLake三大架构及AMD锐龙AIMax、Pro系列，加入锐炫G3识别库，修复缓存错误和锐龙77700X3D检测问题，免费下载。

时间：2026-07-10 10:05

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

热门数据榜

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

相关攻略

2026-07-10 10:06

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

2026-07-10 10:05

谷歌Gemini进入Agent时代打造全天候AI助理

2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

2026-07-10 10:05

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

2026-07-10 10:05

中国空间站成功培育出番茄

2026-07-10 10:05

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

北境酒馆实况我在中世纪经营知名酒馆发布于 2026-07-10

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧发布于 2026-07-10

战意三国7月24日定档违约最高送1亿电影票发布于 2026-07-10

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南发布于 2026-07-10

年大型手游排行榜前十人气耐玩网游大盘点发布于 2026-07-10

怪物猎人旅人冰原双刀强度解析与实战评测发布于 2026-07-10

女生最爱玩的热门高人气手游推荐下载合集发布于 2026-07-10

最新十大好用安卓手机飞机订票App推荐下载发布于 2026-07-10

如何用Linux查看网络数据包在内核的流向发布于 2026-07-10

如何在CentOS 7中修改文件系统配额的具体操作步骤发布于 2026-07-10

Linux查看具体硬件驱动列表的命令发布于 2026-07-10

电脑0x800401f3无效类字符串系统底层报错解决发布于 2026-07-10

奔驰电动GLC与理想i6怎么选，40万内家用优势对比发布于 2026-07-10

三星S20U设置5G后信号变差常见原因及解决方法发布于 2026-07-10

家用取暖器暖和又省电的选购指南与推荐发布于 2026-07-10

超声波加湿器如何安装使用更省电发布于 2026-07-10

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

Meta分割一切3.0推出，新增概念提示实现语义分割新玩法

能听懂人话的SAM

PCS：可提示概念分割

新架构设计

大规模数据引擎

SA-Co基准

实验结果

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

Laravel 12生态成熟助力全栈开发效率提升

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

谷歌Gemini进入Agent时代 打造全天候AI助理

CPU-Z 2.20.2正式版发布 支持Intel三大平台及AMD锐龙AI Max

谷歌Gemini进入Agent时代打造全天候AI助理

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max