LeCun新作JEPAs突破:不只学特征,还能感知数据密度
备受Meta审核规定“折磨”,依旧猛发论文!
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。
Yann LeCun团队新论文发现了自监督模型JEPAs(联合嵌入预测架构)的隐藏技能——
学会了数据的“密度”。
这里的“数据密度”可以理解成数据的常见程度:密度高的样本是更典型、更常见的数据,密度低的是少见的、甚至异常的数据。

JEPAs原本被视为仅擅长特征提取的模型,这次LeCun团队发现该模型在训练过程中悄悄掌握了感知数据常见程度的能力。
这就意味着,只要JEPAs训练成功了,不用额外做什么,就能用它来判断一个样本的常见程度。
打破了学界长期以来“JEPAs仅学特征、与数据密度无关”的认知。
核心发现:反坍缩能精准学习数据密度
要理解这一新发现的突破,首先来说一下JEPAs。

源自《A Path Towards Autonomous Machine Intelligence》图12
JEPAs作为LeCun团队近年重点推进的自监督学习框架,核心优势在于无需人工标注,模型就能自主从海量数据中学习特征规律,学完后就可以直接适配图像识别、跨模态匹配等下游任务,是AI领域高效学习的代表性模型。

此前学界普遍认为,JEPAs的训练只有两个核心目标:
一是latent空间预测。即给原始数据(如图像)做轻微扰动(裁剪、调色)后,扰动数据的特征表示(模型内部理解的数据形态)能从原始数据特征中精准预测; 二是反坍缩。防止所有样本的特征趋同一致。而论文的新发现就是从反坍缩中得来。
如果所有数据的特征都一样,模型相当于白学,所以过去大家都将反坍缩单纯视为避免特征失效的保障手段,没有意识到它还有更深层的作用。
LeCun团队就聚焦于反坍缩的的隐藏价值,研究通过变量替换公式与高维统计特性推导证明,反坍缩不仅能防止特征坍缩,更能让JEPAs精准学习数据密度。
从理论层面看,当JEPAs输出高斯嵌入(高维空间中近似均匀分布于超球面的特征)时,模型必须通过雅可比矩阵(反映模型对样本微小变化的响应程度)感知数据密度,才能满足训练时的约束条件,这意味着学习数据密度并不是偶然,而是JEPAs训练过程中的必然结果。

为了让这种隐藏的密度感知能力落地实用,团队还提出了关键工具JEPA-SCORE。
这是从JEPAs 中提取数据密度的量化指标,核心作用就是给样本的常见度打分。

根据公式来看计算逻辑简洁高效,只需要获取JEPAs处理目标样本时的雅可比矩阵,计算矩阵的特征值后取对数求和,得到的结果就是JEPA-SCORE,分数越高说明样本越典型(数据密度高),分数越低则样本越罕见或异常(数据密度低)。
更重要的是,JEPA-SCORE还具备极强的通用性,无限制适配,既不挑数据集,也不挑JEPAs架构。
无论是ImageNet、手写数字MNIST,还是未参与预训练的陌生数据(星云图集),都能精准计算;
不管是I-JEPA、DINOv2(单模态视觉模型),还是MetaCLIP(多模态模型),只要是成功训练的JEPAs家族模型,都能直接使用,且无需额外训练模型。
为了验证这一发现的可靠性,团队还开展了多组实验。
在ImageNet数据集中,不同JEPAs模型对典型样本(如飞行姿态的鸟类)和罕见样本(如栖息姿态的鸟类)的JEPA-SCORE判定高度重合,证明这是JEPAs的共性能力,并不是某个模型的偶然;
面对未参与预训练的星系图像数据集,其JEPA-SCORE显著低于ImageNet数据,说明模型能精准识别陌生数据;

而在数据筛选和异常检测的实用测试中,JEPA-SCORE的效果也优于传统方法。

数据筛选场景

异常检测场景
研究团队
此次研究并非LeCun一人之功。
另外三位核心研究者也都是Meta FAIR的研究员。
Randall Balestriero是布朗大学计算机科学助理教授,长期深耕人工智能与深度学习领域。

2013年起研究可学习信号处理,他参与的技术曾用于NASA火星车火星地震探测。
2024年获莱斯大学博士学位,后进入Meta AI做博士后,师从Yann LeCun。
Nicolas Ballas拥有法国格勒诺布尔大学博士学位。
2010年4月至9月,他担任了LTU Technologies的研发实习生,从事应用于图像检索的大规模聚类相关工作。
自2017年起,他在FAIR担任研究科学家,已任职超过8年。
Michael Rabbat是FAIR的创始成员,拥有伊利诺伊大学厄巴纳-香槟分校的工程学士学位、莱斯大学的工程硕士学位,以及威斯康星大学麦迪逊分校的电气工程博士学位。

他的研究方向聚焦于优化算法、分布式算法及信号处理三大领域。
加入Meta之前,Mike曾担任麦吉尔大学电气与计算机工程系教授。
论文地址:
https://arxiv.org/abs/2510.05949
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI能从单份血样检出多种神经疾病
来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一
褪去虚火,脑机接口方能释放长远价值
来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接
黎万强、洪锋退出小米科技股东名单
人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月
新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月 新华社记者张晓茹 美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

