当前位置: 首页
AI
伯克利研究揭示持续学习优势 OpenAI面临新挑战

伯克利研究揭示持续学习优势 OpenAI面临新挑战

热心网友 时间:2026-05-19
转载


AI工程师Dan McAteer最近有个大胆的预言:2026年,持续学习(continual learning)将迎来爆发。这个判断的底气,来自伯克利等机构刚刚发布的一项突破性研究。


他们提出的FST框架,通过一种“快慢分层”的机制,让大模型在连续学习多个任务时,既能快速适应新知识,又能牢牢记住旧本领,从而有望解决困扰AI领域长达三十年的“灾难性遗忘”死局。有观点认为,这一突破的意义,可能远超当前火热的推理能力变革。


当“推理天才”遭遇“学习失忆”

过去两年,整个AI圈的叙事几乎被“推理”一词垄断。从OpenAI的o系列到DeepSeek的R1,再到Claude的思考模式,头部实验室的产品形态各异,但内核高度一致:提升模型的深度推理能力,被视为通往更高级智能的必经之路。

这个共识如此之强,以至于在今天,如果一个项目不能讲清楚自己在“推理”上的布局,恐怕连投资人的第一轮门槛都迈不过去。

然而,我们似乎忘了追问一个根本问题:什么是真正的智能?

不妨打个比方:一个学生,能在高考考场上对任何一道题目进行无懈可击的深度推理,逻辑链条完美。但前提是,他的知识库永远停留在16岁初中毕业的那一刻,此后再未更新。你会将这种能力称为“智能”吗?

这并非修辞,而是当前最先进大语言模型的真实写照。无论是GPT-5、Claude还是Gemini,它们在每次对话开始时,都像一个“昨日毕业、今日醒来”的天才——可以在单次会话中越挖越深,但只要对话框关闭,记忆便瞬间清空,回归到出厂设置般的状态。

它们就像数字世界的西西弗斯,不断将“推理”的巨石推向山顶,但每一次起点都是山脚,永无积累。


一堵三十年未被推倒的墙

为什么模型无法从与你的对话中学习?为什么昨天教它的东西,今天它就忘得一干二净?

这背后是AI领域一个长达三十年的经典难题:持续学习。其目标是让模型像人类一样,能够“温故而知新”,在不断吸收新知识的同时,不遗忘旧技能。然而,这条路上横亘着三个顽固的“老对手”:

  1. 首因偏差:模型早期学到的数据会顽固地主导其后续的学习策略,形成难以扭转的思维定式。
  2. 损失函数弹性:模型每学会一个新任务,其神经网络的“可塑性”就降低一分,最终会彻底丧失学习新事物的能力。
  3. 灾难性遗忘:这是最著名的问题。当模型学习新任务时,旧任务的能力会突然崩塌。让它学数学,它可能就忘了怎么写代码。


这些问题在小模型时代就已存在。进入大模型时代,它们并未消失,只是被一种“鸵鸟策略”暂时掩盖了:我们干脆放弃了让模型在部署后持续学习,只在训练阶段一次性灌注海量知识,之后便将其“冻结”。

因此,我们今天使用的所有大模型,本质上都是“冻结的天才”——强大,但活在永恒的当下;聪明,却无法变得更聪明。


破局思路:向大脑学习“快慢分工”

最近,由Databricks、伯克利和经典机器学习学派研究者组成的豪华团队,在这堵墙上撬开了一道缝隙。这项研究阵容堪称梦幻,包括Databricks联合创始人兼Apache Spark作者Matei Zaharia、伯克利教授及vLLM作者之一Joseph Gonzalez,以及机器学习元老级人物Inderjit Dhillon等。


他们提出的FST框架,核心思想朴素而深刻:不要让同一组参数去承担两个相互冲突的职能

在传统的强化学习训练中,模型的同一组参数既要负责“快速适应当前任务的特殊性”,又要承担“保留通用推理能力”的职责。前者要求参数灵活变化,后者则要求其保持稳定,这本身就是一对矛盾。

FST的解决方案是进行“快慢分工”。它将模型参数分为两套权重:

  • 慢权重:负责沉淀通用的、长期稳定的知识与推理能力,更新频率很低。
  • 快权重:负责快速记忆和适应眼前的新任务、新上下文,更新非常灵活。

两者交替更新:每隔一段时间用强化学习微调慢权重,同时利用一个名为GEPA的提示词优化器自动演化快权重。


这并非凭空想象,其灵感直接来源于人类大脑的“互补学习系统”理论。我们的大脑正是这样工作的:海马体作为“快权重”,能在几分钟内记住会议上的某句发言;而新皮层作为“慢权重”,则用数月甚至数年的时间,将海马体中那些真正有价值的信息,缓慢而稳固地整合进长期记忆结构。


FST首次在大模型中实现了这种类脑的分层学习结构。实验结果也相当亮眼:

  • 在代码推理任务上,FST仅用传统方法三分之一的训练步数就达到了同等性能。
  • 在匹配准确率的前提下,FST训练出的模型,其知识分布与基础模型的差异比传统方法低70%,意味着“遗忘”大幅减少。
  • 最关键的可塑性测试显示,在连续学习多个任务后,传统方法训练的模型几乎完全丧失了学习新任务的能力,而FST模型则几乎能恢复到初始水平,继续高效学习。



当然,FST远非一个完美的终极算法。其工程实现仍处于早期,其中的GEPA优化器等组件也完全可以被其他技术替代。

但这项工作的真正价值,不在于提供了一个“银弹”,而在于它确立了一种全新的“范式语言”——“快慢分工”。它第一次让持续学习从一个令人望而生畏的理论难题,变成了一个可被工程化探索和解决的方向。

下一轮博弈,已然开局

关于持续学习的未来,业界的共识正在形成,但远未统一。

OpenAI前首席科学家Ilya Sutskever认为,超级智能应被重新定义为一个“持续学习器”,而非一个训练完毕的静态AGI。他预估,实现这一目标可能需要5到20年。这个时间表虽然保守,但也暗示了他认为问题终将被解决。

而像Karpathy这样的研究者,则更关注实现路径。他认同持续学习是“真问题”,但怀疑现有技术路径是否足够。

无论如何,风向已经开始转变。如果说以深度推理为核心的竞争是2024年开局、预计2026年收尾,那么以持续学习为标志的新时代,其发令枪已经在2026年响起。技术演进的浪潮从不等人,下一轮关乎AI本质能力的博弈,不会等到2027年才拉开帷幕。

标题:Learning, Fast and Slow: Towards LLMs That Adapt Continually

预印本:https://arxiv.org/abs/2605.12484

项目主页:https://gepa-ai.github.io/gepa/blog/2026/05/11/learning-fast-and-slow/

来源:https://www.163.com/dy/article/KT99BJPA0511ABV6.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
腾讯Ardot设计智能体公测上线 一键将设计稿转为前端代码

腾讯Ardot设计智能体公测上线 一键将设计稿转为前端代码

腾讯AI设计工具Ardot开放公测,可将自然语言描述直接转化为可编辑设计稿并一键生成代码。该工具旨在简化设计开发流程,用户用语言描述界面即可实时生成可调整的初稿并转换为可用代码,有助于提升原型验证与团队协作效率,降低实现门槛。其实际价值取决于生成精度、交互能力及代码质。

时间:2026-05-19 09:28
阿里云峰会5月20日重磅发布全新升级千问大模型

阿里云峰会5月20日重磅发布全新升级千问大模型

千问大模型宣布将于5月20日阿里云峰会推出更全能、强大的“新朋友”,可能为全新大模型或多模态AI平台,预示技术路径与产品格局新变化。该发布与云生态深度绑定,将推动AI应用拓展、成本优化及生态开放,引发行业新浪潮。

时间:2026-05-19 09:28
云境标书AI加入英伟达初创加速计划 AI赋能招投标行业新突破

云境标书AI加入英伟达初创加速计划 AI赋能招投标行业新突破

云境标书AI”入选NVIDIA初创加速计划,获得技术、专家及生态资源支持。该产品专注于招投标领域,利用AI技术高效解析文件、生成内容,并内置合规风控与多行业知识库。其服务注重数据安全与用户所有权,提供免费基础功能与灵活付费模式,旨在提升投标效率与中标率。

时间:2026-05-19 09:28
酷开企业AI操作系统发布 引领企业管理AI原生转型

酷开企业AI操作系统发布 引领企业管理AI原生转型

酷开科技发布原生AI企业操作系统,旨在将战略目标转化为可执行、可追踪的数字化流程。该系统通过企业、岗位、个人及任务四大智能体协同运作,在“人机协同”原则下提升管理效率。同时,酷开配套提供理论书籍与咨询服务,形成完整转型方案,助力企业特别是中小企业迈向AI原生管理新阶段。

时间:2026-05-19 09:28
如祺出行AI数据战略:以高价值场景驱动世界模型训练

如祺出行AI数据战略:以高价值场景驱动世界模型训练

具身智能发展面临高质量数据短缺挑战。如祺出行依托平台优势,日均产出1600小时多模态真实场景数据,完整覆盖驾驶决策与反馈链条,为世界模型训练提供稀缺资源。公司已构建从采集到标注的全栈数据服务能力,业务拓展至自动驾驶、具身智能与大模型等领域,并与多家头部企业达成合作。

时间:2026-05-19 09:27
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程