数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

MIT全新RandOpt算法，破解大模型训练久耗痛点

MIT全新RandOpt算法，破解大模型训练久耗痛点

热心网友时间：2026-03-16

转载

只需向模型添加高斯噪声，性能就能比肩甚至超越GRPO/PPO等经典调参算法。

MIT新论文向大家都在头疼的“调参”开炮了！

为了将预训练模型变成某一任务领域专家，无数人夜以继日，纷纷掉发。

然而现在，一对来自MIT的师生用一篇新论文告诉大家：

不用复杂调参，随机改改参数再整合结果，模型效果就能和GRPO/PPO等专业调参方法差不多。

在这篇论文诞生前，我们熟悉的论调是：专家模型是训练出来的。

甭管是靠梯度下降还是强化学习，都得一步一个脚印慢慢优化参数。

但这篇论文却揭示，专家模型早就存在，只是藏在权重空间里，预训练模型的真实形态be like：

专家模型像灌木一样密密麻麻长在周围。（即论文提到的“Neural Thickets（神经丛林）”现象）

△注：以上为AI生成，非论文内容

就是说，只要在预训练权重附近稍微扰动一下参数，就可能“碰到”一个新的任务专家。

基于此，作者进一步提出了一种非常简单的方法RandOpt：

只需向大语言模型添加高斯噪声（单步操作——无需迭代、无需学习率、无需梯度），然后将它们集成起来，就能在数学推理、编程、写作和化学任务上取得与标准GRPO/PPO相当甚至更优的性能。

而且作者发现，模型越大，效果越好。

预训练模型周围藏着“神经丛林”

简单来说，论文给出了一个反直觉的结论——

预训练模型周围早就存在大量“专家模型”。

在权重空间里，能解决不同任务的模型并不是零散分布的，而是密集地“长”在预训练权重附近。

所以理论上，并不一定需要复杂的训练过程，只要在这片区域里多试几次，就有机会找到表现不错的任务专家。

听到这里，估计很多人的反应是：啊这，难道这不就是靠猜、靠试吗？

没错，还真就是靠猜。

一直以来，随机猜测都被认为是不够靠谱的机器学习算法，比如随机猜出ChatGPT的参数向量，概率几乎为零。

但论文发现，到了预训练模型这里情况就变了——

模型权重周围，能提升任务表现的参数扰动变得很密集，所以随机猜测也能找到有效改进方案。

在论文中，作者对预训练的Qwen2.5模型（0.5B~32B）施加了1000次随机权重扰动，并通过随机投影将其投影到二维平面。

结果发现，模型越大，周围“高精度区域”越密集；小模型扰动后大多性能下降（蓝色区域），而大模型周围随处可见性能提升的“专家”（红色区域）。

换言之，模型越大，这种扰动效果越明显、越起作用。

而且需要注意，这些随机扰动最后带来的不是“全能选手”，而是“偏科战神”。

实验显示，没有任何一个随机改动能让模型在所有任务上都实现提升。例如，某一个改动能让模型数学算得更准，但写代码会变菜；另一个改动能让模型化学题做得好，但写故事不行。

并且同样的，模型越大，这种偏科越明显。

至于模型为啥会出现这种“周围偷偷藏一堆高手”的现象，论文也通过一个极简实验给出了初步解释。

他们选用了结构最简单、最容易看懂的1D信号自回归模型，让其学习预测一段时间序列信号的下一个数值。

结果出现了三种情况：

无预训练：不论怎么添加扰动，模型周围都完全找不到可以提升性能的改动，随机猜测无意义；单一任务预训练：模型只能把经过预训练的任务做到极致，参数周围不会冒出其他优质改动；多任务混合预训练：模型参数周围瞬间布满能提升性能的扰动，随便加个小改动，就能解锁擅长某类信号预测的专项能力，成功复刻“神经丛林”的密集状态。

由此论文得出核心结论，“神经丛林”现象的诞生，关键就在于大模型的海量多任务预训练。

换言之，正因为底子够足，所以周围很容易找到可以随机扰动的“专家”。

启发了RandOpt算法

而上述研究，也启发论文作者提出了一种新的算法，RandOpt。

RandOpt的运行机制可以分成简单两步：随机找高手+组队投票。

“随机找高手”就和前面提到的类似，给预训练模型的参数随机做N次扰动，然后就会得到N个“新版本模型”。

再用少量验证数据简单测一测这些模型，我们就能找出其中表现最好的K个。

拿到这K个模型后，接下来进入实战推理阶段——

让这K个“高手”各自回答问题，最后按“少数服从多数”的原则决定最终结果。

整个过程有两个值得注意的点：

一是在添加扰动sigmas（即噪声强度）时，RandOpt会尝试不同强度的噪声（比如小扰动、中扰动、大扰动），以确保能找到各种类型的专家。

二是这N个模型可以同时在多块GPU上运行，速度很快。

当然了，论文也试着用不同模型测试了这一新算法。

初步结果显示，对于纯语言大模型，在数学、编程、写故事、化学等任务上，RandOpt的准确率和现在主流的专业调参方法（PPO/GRPO/ES）差不多，有的甚至更高。

而对视觉-语言模型来说， RandOpt的提升作用则更加明显，准确率直接从56.6%涨到69.0%。

与此同时，除了语言和视觉-语言模型，论文也在图像扩散模型中观察到了类似的“神经丛林”现象——

参数空间的某些特定区域会倾向于生成具有特定色调或视觉风格的图像。

以及论文作者提醒，RandOp在以下情况下效果更佳：

随机改的次数越多，挑的“高手”越厉害。模型越大，RandOpt效果越好。

论文作者介绍

最后介绍一下这项研究的两位作者。

Yulu Gan，北大工程硕士，目前是MIT计算机科学与人工智能实验室（CSAIL）的博士生。

此前曾在微软实习，研究方向主要为多模态大语言模型、推理、多智能体系统以及AI for science。

另一位作者Phillip Isola是他的导师，现任MIT电子工程与计算机科学系副教授。

Phillip Isola在加州大学伯克利分校做完博士后研究后，曾在2017年以技术人员的身份加入OpenAI。

不过干了不到一年，后面又去谷歌当了一年访问学者。

再然后就是回到读研时的母校MIT，任教至今。

Phillip Isola的主要研究方向为AI基础理论和计算机视觉，曾参与提出pix2pix、LPIPS感知损失等经典工作，谷歌学术论文被引量超10w+。

通过本次研究，师徒二人想重新告诉大家：

是时候重新认识预训练模型了，它不只是“一个能用的模型”，更是“一堆高手的集合”。

只要预训练做得足够好，后续想让模型干好具体任务，根本不用复杂调参，像RandOpt这样随机改改、组队投票就行，省时间省算力。

不过缺点也很明显，大致呢有下面这几个：

依赖优质预训练，这是一个基本大前提。模型只能基于预训练数据找改进，无法让模型学会新技能。K越大效果越好，但推理时要跑K个模型，虽然蒸馏能缓解，但蒸馏不适用于所有场景（比如生成式任务）。只适合有明确答案的任务，像写故事、设计分子这种结构化生成任务，还需要进一步改进集成方式。

目前相关论文和代码已公开，感兴趣可以继续关注。

论文：
https://arxiv.org/pdf/2603.12228
GitHub：
https://github.com/sunrainyg/RandOpt
项目主页：
https://thickets.mit.edu/

来源:https://www.163.com/dy/article/KO5BMP5U0511DSSR.html

上一篇：吉利银河M7搭载神盾电池：主流电混SUV长续航新篇章

下一篇： DeepMind混合记忆突破：OpenClaw AI实现近2万帧3D重建

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

防范Agent间接越狱攻击的工程实践可信动作清单

防范Agent间接越狱攻击的工程实践可信动作清单

今天我们来深入探讨一个日益紧迫的现实挑战：当AI智能体（Agent）开始自主处理邮件、浏览网页、操作各类工具时，如何确保其行为不被恶意内容“带偏”？近期一篇题为《PlanGuard: Action-Level Guardrails for Language Agents via Reference

时间：2026-05-18 09:04

Java与LangChain4j实现RAG文档智能拆分提升检索质量

Java与LangChain4j实现RAG文档智能拆分提升检索质量

在AI驱动的RAG系统开发与后端面试中，文档切分策略是衡量工程深度的关键指标。简单回答“按固定字符数截取”往往暴露了项目经验的不足。业务场景中RAG的召回效果，数据预处理的质量占据了决定性因素。切片（Chunking）策略的优劣，直接为整个系统的召回能力设定了天花板。后续无论采用多么先进的大模型或精

时间：2026-05-18 09:04

Excel反向查找数据技巧：一句话快速匹配信息

Excel反向查找数据技巧：一句话快速匹配信息

本文目录 Excel反向查找的常见痛点 AI自动化处理效果预览 1 准备工作与数据要求 2 超简单的AI自动化解决方案详解第1步：规范整理你的原始数据表第2步：对目标文件下达清晰指令第3步：一键验收并拓展同类应用核心指令的底层逻辑与优势更多可直接套用的实战场景 1 快速填充联系人电话

时间：2026-05-18 09:04

2026年新车盘点 8款车型上市续航超两千公里起价6万多

2026年新车盘点 8款车型上市续航超两千公里起价6万多

2026年的汽车市场，热闹非凡。当许多人的目光被比亚迪秦L牢牢吸引时，一份涵盖8款新车的清单悄然浮现，价格从6万多横跨至12万多，最长续航甚至达到了惊人的2150公里。这场混战，让选择变得前所未有的丰富。燃油拥趸的新选择：2026款荣威i6 对于依然钟情于燃油车可靠与便利的消费者来说，2026款荣

时间：2026-05-18 09:04

福田汽车发布苍穹AI大模型赋能商用车全场景智能生态

福田汽车发布苍穹AI大模型赋能商用车全场景智能生态

在中国公路货运的庞大生态中，3800万卡车司机是当之无愧的基石力量。然而，这份职业长期伴随着超负荷工作与健康隐患的双重压力。行业调研数据显示，近40%的重型卡车司机年工作时长超过3600小时，夜间行车比例高达60%以上，而各类职业相关疾病的检出率已超过70%。更值得警惕的是从业者结构的老化趋势：45

时间：2026-05-18 09:04

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

永劫无间账号购买平台推荐与安全交易指南

梦幻魔法公主善恶值系统解析与调整方法指南

茶叶蛋的冒险第14关荡秋千怎么过图文通关攻略详解

无畏契约源能行动一局游戏需要多长时间

茶叶蛋大冒险第16关怎么过相对运动图文通关攻略

蓝色星原旅谣角色强度榜与技能实战解析

蔚蓝星球零氪微氪新手攻略 20条技巧助你开局避坑

茶叶蛋大冒险第18关通关攻略图文详解隐藏关卡怎么过

文字三国志游戏评测与新手玩法指南

茶叶蛋神秘之旅第28关怎么过遵守规则通关图文攻略

NS版饿殍明末千里行今日发售全流程攻略与剧情解析

洛克王国倒影暗域地图位置与进入方法详解

洛克王国奇丽花性格选择攻略与对战搭配指南

洛克王国铁居小堡技能组合与实战搭配攻略

洛克王国水晶地穴位置与进入方法详解

洛克王国月光桃源进入条件与VIP权限详解

DNF千海天版本光枪毕业装备搭配指南

DNF千海天版本驱魔师最强毕业装备搭配指南

植物大战僵尸网页版2026最新官方入口地址与登录指南

DNF千海天混沌魔灵毕业装备搭配攻略

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

永劫无间万钧惊天捏脸数据与二维码分享

永劫无间万钧惊天捏脸数据与二维码分享发布于 2026-05-18

永劫无间崔三娘琉璃私语捏脸数据与二维码分享

永劫无间崔三娘琉璃私语捏脸数据与二维码分享发布于 2026-05-18

永劫无间席拉月光爱人捏脸数据与二维码分享

永劫无间席拉月光爱人捏脸数据与二维码分享发布于 2026-05-18

洛克王国角斗场位置与前往路线详解

洛克王国角斗场位置与前往路线详解发布于 2026-05-18

洛克王国巨魔之眼技能石获取方法详解

洛克王国巨魔之眼技能石获取方法详解发布于 2026-05-18

洛克王国火之灵气获取位置与收集攻略

洛克王国火之灵气获取位置与收集攻略发布于 2026-05-18

洛克王国咕噜球获取指南与购买地点

洛克王国咕噜球获取指南与购买地点发布于 2026-05-18

怪物猎人荒野骑乘怪物技巧攻略详解

怪物猎人荒野骑乘怪物技巧攻略详解发布于 2026-05-18

Legacy战队官宣adrrr担任本赛季主教练

Legacy战队官宣adrrr担任本赛季主教练发布于 2026-05-18

K27租借fame短期加盟备战PGL阿斯塔纳赛事

K27租借fame短期加盟备战PGL阿斯塔纳赛事发布于 2026-05-18

IEM科隆Major参赛队伍首发与替补阵容公布

IEM科隆Major参赛队伍首发与替补阵容公布发布于 2026-05-18

NiKo与karrigan搭档的两年：职业生涯最佳时光回顾

NiKo与karrigan搭档的两年：职业生涯最佳时光回顾发布于 2026-05-18

传奇新百区盟重神兵4月23日开服时间与玩法介绍

传奇新百区盟重神兵4月23日开服时间与玩法介绍发布于 2026-05-18

异环全平台公测今日开启 PC安卓iOS鸿蒙多端数据互通

异环全平台公测今日开启 PC安卓iOS鸿蒙多端数据互通发布于 2026-05-18

地铁2039获原著作者盛赞：史上最黑暗作品之一

地铁2039获原著作者盛赞：史上最黑暗作品之一发布于 2026-05-18

半条命3发售日期曝光或年底上线并推出新Steam Machine

半条命3发售日期曝光或年底上线并推出新Steam Machine 发布于 2026-05-18

Mac清理Spotlight索引与修复搜索无果的完整指南

Mac清理Spotlight索引与修复搜索无果的完整指南发布于 2026-05-17

Mac科学计算器使用指南：开启与操作高级模式详解

Mac科学计算器使用指南：开启与操作高级模式详解发布于 2026-05-17

麒麟系统安装Anaconda与Python环境配置教程

麒麟系统安装Anaconda与Python环境配置教程发布于 2026-05-17

Mac清理Unity缓存教程释放磁盘空间优化游戏开发

Mac清理Unity缓存教程释放磁盘空间优化游戏开发发布于 2026-05-17

统信UOS系统批量重命名文件方法详解

统信UOS系统批量重命名文件方法详解发布于 2026-05-17

Mac版小红书清理缓存释放磁盘空间详细教程

Mac版小红书清理缓存释放磁盘空间详细教程发布于 2026-05-17

统信UOS手动安装软件教程应用商店没有所需软件怎么办

统信UOS手动安装软件教程应用商店没有所需软件怎么办发布于 2026-05-17

苹果电脑如何在PDF文件中添加手写签名

苹果电脑如何在PDF文件中添加手写签名发布于 2026-05-17

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集