智能化如何主导未来?林俊峪离职后首次撰文深思
3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文详谈自己对大模型发展路线的理解及对AI下一阶段的预判。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI的o1表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但2025年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

前千问大模型技术负责人林俊旸
他提到,2025年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。
真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。
分开做在实践中仍然有吸引力。2025年下半年,Qwen 的2507版本就发了独立的 Instruct 和 Thinking 版本,30B 和235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。
“推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示,他提到,千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。
智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。
这意味着,核心问题从“模型能否思考得足够久?”转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。
在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。
林俊旸预测,智能体式思考会成为主流。
责任编辑:李超_NB12814
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
探秘第四代高能同步辐射光源HEPS限时打卡指南
在粒子物理与核探测技术领域,要捕捉并解析那些瞬息即逝的基本粒子和高能射线,必须依赖一种特殊的“感知之眼”——粒子探测器。而构成这双“眼睛”最核心的感光部件,往往是一块块高度纯净、性能卓越的人工闪烁晶体。这类晶体能够将高能粒子或射线所携带的能量,高效转换为可供记录与分析的光信号,从而成为现代高能物理实
杭州街道遭电商抵制背后:无理由退货引发的规则博弈
近期,杭州萧山区盈丰街道被国际奢侈品牌圣罗兰列入“发货黑名单”的消息,在电商圈内引发广泛关注。业内人士分析,这很可能是商家针对特定区域恶意退货率持续偏高所采取的无奈之举。事实上,将某个地区甚至具体街道设置为限制发货区域,在技术层面已十分成熟,且近期类似操作已在全国多地悄然出现。 有电商经营者透露,尽
莫氏鸡煲为何开业仅一月就客流锐减无人排队
流量时代的风口,生命周期往往短得惊人,能撑过三个月都算幸运儿。这背后,是注意力经济的残酷法则。 不知道各位还记不记得,一个月前全网刷屏的那家“最不想火的鸡煲店”?当时,老板老莫对着镜头直言味道一般,劝大家别跟风,甚至贴出告示提醒“喝汤可能拉肚子”。结果呢?这股“爱来不来”的桀骜劲儿,反而引爆了网络,
谷歌披露黑客利用AI开发零日漏洞攻击工具
谷歌安全团队近期披露了一起具有里程碑意义的网络攻击事件:一个网络犯罪组织利用人工智能技术,成功开发出一款能够自动探测并试图利用某款主流系统管理软件中未知安全漏洞的黑客工具。 这起事件的性质远超普通网络攻击。根据谷歌发布的详细报告,这是全球首次有确凿证据证实,人工智能被直接用于生成针对“零日漏洞”的自
2030年车企生死线:300万辆销量成行业新基准
当北京车展的聚光灯聚焦于新车发布时,一场关于未来生存法则的深度思考,正在行业内部引发广泛共鸣。 就在许多车企仍在为年度销量目标奋力冲刺之际,长安汽车已将战略视野投向了更具决定性的2030年。在中国长安汽车集团总裁赵非看来,那并非一个遥远的未来,而是一道严峻的行业“分水岭”。他近期明确提出了判断车企生
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

