斯坦福研究：上下文比参数重要，无需重训的AI新突破

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

斯坦福研究：上下文比参数重要，无需重训的AI新突破

热心网友时间：2025-10-31

转载

近期，斯坦福大学与SambaNova Systems共同发布了一篇题为《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》的研究论文。

该研究提出了一套名为ACE（Agentic Context Engineering）的创新框架，使人工智能无需重新训练模型参数即可实现持续的自我优化。

论文链接： http://arxiv.org/abs/2510.04618v1

研究的核心观点在于，大语言模型的能力表现不仅取决于参数规模，更关键的是其接收的"上下文质量"。简而言之，谁能构建出最优质的上下文环境，谁就能让模型展现出更卓越的智能水平。

ACE框架的突破性理念，在于让模型摆脱对"静态提示"的依赖，转向采用动态化、结构化、可迭代的"知识剧本"模式。

这些剧本完整记录了模型在任务执行过程中积累的策略规则、操作模板和修正方案。无论任务成功与否，每次运行结果都会被转化为一条"增量更新"记录。

与传统的"重写提示"方式不同，ACE通过小步安全更新的方式持续改进剧本内容，而非推倒重来的粗暴修改。

这种机制意味着，AI系统能够在实际运行中持续学习、记忆并改进，完全不需要进行任何参数微调。

ACE框架架构解析

研究团队指出，这种创新机制能有效避免两类常见问题：一是简化偏误，即在追求简洁优化的过程中丢失关键细节；二是上下文崩塌，即重写导致的知识结构损坏。

论文中举例说明，在实验环境中，一个AI代理积累了1.8万token的上下文知识，表现出色。但当模型试图"总结压缩"这些内容时，剧本被大幅削减至仅122个token，性能指标立即下滑57.1%。

研究人员直言："模型擅长使用知识，却不擅长整理知识。一次错误的重写操作，就可能摧毁全部的经验积累。"

该论文强调，ACE从根本上解决了这种"自毁式学习"的结构性风险。

图示说明：ACE框架在三类任务（智能体操作、领域知识推理、数值分析）上均显著优于其他方法，准确率提升最为明显。

三角色协作：生成、反思、策展

ACE体系建立在一条简单而深刻的核心理念之上：不要重写知识，而要管理知识。

整个系统被拆分为三个功能互补的智能角色。

首先是生成器。它负责执行具体任务，与环境进行交互，生成推理过程、代码或操作序列。

第二个是反思器，负责分析生成器的行动轨迹，识别成功与失败的关键因素，提炼"可操作的教训"。这些反馈信号可能源自代码错误、执行结果或外部标签。

第三个是策展器，它将积累的经验提炼为结构化条款，并通过确定性规则将有效内容整合进主剧本。

这样的三层循环机制——行动、反思、整合——构成了ACE的完整学习闭环。

每次更新仅影响局部条款，不会触及整体文本结构。

这种局部增量机制，使得知识库既能持续扩展，又不会发生系统性崩塌。

剧本本身采用项目化结构设计：包含策略规则、API调用模板、调试经验、常见错误解决方案等。每个条款都附带使用计数与正负反馈元数据。

反思器会基于这些记录判断哪些规则有效、哪些需要淘汰。策展器则据此进行修改或删除操作。

论文指出，这种方式让AI的知识体系"如同Git版本库一样持续演进"，能够安全地生长、精细地修剪、透明地追溯。

研究团队强调，ACE的复杂度并非负担，而是一套结构化的安全保障机制，以微小的系统开销换取知识的稳定积累。

小模型"越级挑战"：DeepSeek击败GPT-4.1

在复杂的AppWorld代理任务测试中，ACE框架带来了平均10.6%的性能提升，并将适应延迟降低86.9%。

研究团队特别指出，这种提升并非依赖更庞大的模型，而是源于更高效的上下文管理。

一个典型例证是：DeepSeek V3.1模型的参数量明显低于GPT-4.1。但在ACE框架支持下，它在AppWorld基准测试中与GPT-4.1代理表现相当，甚至在更复杂的测试集上实现了反超。

研究结果表明，"上下文工程"已成为新的算力平衡器。

更重要的是，ACE展现出惊人的效率优势。在多轮任务学习中，其更新延迟减少82%至91%，token使用成本下降83.6%。

图表说明：在金融分析任务中，ACE框架显著提升模型表现，即便缺乏真实标签数据也能保持稳定输出。

论文认为，这让"在线持续学习"从概念走向现实。AI不再需要频繁微调，而是能在运行中自主优化。

同时，ACE的结构化剧本使得学习过程可解释、可审计、可撤销。

如果某条规则被发现过时、存在偏见或违反规范，系统可以精准删除对应条款，实现"选择性遗忘"。

来源:https://36kr.com/p/3532732267420546

上一篇：字节再出海新战略：这次打法有何不同？

下一篇：中国游戏破局全球市场：AI时代出海的关键竞争力

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

HMDGlobal推出4款诺基亚功能手机，均配1450mAh可拆卸电池及独立AI按键，支持语音控制，免费180天后付费。部分机型带摄像头，支持microSD卡扩展至32GB，具双SIM卡、3 5mm接口及蓝牙5 0。

时间：2026-07-05 13:32

云南以旧换新补贴扩围新增智能影音与无人机

云南省自2026年7月起扩大消费品以旧换新补贴范围，新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴，每类每件最高1500元，商户报名无限制。

时间：2026-07-05 13:31

小米Redmi 7英寸高性能手机传闻即将发布

最近圈内又有新动静了。据博主 @数码闲聊站今天爆料，某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型：一块是 6 59 英寸的中屏 Pro，另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看，基本可以锁定是小米 REDMI 品牌的产品线布局。有意思的是，早在今年 2 月，这位博

时间：2026-07-05 13:31

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

深光影像AF35mmF2 2CE全画幅镜头开售，提供E卡口和L卡口，标准版七百三十九元，套装版七百八十九元。全金属机身，重约一百七十五克，高三十六毫米，滤镜口径五十二毫米，光学结构五组七片，九片光圈叶片，最近对焦零点三五米，支持自动对焦。

时间：2026-07-05 13:30

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

罗德施瓦茨联合研究机构 NVIDIA推出Isaac Nova Orin

Nexperia发布增强型电热模型罗姆开发新一代8英寸SiC MOSFET

研华DeviceOn/BI工业审核通过罗姆SiC MOSFET性能优势

Jupiter发币倒计时深度解析其产品与商业模式

NVIDIA推DRIVE Map多模式地图平台罗德与施瓦茨宣布卫星工业日计划

人工智能专业并非蹭热点 AI治理风险需警惕

阿里Qwen2.5-Omni-7B发布，听看读写性能强劲

NVIDIA医疗设备AI计算平台与瑞芯微芯片解决方案发布

阿里云万卡集群组网实战：算力网络解析

NVIDIA发布DGX H100系统罗德与施瓦茨推O-RAN无线电单元方案

ATK GEAR全面拥抱星闪生态加速无线互联升级

苹果发布M5 Pro与M5 Max 18核融合架构芯片

苹果M4处理器新款iPad Air发布无线连接增强

苹果iPhone 17e发布 4499元起 3月11日开售

币安Web3计算收益指南：如何参与DeFi新纪元并获取高回报

MWC荣耀双旗舰搭载骁龙8至尊版助力智能手机技术演进

开学季装备攻略希未AI全家桶搞定校园全场景需求

联想moto首款大折叠手机于MWC正式发布

三星Galaxy S26 Ultra上手 AI防窥屏隐私防护实用

内嵌天禧AI，ThinkPad与ThinkBook AI PC开工季上新

罗德施瓦茨联合研究机构 NVIDIA推出Isaac Nova Orin

Nexperia发布增强型电热模型罗姆开发新一代8英寸SiC MOSFET

研华DeviceOn/BI工业审核通过罗姆SiC MOSFET性能优势

Jupiter发币倒计时深度解析其产品与商业模式

NVIDIA推DRIVE Map多模式地图平台罗德与施瓦茨宣布卫星工业日计划

人工智能专业并非蹭热点 AI治理风险需警惕

阿里Qwen2.5-Omni-7B发布，听看读写性能强劲

NVIDIA医疗设备AI计算平台与瑞芯微芯片解决方案发布

阿里云万卡集群组网实战：算力网络解析

NVIDIA发布DGX H100系统罗德与施瓦茨推O-RAN无线电单元方案

相关攻略

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

2026-07-05 13:32

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

2026-07-05 13:31

云南以旧换新补贴扩围新增智能影音与无人机

2026-07-05 13:31

小米Redmi 7英寸高性能手机传闻即将发布

2026-07-05 13:30

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

2026-07-05 13:30

Caviar抢先发布定制版iPhone Ultra折叠屏售价13840美元起

2026-07-05 13:30

佳能EOS R8 Mark II全画幅无反9月发布复古设计成亮点

2026-07-05 13:30

System76 Adder Pro 15.3笔记本顶配酷睿Ultra 7与RTX 5070

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

幸福的二人房隐藏彩蛋大全发布于 2026-07-05

梦幻西游109化生寺平民属性合格标准发布于 2026-07-05

交错战线幽兰培养建议及阵容搭配攻略发布于 2026-07-05

梦幻西游仓库全部整理所需体力详解发布于 2026-07-05

选技大乱斗新手进阶上分攻略最强玩法指南发布于 2026-07-05

魔兽世界9.2大秘境装等掉落指南发布于 2026-07-05

动物城咖啡店下载渠道与官方下载地址大全发布于 2026-07-05

Valve正开发新物理引擎Ragnarok曝光发布于 2026-07-05

Win11频繁断网提示默认网关不可用怎么办发布于 2026-07-03

Mac如何取消正在进行的系统备份任务发布于 2026-07-03

电脑显示器刷新率锁死60Hz无法调整的解决方法发布于 2026-07-03

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程发布于 2026-07-03

博世洗衣机连接WiFi后手机无反应怎么办发布于 2026-07-05

九号电动车定位消失，重启能解决吗发布于 2026-07-05

东芝电饭煲复位键在面板哪个位置发布于 2026-07-05

家用扫地机器人推荐榜首吸力多大合适发布于 2026-07-05

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

斯坦福研究：上下文比参数重要，无需重训的AI新突破

三角色协作：生成、反思、策展

小模型"越级挑战"：DeepSeek击败GPT-4.1

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

云南以旧换新补贴扩围 新增智能影音与无人机

小米Redmi 7英寸高性能手机传闻即将发布

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

云南以旧换新补贴扩围新增智能影音与无人机