首页
AI
斯坦福研究:上下文远比参数重要,无需重训的AI新突破

斯坦福研究:上下文远比参数重要,无需重训的AI新突破

热心网友
转载
2025-10-31

近日,斯坦福大学与SambaNova Systems合作发表了题为《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》的研究论文。

大数据文摘出品

斯坦福大学与AI计算公司SambaNova Systems在近期联合发布了一项突破性研究,提出了一种名为ACE(自主上下文工程)的创新框架。

该框架的核心价值在于,使人工智能系统无需重新训练模型参数的情况下,就能够实现持续的自我优化和性能提升。

图片

论文链接:http://arxiv.org/abs/2510.04618v1

这项研究的核心理念在于,大型语言模型的实际能力不仅取决于参数规模,更关键的是"上下文质量"的构建水平。换句话说,谁能设计出最优的上下文结构,谁就能让模型表现出更出色的智能水平。

ACE框架的根本突破在于,它让模型不再依赖静态提示,转而采用动态、结构化且可迭代的"知识剧本"作为指导。

这些剧本详细记录了模型在任务执行过程中积累的策略、规则、模板和修正方案。无论是成功经验还是失败教训,都会被转化为一段"增量更新"信息。

与传统"提示词改写"方式不同,ACE通过安全的小步更新持续改进剧本内容,而非一次性推倒重来。

这种机制意味着,AI系统能够在实际运行中不断学习、记忆和改进,完全不需要进行任何参数微调。

ACE框架

研究团队特别指出,这一机制能够有效避免两种致命问题:一是简洁性偏差,即在追求简洁的优化过程中丢失关键细节;二是上下文崩塌,即重写导致的知识结构损坏。

图片

论文中举例说明,在实验环境中,一个AI代理积累了1.8万个token的上下文内容,表现相当出色。但当模型试图对其进行"总结压缩"时,剧本被大幅削减至仅122个token,性能瞬间下降了57.1%。

研究人员直言不讳地指出:"模型擅长使用知识,却不擅长整理知识。一次错误的重写操作,就可能摧毁全部的经验积累。"

该论文强调,ACE框架从结构层面上解决了这种"自毁式学习"的风险。

图片

图注:ACE框架在三类典型任务(智能体操作、领域知识应用、数值推理)中的表现均显著优于传统方法,准确率提升幅度最为明显。

三角角色协作:生成、反思、统筹

ACE体系建立在一个极简的哲学基础上:不要重写已有知识,而要系统化管理知识。

整个框架被分解为三个互补的职能角色。

第一个是生成器。它负责执行具体任务,与环境进行实时交互,生成推理过程、代码指令或操作序列。

第二个是反思器。它会深入分析生成器的行动轨迹,识别成功与失败的根本原因,提炼出"可操作的经验教训"。这些反馈信号可能来自代码错误、执行结果或外部标签信息。

第三个是统筹器。它负责将这些实践经验提炼为结构化条款,并通过确定性规则(非语言模型决策)将其整合进主剧本。

这样的三层循环——行动、反思、整合,构成了ACE框架的学习闭环。

每次更新只会影响局部条款,不会触及整体文本结构。

这种局部增量机制,使得知识库既能持续扩展,又不会发生结构性崩塌。

剧本本身采用项目化结构设计:包含策略规则、API调用模板、调试经验、常见问题解决方案等。每条条款都附带使用计数与正负反馈元数据。

反思器会根据这些记录判断哪些规则有效、哪些已经失效。

统筹器则据此进行修改或删除操作。

论文称,这种方式让AI的知识积累"如同Git代码仓库一样演化",能够安全地生长、精细地修剪、透明地追溯。

研究团队强调,ACE的复杂度并非系统负担,而是一种结构化的安全保障,以微小的系统开销换取知识的稳定积累。

小模型"越级挑战":DeepSeek击败GPT-4.1

在复杂的AppWorld代理任务测试中,ACE框架带来了平均性能提升10.6%的显著效果,同时将适应延迟降低了86.9%。

研究团队特别提到,这一提升并非依赖于更大的模型规模,而是源于更优质的上下文管理策略。

一个典型案例是:DeepSeek V3.1模型的参数量明显低于GPT-4.1。但在ACE框架加持下,它在AppWorld基准测试中,竟能与GPT-4.1代理(IBM CUGA版本)的表现持平,甚至在更复杂的测试集上实现了反超。

研究者指出,这一结果充分证明,"上下文工程"已成为新的算力平衡器。

更重要的是,ACE框架展现出惊人的效率优势。在多轮任务学习过程中,其更新延迟减少了82%至91%,token使用成本下降了83.6%。

图片

图注:在金融分析任务中,ACE框架显著提升了模型表现(平均提升约8.6%),即使没有真实标签数据,模型仍能保持稳定的输出质量。

论文认为,这使得"在线持续学习"从概念变为现实。AI不再需要频繁地进行微调,而是在运行中就能完成自我优化。

同时,ACE的结构化剧本让学习过程变得可解释、可审计、可撤回。

如果某条规则被发现过时、存在偏见或违反规定,系统可以精准删除对应条款,实现"选择性遗忘"。

末日生还者Under AI
末日生还者Under AI

游戏简介末日生还者Under AI是一款末日生存游戏,这款游戏中玩家需要在末日进行生存,而且游戏中提供了自由构建和探索的玩法,玩家可以探

立即下载
来源:https://www.51cto.com/article/828564.html

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

一加Ace 6评测:7800mAh电池配165Hz屏的旗舰体验

10月23日消息,一加正式宣布将于10月27日发布一加 Ace 6新机。一加中国区总裁李杰将其称为“史上最强Ace”,并强调这款产品

2025-10-31.

奥特曼揭秘GPT-6:正式改名GPT-6.7,实现重大技术跨越

OpenAI首席执行官山姆・奥特曼近日在社交平台X上宣布,公司计划将下一代语言模型GPT-6更名为GPT-6-7。这一突如其来的命名调整引发业界关注,但最新尚未就具体原因作出说明。据科技媒体披露,奥

2025-10-31.

谷歌AI转型财报解读:传统业务与AI融合的中国经验

谷歌母公司Alphabet近日公布了最新季度财报,数据表现全面超出市场预期,引发资本市场热烈反应。财报显示,公司当季总营收达1023 46亿美元,同比增长16%,较华尔街预期高出逾20亿美元。摊薄每

2025-10-31.

2025日本移动出行展:日系车企蓝图,揭秘未来出行新趋势

在近期举办的日本移动出行展上,各大车企纷纷亮出创新产品与技术,勾勒出未来出行的多元图景。这场展会不仅展示了传统汽车领域的突破,更将视野拓展至海洋、天空乃至太空,展现了日本车企对未来移动出行的全面构想

2025-10-31.

00后天才学生回归!Sora核心贡献者与OpenAI团队重塑超强AI

OpenAI内部一支由年轻工程师组成的特种团队,正悄然推进一项可能改变人工智能发展轨迹的重大项目。这支三人小组的核心成员Will Depue,这位年仅22岁便在AI领域声名鹊起的工程师,正带领团队向

2025-10-31.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
时空猎人3小米
时空猎人3小米 角色扮演 2025-10-31更新
查看
挂江湖
挂江湖 角色扮演 2025-10-31更新
查看
会说话的金杰猫游戏
会说话的金杰猫游戏 休闲益智 2025-10-31更新
查看
诸神皇冠手游正
诸神皇冠手游正 棋牌策略 2025-10-31更新
查看
儿童宝宝连连看
儿童宝宝连连看 休闲益智 2025-10-31更新
查看
我功夫特牛
我功夫特牛 休闲益智 2025-10-31更新
查看
NBA2K20手游
NBA2K20手游 体育竞技 2025-10-31更新
查看
装甲纷争决定
装甲纷争决定 飞行射击 2025-10-31更新
查看
漫威对决国际
漫威对决国际 棋牌策略 2025-10-31更新
查看
掘地求升2正
掘地求升2正 休闲益智 2025-10-31更新
查看