百度与中国人大联合研发AI智能体，实现精准控制工具使用成本

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

百度与中国人大联合研发AI智能体，实现精准控制工具使用成本

热心网友时间：2026-05-14

转载

这项由中国人民大学高瓴人工智能学院、上海财经大学与百度公司联合开展的前沿研究，已于2026年2月正式发布，相关论文预印本编号为arXiv:2602.11541v1。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

中国人大&百度：AI智能体学会

当我们谈论AI智能体时，脑海中浮现的往往是能够自主处理复杂任务的“数字助手”。然而，一个现实且关键的问题随之而来：如果让AI助手协助工作，但每次调用外部工具（如API）都需要支付费用，它是否会因缺乏成本意识而迅速耗尽预算，成为一个“预算杀手”？

这绝非危言耸听。随着AI智能体能力的不断增强，其通过调用外部工具（如计算器、搜索引擎、专业数据库API）来完成任务已成为标准操作。核心挑战在于，现实世界中的这些服务大多并非免费——获取实时金融数据、调用高精度地图API、查询专业文献库，往往都伴随着实际的经济成本。

研究团队观察到一个普遍存在的痛点：即便为AI设定了明确的预算上限，许多模型仍像对“金钱”没有概念一样频繁超支。这好比给孩子50元午餐费，他却花了61元，理由是“看到了更想吃的”。有趣的是，一些更复杂的模型虽然超支较少，却又走向另一个极端：变得过分保守，手握充足预算却不敢合理支出，导致任务完成度大打折扣。

针对这一核心痛点，团队创新性地开发了一套名为“INTENT”的智能预算控制系统。您可以将其理解为AI的专属“财务规划师”。其核心理念在于“全局规划与前瞻性预测”——让AI在执行每一步操作前，都能预先评估后续可能产生的连锁成本，从而确保整个任务流程在既定预算内高效、完整地执行。

INTENT如何工作：像资深主厨规划宴席

理解INTENT系统的工作原理，可以借助一个生动的比喻。假设您需要操办一桌宴席，但预算有限。缺乏经验者可能会先购买最昂贵的几道主菜食材，结果导致预算提前耗尽，无法购置必要的配菜和调料。而INTENT则像一位经验丰富的行政总厨，在采购前就进行通盘筹划：需要哪些食材、各自价格如何、按什么顺序采购最经济、哪些高价食材存在性价比更高的替代方案。

具体而言，INTENT系统整合了三个核心组件，共同构成一个高效的“智能财务决策团队”：

意图预测器：负责评估AI计划执行的每个操作是否必要，以及其成功的可能性有多大。这好比一位精明的投资顾问，在每笔支出前进行严谨的风险与收益评估。

条件生成器：负责模拟在理想资源条件下，任务应如何最优推进，相当于制定一份最高效的行动蓝图。

几何成本校准器：它会将现实执行中的各种不确定性（如工具调用失败、网络延迟等）纳入考量，对总体成本进行更为审慎和保守的估算，为决策提供安全边际。

实战表现：从“超支王”蜕变为“精算师”

研究团队在广泛使用的AI工具调用测试平台StableToolBench上验证了该方法的有效性。他们为任务设定固定预算，并为不同工具分配差异化的模拟使用成本，以高度还原真实的商业付费环境。

实验结果极具说服力。在未施加任何预算控制的情况下，AI助手的任务超支率超过65%。而引入INTENT系统后，不仅超支现象被完全杜绝，任务的整体完成率和质量反而得到了显著提升。

系统的环境适应性同样出色。当工具价格动态波动时，传统基于静态提示词的方法表现极不稳定，如同只会照固定菜谱做菜的厨师，一旦食材市场价格变动便束手无策。相比之下，INTENT能够灵活调整策略，主动搜寻并选择性价比更高的替代工具或方案，展现出类似专业采购经理的成本敏锐度。

进一步测试表明，INTENT在不同预算水平下均能游刃有余。预算充足时，它能智能分配资源以达成最优结果；预算紧张时，又能通过精明的资源调度和方案取舍，实现超出预期的效果。这种强大的弹性对于实际商业应用至关重要，因为不同用户和业务场景的预算约束千差万别。

技术巧思：无需重训模型的“智能导航仪”

从技术实现角度看，INTENT最巧妙的设计在于其“即插即用”的特性——它无需重新训练底层的大语言模型。这好比给现有的汽车加装一套先进的智能导航与油耗管理系统，而非重新制造一辆新车。这种设计极大地降低了部署门槛，使得现有的各类AI智能体系统能够快速、低成本地获得强大的成本管控能力。

系统还集成了一系列实用的优化机制。例如“轨迹缓存”功能：一旦AI通过规划找到了一条可行的低成本任务路径，系统便会记住后续步骤，避免重复进行耗时的规划计算。“黑名单机制”则能自动识别并标记那些历史成功率极低或成本过高的工具，防止AI在注定失败的操作上浪费宝贵的尝试次数和预算，如同精明的消费者会主动避开评价糟糕的商家。

案例透视：一次经典的“预算突围战”

为了更直观地展示INTENT的效果，研究团队提供了一个详尽的对比案例。任务目标是：在50个信用点的预算限制内，收集谷歌（Alphabet）公司的关键财务数据，包括季度现金流、资产负债表、损益表等。

无INTENT指导时：AI助手采取了简单直接的策略——首先调用最昂贵的“季度现金流查询”工具（花费38点），随后调用“资产负债表查询”工具（花费23点）。此时总花费已达61点，超出预算11点，任务宣告失败。颇具讽刺意味的是，AI在最终回答中“诚实”地报告了自己已超支。

有INTENT系统指导时：当AI最初同样打算调用昂贵工具时，INTENT及时介入，分析了整体任务链的成本结构并预警了超支风险。系统向AI反馈了包含各工具调用成功概率与预期成本的详细风险评估。基于此，AI智能调整了策略，选择了一套更便宜但同样有效的替代数据源和查询组合，最终仅消耗43个信用点就完成了所有必要数据的收集，并且输出了更全面、结构更清晰的分析报告。

这个案例清晰地揭示了INTENT的核心价值：它并非进行粗暴的消费限制，而是通过智能引导，帮助AI在复杂的约束条件下做出更明智、更具全局观的决策，从而追求任务的最优解。

深远意义：迈向高效且负责任的人工智能

这项研究解决的远不止一个技术优化问题。随着AI智能体在金融分析、法律尽职调查、云计算运维诊断等高价值专业领域加速渗透，成本控制已成为无法回避的商业现实和核心竞争力。一个无法有效管理预算的AI，无论其单项能力多么突出，都难以获得商业信任并实现大规模应用。

研究揭示了一个关键的人工智能系统设计原则：我们不能想当然地认为AI会自发地习得人类社会的经济价值观与资源约束意识。正如教育孩子需要明确的规则与引导，AI系统也需要专门设计的机制来确保其在复杂、多约束的现实环境中做出负责任、可预测、符合经济效益的决策。

INTENT的设计哲学体现了“最小干预”与“最大赋能”的结合。它不改变AI核心的推理与生成能力，仅在关键的成本决策点提供前瞻性指导和硬性约束，从而在最大限度保持AI原有灵活性与创造力的同时，确保了其行为的经济可控性。

从行业趋势来看，这项工作标志着AI智能体正朝着更加“成熟”和“负责任”的方向演进。未来的AI助手不仅要能高效完成任务，更要懂得在多重约束（如成本、时间、法规）下进行智能权衡与全局优化，其角色将越来越接近于一位真正的专业顾问。

归根结底，这项研究的核心贡献在于为AI赋予了“经济理性”与“成本意识”。正如培养一个优秀人才，不仅要传授知识与技能，还需教导其如何高效管理与配置资源；AI智能体也需要学会在有限的资源条件下做出最优选择。INTENT系统就是这样一位“AI财务教练”，它正在助力AI从只知执行的“工具”，成长为懂得权衡与规划的“智能伙伴”。

这种能力的重要性将与日俱增。当AI开始深度参与并处理具有真实经济后果的商业决策时，其成本控制意识与风险管理能力，将成为区分卓越系统与平庸系统的关键标尺。此项工作无疑为这一重要研究方向奠定了坚实的基础，并开辟了广阔的探索空间。

Q&A

Q1：INTENT系统是如何帮助AI智能体控制工具使用成本的？

INTENT系统通过扮演内置“财务规划师”的角色，由三大组件协同工作来实现成本控制：意图预测器评估每个操作的必要性与成功概率，避免无效支出；条件生成器规划全局最优的行动路径；几何成本校准器进行包含不确定性的保守成本估算。系统会在AI执行每个付费操作前进行全链条成本模拟，确保整个任务流程严格控制在预算之内。

Q2：为什么传统的AI智能体容易在使用付费工具时超支？

传统AI智能体通常缺乏内置的成本管控逻辑和全局规划能力。即便在提示词中被告知预算限制，它们也常采用简单的贪心或顺序执行策略（例如优先调用最强大或最熟悉的昂贵工具），导致预算被提前耗尽。另一方面，一些经过简单训练的模型虽然能减少超支，却又容易因过度规避风险而变得过于保守，因不敢进行必要支出而无法充分完成任务目标。

Q3：INTENT系统在动态工具市场中表现如何？

INTENT系统在面对动态变化的工具市场时，表现出卓越的适应性与决策灵活性。当工具价格发生波动，或有新的高性价比工具出现时，它能基于实时成本信息动态调整策略，主动寻找并切换到更经济的替代方案。无论是在预算充裕还是极度紧张的场景下，系统都能通过智能的资源分配与方案优化，实现当前约束条件下的效果最大化，展现出强大的鲁棒性。

来源:https://www.techwalker.com/2026/0312/3180937.shtml

上一篇：香港大学揭示AI推理训练对称性陷阱导致算法保守化原因

下一篇：罗格斯大学AI写作新突破实现人类般快速准确表达