AI共识新突破：推理延迟激降20倍，Token消耗锐减4.4倍

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI共识新突破：推理延迟激降20倍，Token消耗锐减4.4倍

热心网友时间：2026-02-10

转载

新智元报道

编辑：LRST

【新智元导读】多智能体AI系统需要明确的共识机制来协调不同AI主体的决策。新理论框架将多智能体推理建模为分布式共识过程，大幅提升系统性能，降低延迟和计算成本，使多智能体AI从实验阶段迈向实际应用。

过去一年，LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。

OpenAI在持续推进更强的推理与工具使用能力，Google DeepMind将推理显式建模为搜索问题，Anthropic则通过规范与自我批判提升模型可靠性。

一个非常清晰的行业趋势正在形成：单模型能力正在接近结构性边界，多智能体被视为下一步。

Advaita Research/Hetu联合创始人Jialin Li发布的最新研究论文，为多智能体协作共识提出了明确的理论框架，并给出了一组生产级系统指标的跃迁式改善：在accuracy基本不变的前提下，实现最高20×端到端延迟下降，最高11×的P99尾延迟改善，以及最高4.4×的token成本削减。

论文链接：https://arxiv.org/pdf/2512.20184

英文版链接：https://x.com/advaita_labs/status/2018576622048473241

这项工作将多智能体推理的问题，从prompt与workflow设计，重新拉回到系统设计和工程层面：一致性语义、停止条件与尾延迟治理。

在工程语境中，论文给出的核心判断可以概括为一句话：当前多智能体系统，缺乏一套明确的Agentic Consensus（智能体共识）系统语义。

Advaita Research / Hetu CMO Stephanie Yu从系统工程视角对论文进行了解读。

研究背景

在当前主流路线中，大型研究机构对Agent的探索大致可以分为三类，但它们在一个关键问题上保持了共同的沉默：当多个随机推理主体并行工作时，系统何时可以认为已经达成稳定一致？

OpenAI：强化单主体推理能力

OpenAI的路线始终围绕test-time scaling，包括self-consistency、多路径推理、更强的 chain-of-thought、更成熟的 tool use。

该体系在单主体条件下具有非常清晰的工程优势：推理质量高度可控、行为一致性强、工程复杂度集中。

其隐含前提同样明确：系统只有一个决策主体。

一旦扩展为多个planner、多个actor并行执行，一致性不再由模型内部保证，而被外包给上层workflow的规则组合。

Google DeepMind搜索式推理

Tree-of-Thoughts等方法将推理显式建模为搜索问题，通过评估函数在候选路径中选择最优解。

该范式在离线推理和数学问题上表现稳定，但在系统层面呈现出两个明显特征：推理过程高度同步、停止条件由搜索深度或预算上限决定。

本质上，这类方法优化的是路径质量，而不是在并发、延迟与成本约束下的决策时机问题。

Anthropic/Meta启发式协调

Anthropic的constitutional debate，以及Meta、Stanford 提出的多 Agent debate / society-of-minds，引入了多主体交互。

在工程实现上，这类系统通常依赖：固定agent数、固定轮数、barrier synchronization（等待所有 agent 完成）、多数投票或规则聚合。

但这些机制并没有给出稳定一致性的系统定义。

当主流Agent路线仍在强化「如何更好地推理」，将多智能体视为推理技巧的叠加时，

Advaita Research的这项研究把问题下沉到了系统层：在多个随机推理主体并行时，如何定义、验证并稳定达成一致。

把多智能体当成分布式系统

论文提出的核心方法体系为Aegean，其根本重构在于：多智能体推理不再被视为workflow编排问题，而被建模为一个分布式共识过程。

不同于传统分布式系统，智能体决策呈现随机不确定性，使得现有共识协议架构无法适用。论文针对多智能体环境提出了新的共识理论框架，并给出了严谨的多智能体共识的正确性定义。

论文之后基于理论框架提出了新的共识协议。其核心机制包括三点：

（1）Quorum-fast，而不是wait-all

系统不再等待所有agent，只要达到 quorum 即推进决策，延迟不再由最慢 agent 决定。

（2）稳定性窗口（β），而不是「一致就停」

一致性必须在时间维度上持续存在，才能被视为有效共识，从而过滤暂时性多数。

（3）Streaming共识与即时取消

在token生成过程中持续检测共识状态，一旦满足稳定条件，立即终止剩余生成。

详细结果与实验分析

论文指出：多智能体推理，本质上是运行在随机推理主体之上的分布式共识问题。

一旦缺乏明确的共识语义，工程失败并非偶发，而是呈现出高度可预测的系统性模式。

暂时性一致：多数并不稳定标题

论文系统性测量了decision flip现象（在现有Agent workflow中几乎未被显式建模）。

结果显示：在引入agent间 reasoning exchange后，准确率提升的同时，多数决策在相邻轮次发生反转的频率显著上升。

以MMLU为例：100个样本中出现64次 decision flip，意味着系统在连续轮次中反复改变多数结论。

在缺乏稳定性约束时，任何基于「当前多数」的提前停止或投票机制，都可能发生在transient agreement（暂时性一致）上。

这不是推理能力问题，而是共识未被定义的问题。

同步模型错误：P99被最慢agent定义

当前多Agent系统普遍采用barrier synchronization，论文在AIME（1 req/s）场景下，对比了主流做法与引入共识机制后的系统表现：

多Agent baseline（MaxRound = 6）最慢请求为6571秒，P99 延迟为8749秒

引入共识机制后，最慢请求约325秒，P99延迟为772 秒；

在相同任务条件下：P99 延迟改善约11×，平均延迟改善约20×

该差异并非来自模型推理能力，而来自同步范式从「等所有人」转向「达成共识即可推进」。

算力浪费：token消耗发生在收敛之后

论文进一步量化了多智能体系统中长期被忽视的问题：收敛之后的无效计算。

在多个基准任务上，引入Agentic Consensus后：

GSM8K：4.4×减少（约 1.3K vs 5.7K）

MMLU：3.3×减少（约 3.3K vs 10.7K）

AIME：1.3×减少（约 46.0K vs 59.9K）

IMO：1.1×减少（约 64.8K vs 73.8K）

与此同时，accuracy波动被控制在约2.5%以内。

这表明：token成本下降来自共识驱动的早停与取消机制，而不是通过牺牲质量实现。

数字刻画了系统边界

在引入Agentic Consensus（Advaita Research 提出的多智能体共识建模方法）后，系统行为出现了清晰的数量级变化：平均延迟降低1.2–20×，P99尾延迟最高改善11×，token消耗降低1.1–4.4×，accuracy波动约2.5%

这些指标共同指向同一个系统级结论：多智能体推理的性能瓶颈，并不来自模型能力，而来自协作机制是否具备可操作的共识语义。

工程判断与应用前景

Agentic Consensus并不是一个附加能力，而是一条明确的系统分界线。

当Agent作为真实系统中的行动单元运行时，问题不再是：「单个模型能否推理得更好」，而是在多个随机推理主体并行的情况下，系统是否具备可判断、可停止、可扩展的一致性语义。

论文给出的核心判断标准是：如果一个多智能体系统无法明确回答「何时算达成一致、何时可以安全停止、延迟由谁决定」，那它在工程上仍停留在workflow，而非系统。

从这个角度看：decision flip、P99被最慢agent定义、收敛后的token浪费，都不是实现细节上的瑕疵，而是系统尚未进入「共识可操作阶段」的信号。

Advaita Research的这项工作，并不是提出一种新的Agent玩法，而是把Agentic Consensus提升为一个工程判断标准：多智能体推理，是否已经从「推理技巧的叠加」，迈入「具备可验证共识语义的系统」。

当这个标准成立，多智能体才能真正从demo走向production；当它不成立，再复杂的推理流程，也只是在同步成本之上叠加计算。

参考资料：

https://arxiv.org/pdf/2512.20184

来源:https://www.163.com/dy/article/KL5PQJKK0511ABV6.html

上一篇：算力热潮：中国3万AI卡竞速，马斯克瞄准太空炼丹

下一篇：马斯克对话：机器人如何成为未来“造钱永动机”

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

我的世界基岩版难度调整指令difficulty使用教程

红色沙漠延长飞行距离技巧与实用方法详解

三角洲行动电脑配置要求与最低配置推荐指南

王者荣耀世界零氪开荒阵容搭配攻略

Poki官方网页版免费小游戏大全在线即玩入口

云鸣潮网页版免费在线玩官方正版直接进入

红色沙漠勇武之步套装获取方法全攻略

三角洲行动陷阱拆除与战术道具使用全攻略

深海迷航手游控制台开启方法详细教程

三国志幻想大陆刘备命魂觉醒攻略与技能解析

小米汽车推出寻天子品牌增程车型将改变家用车市场格局

鸣潮赛博朋克联动角色全名单与获取指南

阴阳师5月8日补偿公告内容与领取方法详解

刺客信条影下载安装教程与新手入门指南

崩坏星穹铁道4.2下半卡池抽取指南与角色分析

牧场物语风之集市快速赚钱攻略与技巧分享

崩坏星穹铁道绯樱全面培养指南光锥遗器阵容搭配详解

艾尔登法环黑夜君临蓝量提升方法详解

王者荣耀世界英雄强度排行榜最新榜单

帕帕拉猩红辣妹强度解析吉星派对角色实战评测

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

云原神网页版免费在线畅玩官方入口无需下载安装发布于 2026-05-16

Roblox群组创建指南与获取方法详解发布于 2026-05-16

云原神网页版免费体验无需下载在线畅玩入口发布于 2026-05-16

CrazyGames网页版免费秒玩入口免下载直接在线畅玩发布于 2026-05-16

我的世界新手简易房屋建造教程与实用技巧发布于 2026-05-16

2026年物理脑洞与空间折叠全关卡通关思路详解发布于 2026-05-16

像素火影网页版在线玩免费官网入口无需下载秒开发布于 2026-05-16

云原神网页版官网登录入口与游玩指南发布于 2026-05-16

梦幻西游物品锁密码忘了怎么重置详细找回步骤图文教程发布于 2026-05-16

梦幻西游手游装备熔炼技巧与实用方法详解发布于 2026-05-16

梦幻西游维摩诘奇遇任务奖励机制全解析发布于 2026-05-16

梦幻西游格挡值效果解析与实战作用详解发布于 2026-05-16

深海迷航2前期硫磺高效获取指南发布于 2026-05-16

小小魔兽英雄纹章高效刷取攻略发布于 2026-05-16

深海迷航2银矿石前期高效获取位置与技巧发布于 2026-05-16

梦幻西游大闹天宫五人副本通关攻略与详细流程发布于 2026-05-16

Win11语音输入开启与使用教程轻松实现语音识别打字发布于 2026-05-16

Win11屏幕注视检测功能开启教程自动延缓锁屏设置方法发布于 2026-05-16

Win11关闭自动播放视频设置教程禁用媒体自动播放方法发布于 2026-05-16

Win11可靠性监视器打开方法查看系统稳定性历史记录发布于 2026-05-16

Win11关闭透明效果教程禁用毛玻璃提升系统性能发布于 2026-05-16

PostgreSQL 15安装教程 Linux系统数据库配置与初始化指南发布于 2026-05-16

苹果电脑如何清理视频剪辑产生的临时文件发布于 2026-05-16

统信UOS系统任务栏隐藏与桌面空间优化指南发布于 2026-05-16

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

AI共识新突破：推理延迟激降20倍，Token消耗锐减4.4倍

零一万物迎来三位新高管李开复详解一把手工程

MiniMax高级研究总监钟怡然半年前离职独家消息

爱诗科技B+轮融资1亿元 ARR突破4000万美元

太初元碁联合产业链伙伴推出AI落地北京方案

小模型崛起成为AI新战场

AI共识新突破：推理延迟激降20倍，Token消耗锐减4.4倍

零一万物迎来三位新高管 李开复详解一把手工程

MiniMax高级研究总监钟怡然半年前离职独家消息

爱诗科技B+轮融资1亿元 ARR突破4000万美元

太初元碁联合产业链伙伴推出AI落地北京方案

小模型崛起成为AI新战场

零一万物迎来三位新高管李开复详解一把手工程