MAXSHAPLEY：RAG上下文归因优化与解决方案解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

MAXSHAPLEY：RAG上下文归因优化与解决方案解析

热心网友时间：2025-12-10

转载

我们提出一种名为 MAXSHAPLEY 的方案，这是一种专为 RAG 系统设计的“最大-求和”效用函数，旨在将 Shapley 归因的计算复杂度从指数级降至线性水平。该方案仅消耗传统暴力计算法 6%–7% 的 token 资源，就能保持高达 0.79+ 的 Kendall-τ 相关性以及与人工标注 0.9+ 的一致性水平，为实现生成式搜索的“按贡献计费”提供了一套具备可行性的落地算法。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

MAXSHAPLEY 的核心在于“先拆解要点、再取最大值、最后线性求 Shapley”这三步策略，成功将原本学术性的公平归因工具，转变为可在线上实际运行的高效方案。这为“AI 搜索—内容方”之间的利益重新分配，提供了第一条可扩展的技术路径。具体实现方式如下：

一、行业痛点

生成式搜索（如 Perplexity、Gemini 等）让用户能够实现“即问即答”，但这同时导致用户跳过原始网页，造成内容方的流量锐减。据 Bain 公司估计，到 2025 年，已有 80% 的用户将 40% 的时间停留在 AI 生成的摘要页面，而不再点击信息来源。流量消失即意味着广告收入的流失，出版机构将此类事件称为“灭绝级危机”，相关诉讼也不断涌现（如《纽约时报》诉 OpenAI、Chegg 诉 Google）。现有研究主要聚焦于“上下文归因”的可解释性，并未解决“谁该分多少钱”这一关乎公平补偿的实际问题；而传统的 Shapley 值计算虽在理论上公平，其 O(m2^m) 的复杂度在毫秒级响应的搜索场景中是完全无法接受的。

二、本文核心贡献

本文提出了 MAXSHAPLEY 方法，这是一种专为 RAG 设计的“最大-求和”效用函数。它成功将 Shapley 值归因的计算复杂度从指数级降至线性级别，其 token 消耗仅为暴力计算法的 6%–7%，却能保持 0.79+ 的 Kendall-τ 强相关性与 0.9+ 的人工标注一致性，为生成式搜索的“按贡献付费”模式提供了一个可实际部署的算法基础。

图片

整体流程遵循“检索 → 生成 → 归因”三阶段，将三条大型语言模型的链路进行解耦，即使是黑盒模型也可适用。

三、方案速览

方案基于一个关键直觉：“同一要点内的文档相互竞争，不同要点间的文档则彼此协作”。通过 max 操作天然去除冗余信息，在满足公平公理的同时，确保了计算过程的可分解性。

图片

上图横轴为 token 消耗量，纵轴为与人工标注的 Jaccard 一致性指数：MAXSHAPLEY 仅用 6% 的 token 消耗，其精度就已追平完全版 Shapley 的 0.83 水平，而 KernelSHAP 需要 8 倍以上的 token 量才能达到相近效果。

四、实验亮点

数据方面使用了HotPotQA、MuSiQUE、MS MARCO（经过人工二次标注，共30题以降低噪声）。评估指标涵盖 Jaccard@K、Kendall-τb、token成本/美元/运行时间。

在达到相同 Jaccard 指数时，MAXSHAPLEY 比 KernelSHAP 节省 8–10 倍的 token 消耗；

Kendall-τb > 0.79（强相关），Jaccard > 0.9；

在完整版 MuSiQUE 数据集（共2417题）上表现依然稳健，即便随着“跳跃数”增加，性能略有下降但并未崩溃。

五、落地补偿机制

直接分成：平台从其订阅或广告收入中，按归因比例划拨一定金额给内容提供方。此模式适用于学术出版、企业知识库等供应方有限的场景。广告代理：将来源方的广告素材，按其归因权重投放在生成式结果页面上，沿用现有广告生态，平台无需自建支付通道。二次拍卖：以 MAXSHAPLEY 计算出的分数作为内容方的“被动出价”，与广告主在同一竞价市场中进行拍卖，平台收取结算差价。

六、局限性与未来方向

使用 LLM 作为评估者对措辞敏感，即使是温度参数设为 0 也非完全确定；未考虑多来源交叉验证带来的“置信度叠加”效应；目前的方案将关键要点视为同一扁平层次，未来可引入层次分解以处理更复杂的推理逻辑；对抗风险防范：内容农场可能通过制造“AI 偏好型文本”来套利，需要配合内容质量过滤机制。

资源传送门：

MAXSHAPLEY: Towards Incentive-compatible Generative Search with Fair Context Attribution
论文地址：https://arxiv.org/pdf/2512.05958

来源:https://www.51cto.com/article/831536.html

上一篇：智谱GLM-4V开源发布：不仅能看懂，更学会了“动手”

下一篇：倪飞回应豆包手机争议：开放合作是AI手机发展关键

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

阴阳师蝉冰雪女技能是什么-阴阳师蝉冰雪女有哪些技能

决战平安京八周年如何-决战平安京八周年怎么样

二十载RGB技术沉淀，索尼以真实色彩引领显示未来

空灵诗篇不死型精灵如何配装-空灵诗篇不死型精灵配装方法

《空洞骑士》意外获更新九年的bug终于被修复！

梦幻西游属性点切换找谁-2026梦幻西游属性点切换去哪里找

《鬼泣》+《星际战甲》！育碧新作《异变金属》公开

迷你世界从哪里兑换激活码

洛克王国世界星光狮图鉴

Pages怎么链接文本框-Pages如何给文本框添加链接

戴尔电脑恢复出厂设置方法：关键按键与操作解析

电脑睡眠后黑屏唤醒失败？5步教你有效解决重启问题

解压视频文件，电脑播放必备指南

电脑蓝屏解决全攻略：排查与修复系统崩溃教程

文件夹无法删除怎么办？4个强制删除方法

惠普战系列办公主机组装指南：打造高效办公电脑配置

解决鼠标滚轮失灵：3步自查与修复窍门【修复指南】

电脑误删文件恢复方法：4种实用方案找回数据

电脑截屏快捷键大全：快速截屏的3种高效方法

电脑多显示器设置指南：3步轻松扩展工作桌面

《人之初》首播：双线叙事成新悬疑样本，口碑褒贬不一

OpenAI急招安全负责人：年薪高达55.5万美元及股权

台积电3纳米芯片报价受AI热潮驱动，预计下月上涨

AI伪证呈堂被训诫：原告伪造带水印电子证据案

小米空气净化器十年领跑：线上销量第一，出货量破2500万台

蚂蚁阿福声明：问答结果无任何广告推荐与商业排名

AI机器人辅助精神科诊疗，潜在关联病例解析

我国AI地震监测达国际先进水平，核心技术实现实时预警

荣耀ROBOT PHONE真机体验：全球首款机器人手机亮相当下

全球首台30兆瓦纯氢燃气轮机投用，清洁能源新突破

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

《无限轮回》萌新必备小技巧发布于 2026-04-03

王者荣耀s43射手梯度排行发布于 2026-04-03

《长生：天机降世》游戏玩法介绍发布于 2026-04-03

《叠入深渊》自选英雄推荐发布于 2026-04-03

无主之地4怎么快速打亚蒙BOSS 发布于 2026-04-03

蚂蚁庄园3月28日今日答案2026 发布于 2026-04-03

元梦之星友谊旗帜有什么效果发布于 2026-04-03

蔚蓝档案伊落玛丽技能效果详解发布于 2026-04-03

累计突破82万！《宝可梦Pokopia》Fami通销量四连冠发布于 2026-04-03

《羊蹄山之魂》"奇谭模式"高难突袭任务4月11日上线发布于 2026-04-03

AI人才也进斩杀线！ Take-Two被曝解雇人工智能主管及部分部门员工发布于 2026-04-03

修仙宗门经营新游《卡牌仙宗》4月24日正式上线Steam，国区首发特惠37.8元！发布于 2026-04-03

KONAMI 推出《Darwin’s Paradox!》，现已上市！发布于 2026-04-03

《星空》PS5版体量不小至少需要140GB存储空间发布于 2026-04-03

《第五人格》怪念集时装厂长合家宴游戏展示效果正式公布！发布于 2026-04-03

简直疯了！涨价后的PS5售价是PS4两倍还多发布于 2026-04-03

嵌入式洗碗机水管安装要用专用管吗发布于 2026-04-03

鼠标指针怎么换颜色快捷键发布于 2026-04-03

雷蛇鼠标验真伪有防伪标吗发布于 2026-04-03

微软推送 Win10 三月安全更新：修复卡死、更新证书、提升部分显卡稳定性等发布于 2026-04-03

微软 Win11 26H1 推送 28000.1719 更新：设置应用 AI 智能体支持中文发布于 2026-04-03

海尔燃气热水器怎么除水垢发布于 2026-04-03

红米k60隐藏电量充电能开启吗发布于 2026-04-03

苹果11pro max从相册设置壁纸步骤是什么发布于 2026-04-03

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

鸣人的假期中文版下载-鸣人的假期游戏合集-鸣人的假期版本大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

MAXSHAPLEY：RAG上下文归因优化与解决方案解析

一、行业痛点

二、本文核心贡献

三、方案速览

四、实验亮点

五、落地补偿机制

六、局限性与未来方向

AI 的记忆不是硬盘——从 40 个真实 Bug 说起

OpenClaw给每个Agent单独指定workspace

OpenClaw更新操作

openclaw源码

关停 Sora 后 OpenAI 转身收购 TBPN 播客，亲自下场做媒体