GPT与Claude已接管Office：双AI协同写作与审稿

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

GPT与Claude已接管Office：双AI协同写作与审稿

热心网友时间：2026-03-31

转载

新智元报道

编辑：元宇

【新智元导读】微软最大的对手不是谷歌，是自己曾经的独家依赖。Copilot最新升级默认GPT写稿、Claude审稿，Anthropic的Agent骨架更被直接焊进Office。从绑定OpenAI到收编所有顶级模型，微软押注的是：无论谁赢，流量都经过我。

单模型时代，结束了。

刚刚，微软把Copilot的引擎换了，在Researcher中引入多模型智能。

从此，Copilot的Researcher智能体，默认同时调用GPT和Claude。

这不是让你手动切模型的那种「多模型」，而是GPT写完初稿，Claude自动扮演专家评审员逐条审查，审完再交付给你。

一个负责「冲锋」，一个负责「挑刺」。

微软表示，这是Microsoft 365 Copilot深度研究代理Researcher迈出的重要一步。

Researcher专为在工作流程中处理复杂研究而设计，这次通过两项全新的多模型能力：「批判」（Critique）和「智囊团」（Council），进一步提升了准确性、深度和可信度。

实测效果惊人。

在DRACO基准测试中，这套「双模型互搏」架构综合得分比此前一直被视为深度研究天花板的Perplexity Deep Research（搭载Claude Opus 4.6）高出13.8%。

但这还不是全部。

同一天上线的Copilot Cowork，微软表示是把支撑Claude Cowork的技术平台引入了Microsoft 365 Copilot，并与Work IQ、企业权限和治理体系深度整合，让AI能自主规划、跨工具推进多步任务。

这已经不是「接了个API」那么简单，而是在把外部前沿智能体能力，纳入微软自己的工作系统。

微软的牌面已摊开：不把赌注压在单一模型上，而是把Anthropic、OpenAI等前沿模型纳入Copilot的多模型编排框架。

也就是说，Copilot正在从传统AI助手，升级成一个面向企业工作的多模型执行与编排系统。

Critique

让AI自己审自己的作业

过去的AI研究工作流有一个结构性盲区：规划、检索、综合、撰写全部压在一个模型上。

让模型既当运动员又当裁判，这样幻觉几乎是必然的。

微软这次给出的解法是：把「生成」和「评估」拆成两个独立角色。

具体到大模型，是让GPT负责上半场：任务规划、迭代检索、起草初稿；Claude负责下半场：以专家评审员的身份，基于结构化评价量表（Rubric）逐条审查。

这个量表主要聚焦三个维度：

来源可靠性评估，审查引用是否权威、可验证；

报告完整性，检查是否覆盖了用户请求的所有意图；

严格的证据溯源，要求每一个关键结论都锚定到带有精确引用的可靠来源。

更关键的是，审阅者的定位不是「第二作者」，而是「同行评审」。它不替你重写，而是逼你写得更好。

微软365和Copilot企业副总裁Nicole Herskowitz说：「我们不是简单地在Copilot里塞了多个模型，我们是让客户真正享受到模型协同工作的好处。」

未来这套机制还会升级为双向互审：GPT也能审Claude的稿。

Critique已经是Researcher的默认模式，无需手动开启。

其实，这算不上什么技术花活，而是把学术界运行了几百年的同行评审制度，第一次工程化地嵌进了AI系统。

用架构设计来压制幻觉，而不是一味指望单个模型变得更聪明。

DRACO跑分拆解

13.8%的含金量

数据不说谎。

DRACO（深度研究准确性、完整性和客观性）是由Perplexity和学术界研究人员于2026年2月推出的基准测试，覆盖10个领域、100项复杂研究任务，全部源自真实使用场景。

每个问题经过5次独立运行取均值，评估维度包括事实准确性、分析广度和深度、表达质量、引用质量四项。

评委模型是GPT-5.2。

微软特别强调，采用了与基准论文完全一致的评估协议和配置，确保「同口径」公平对比。

搭载Critique的Researcher综合得分实现了+7.0分（SEM±1.90）的显著提升，比此前表现最好的Perplexity Deep Research高出13.88%。

DRACO基准测试综合得分对比图：各深度研究系统（含Researcher with Critique、Perplexity Deep Research等）横向得分对比。其中除Researcher with Critique外，其余对比结果引自Zhong et al., arXiv:2602.11685。

拆开四个维度看：

分析广度和深度提升最明显，+3.33。其次是表达质量+3.04，事实准确性+2.58。引用质量同样有提升。

所有维度均达到统计学显著（配对t检验，p<0.0001）。

真正值得注意的是那个+3.33。分析深度的飙升说明Critique最大的价值不是纠错，而是可以逼出更全面的分析视角。

在领域层面，10个领域中有8个观察到显著提升，覆盖医学、技术、法律等核心场景。

仅有的两个例外是「学术」和「大海捞针」，这两个领域测试结果波动较大。

DRACO基准四项评测维度提升表：Researcher with Critique（多模型）相较单模型 Researcher，在分析广度与深度、呈现质量、事实准确性和引用质量上的提升，以及各项对最终总分的贡献。

13.8%听起来是一个数字。

在深度研究这个赛道上，此前各家打得难分难解，Perplexity搭载Claude Opus 4.6好不容易爬到的天花板，现在被Critique一个架构创新直接击穿了。

当你需要的不是一个答案

而是一场辩论

Critique解决的是「怎么让一份报告更准」的问题。

但有些场景，你要的根本不是一份精修稿，而是两个专家吵一架。

而这，就是Council的定位。

在模型选择器中选「Model Council」，GPT和Claude会各自独立生成一份完整报告，并排展示。

然后，一个专门的评委模型会对两份报告进行评估，生成一份综述（Cover Letter），深入分析双方在哪些观点上达成一致、在何处存在分歧，以及各自带来的独特见解。

Council模式产品界面截图：GPT和Claude各自生成的完整报告并排展示，附评委模型生成的Cover Letter综述。

表面上看，这只是「多选一」变成了「全都看」，实质上是把决策场景中的信息盲区暴露出来。

一个模型可能忽略的事实、权重不同的分析框架、另一条推理路径……Council把这些全部摆到桌面上。

做季度战略报告的时候，你希望看到一份精修稿，还是两个专家各执己见、让你自己判断？

Critique是「编辑审稿」模式，效率优先。

Council是「专家会诊」模式，决策优先。

两个模式精准覆盖了企业用AI做研究的两种核心场景：日常产出要快要准，重大决策要全要思考全面。

Copilot Cowork

微软把Anthropic的撒手锏搬进了Office

如果说Critique和Council改变的是研究质量，Copilot Cowork改变的是工作方式本身。

Copilot Cowork直接基于Anthropic的Claude Cowork技术平台构建。

这里不是「接入」或者「兼容」，而是「基于其技术平台构建」。

它的工作方式很简单：你描述想要的结果，Copilot Cowork自动制定计划，跨工具和文件进行逻辑推理，在推进过程中实时展示进度，你可以随时介入和引导。

Copilot Cowork操作界面：描述目标 → 自动规划 → 跨工具执行 → 实时进度展示。

内置Claude加上微软原生技能：日历管理、每日简报等，覆盖从一次性杂事到每月预算审查的各类任务。

Capital Group等机构已经在使用，反馈集中在规划、排程、产出成果以及准备管理层审查等高价值场景。

目前通过Frontier计划向早期客户开放。

这意味着，微软和Anthropic的关系，已经从「模型供应商」进化到了「技术平台共建」，Cowork把Claude的Agent骨架直接嵌进了M365的肌肉里。

微软本月早些时候已以测试模式发布Copilot Cowork，目标是「抓住市场对自主AI智能体日益增长的需求」。

所以，这不是一次产品更新，这是一次架构级别的站队。

微软的真正野心

从AI助手到模型指挥中心

把以上所有动作连起来看，微软的战略意图已经很清晰：它不再押注自己或者某一个模型能赢，而是转向押注无论谁赢，流量都经过我。

从对OpenAI的深度依赖，到把Anthropic的技术深度整合进产品线，微软正在从「模型选手」转型为「编排层」。

Critique让GPT和Claude协作，Council让它们竞争，Cowork让Anthropic的Agent能力直接为Office用户服务。

这是平台逻辑，不是模型逻辑。

正面战场上，微软同时在硬刚谷歌Gemini的多模态路线和Anthropic Claude Cowork的自主Agent路线。

但当Anthropic、OpenAI、谷歌三巨头的模型格局已经成型，微软的策略不是下场当选手，而是用生态开放把所有选手的能力收编进自己的平台。

对开发者来说，信号已经非常明确：未来的竞争力不在于绑死一个模型，而在于编排多模型的能力。

但市场对于微软这次Copilot升级，似乎并不买账。

微软股价当日仅微涨约1%，本季度仍面临近25%的跌幅：这是2008年金融危机以来最差的单季表现。

华尔街更在意的，可能是落地数据：多模型来回调用的成本谁买单？企业员工真能把它融入日常工作流？

可以确定的是，这次升级改写了微软与OpenAI的合作关系，OpenAI在微软生态里的位置，已经从「唯一的王牌」变成了「牌桌上的一张」。

而对Anthropic、OpenAI、谷歌三家来说，值得警惕的是：当平台方开始把你的能力当作可替换的模块来编排，模型能力本身或许就不再是护城河了。

企业级AI正在从「聊天机器人」时代翻篇，进入「工作系统」时代。

这个转折点上，决定胜负的不再是谁家的benchmark最高，而是谁能把多个模型编排成一条可靠的、可审计的、可落地的工作流。

参考资料：

https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/

https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011

https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

来源:https://www.163.com/dy/article/KPCFO7SB0511ABV6.html

上一篇： Sora项目关停真相：日收不抵成本，内部反思停止支线开发

下一篇：两名95后校友创业估值50亿，获IDG与清华系加持

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

永劫无间账号购买平台推荐与安全交易指南

梦幻魔法公主善恶值系统解析与调整方法指南

茶叶蛋的冒险第14关荡秋千怎么过图文通关攻略详解

无畏契约源能行动一局游戏需要多长时间

茶叶蛋大冒险第16关怎么过相对运动图文通关攻略

蓝色星原旅谣角色强度榜与技能实战解析

蔚蓝星球零氪微氪新手攻略 20条技巧助你开局避坑

茶叶蛋大冒险第18关通关攻略图文详解隐藏关卡怎么过

文字三国志游戏评测与新手玩法指南

茶叶蛋神秘之旅第28关怎么过遵守规则通关图文攻略

NS版饿殍明末千里行今日发售全流程攻略与剧情解析

洛克王国倒影暗域地图位置与进入方法详解

洛克王国奇丽花性格选择攻略与对战搭配指南

洛克王国铁居小堡技能组合与实战搭配攻略

洛克王国水晶地穴位置与进入方法详解

洛克王国月光桃源进入条件与VIP权限详解

DNF千海天版本光枪毕业装备搭配指南

DNF千海天版本驱魔师最强毕业装备搭配指南

植物大战僵尸网页版2026最新官方入口地址与登录指南

DNF千海天混沌魔灵毕业装备搭配攻略

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

云顶之弈S14时空电容器装备效果详解发布于 2026-05-18

黑色四叶草手游夜见礼服技能效果解析发布于 2026-05-18

平民玩家神鹰养成攻略低成本高效提升战力指南发布于 2026-05-18

杀戮尖塔2战士职业玩法攻略与卡组推荐发布于 2026-05-18

英雄无敌上古纪元圣堂派系新手攻略与玩法详解发布于 2026-05-18

蓬莱风起古今最强神兵详解发布于 2026-05-18

和平精英最强武器推荐与实战搭配指南发布于 2026-05-18

娜娜莉配队阵容推荐与培养全攻略发布于 2026-05-18

永恒之塔2国际版Steam上线时间确定2026年正式运营发布于 2026-05-18

神谷英树坦言猎天使魔女3结局设计失误并致歉发布于 2026-05-18

万代南梦宫移除超级机器人大战Y的D加密保护措施发布于 2026-05-18

雾锁王国第八次大更新内容详解新增玩法与系统调整一览发布于 2026-05-18

XGP会员价格下调最新优惠与省钱攻略发布于 2026-05-18

王者荣耀农场偷菜规则更新每日可偷取四次奖励更稳定发布于 2026-05-18

天国拯救2与十字军之王3联动开启亨利角色加入战略游戏发布于 2026-05-18

《香缇小镇》Steam好评如潮微缩景观建造游戏获100%好评率发布于 2026-05-18

Win11语音搜索本地文件开启教程说话快速查找文档发布于 2026-05-18

Windows 11 虚拟化技术开启指南轻松运行虚拟机发布于 2026-05-18

Mac误删文件恢复指南苹果电脑数据找回方法详解发布于 2026-05-18

Mac清理大文件教程：快速查找与释放磁盘空间发布于 2026-05-18

Linux查看磁盘扇区大小命令详解与blockdev使用指南发布于 2026-05-18

Linux统计指定后缀文件行数脚本实例详解发布于 2026-05-18

Mac清理Sketch历史版本释放磁盘空间详细教程发布于 2026-05-18

统信UOS关闭开机磁盘自检与跳过扫描方法发布于 2026-05-18

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

GPT与Claude已接管Office：双AI协同写作与审稿

阿里千问AI语音助手上线聊天即可查询预订机票与值机选座

小米MIMO V25大模型公测开启性能对标全球顶尖模型

火山方舟OpenClaw安装步骤与详细教程

OpenClaw 一键安装脚本快速部署龙虾服务器

OpenClaw重置教程：人人养虾恢复出厂设置指南

GPT与Claude已接管Office：双AI协同写作与审稿

阿里千问AI语音助手上线 聊天即可查询预订机票与值机选座

小米MIMO V25大模型公测开启性能对标全球顶尖模型

火山方舟OpenClaw安装步骤与详细教程

OpenClaw 一键安装脚本 快速部署龙虾服务器

OpenClaw重置教程：人人养虾恢复出厂设置指南

阿里千问AI语音助手上线聊天即可查询预订机票与值机选座

OpenClaw 一键安装脚本快速部署龙虾服务器