当前位置: 首页
AI资讯
AI办公实测准确率不足25%,发展却快于预期

AI办公实测准确率不足25%,发展却快于预期

热心网友 时间:2026-01-26
转载

IT之家1月26日引述Digital Trends 24日报道称,一份由数据训练公司Mercor发布的研究报告指出,当前主流人工智能模型在处理实际办公任务时表现不尽人意,最高准确率未超过25%。该研究证实,AI在短期内仍难以替代人类知识工作者。

新测试表明AI实际办公准确率不达25%,但进展比想象更快

这项研究基于Mercor最新推出的APEX-Agents基准进行测试。与以往主要通过写诗和解数学题来评估AI的传统方法不同,该基准直接采用了律师、顾问和银行家的真实工作流程,要求受试模型完成跨越多个信息来源的多步骤综合任务。

结果显示,即便是市场上明显处于领先地位的模型,其准确率也无法达到25%。测试中表现领先的Gemini 3 Flash和GPT-5.2,准确率也仅为24%和23%,而其他大多数受试模型的成绩则不高于20%。

新测试表明AI实际办公准确率不达25%,但进展比想象更快

为何AI会在“办公测试”中表现不佳?Mercor首席执行官Brendan Foody分析认为,AI失败的关键在于缺乏上下文处理能力。在真实办公场景中,任务往往需要整合分散的资源,比如查看日程、翻阅即时通讯记录、阅读PDF文档和电子表格。而AI在进行跨源信息搜索与整理时,容易出现混淆、出错,或者干脆放弃。这导致目前的AI在办公室里更像一个“不可靠的实习生”,而非成熟的专业人员。

IT之家附APEX-Agents准确率测试结果如下:

Gemini 3 Flash - 24.0%

GPT-5.2 - 23.0%

Claude Opus 4.5 - 18.4%

Gemini 3 Pro - 18.4%

GPT-5 - 18.3%

Grok 4 - 15.2%

GPT-OSS-120B - 4.7%

Kimi K2 Thinking - 4.0%

尽管表现有限,但AI的进步速度引人关注。Foody指出,一年前同类测试的准确率仅为5%-10%,如今已提升至24%,AI的学习速度远超预期。不过,研究也强调,在掌握多任务处理和上下文切换能力之前,AI尚无法胜任复杂的知识工作。

来源:https://tech.ifeng.com/c/8qDzcp6x8IQ

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
豆包AI读书笔记制作指南 快速提炼书籍核心内容

豆包AI读书笔记制作指南 快速提炼书籍核心内容

豆包AI能根据书籍类型与笔记需求,通过多种方式提炼核心内容。常见书籍可直接输入书名获取摘要;冷门或内部资料可上传文件分析。深度阅读可分章节提问构建结构化笔记,长篇PDF可借助插件自动处理。无章节标记的文本需手动引导AI划分逻辑单元并概括,最终整合为连贯笔记。

时间:2026-05-23 18:17
海螺AI产品FAQ自动生成功能使用教程

海螺AI产品FAQ自动生成功能使用教程

使用海螺AI高效生成产品FAQ需遵循三阶段流程:首先从真实用户交互中提炼5-8个高频问题样本;其次通过结构化提示词强制AI输出编号清晰的问答格式;最后必须人工校验关键业务信息,确保版本、链接及合规声明的准确性。此方法能产出精准实用的FAQ文档。

时间:2026-05-23 18:16
CodeBuddy代码补全触发方式设置与切换指南

CodeBuddy代码补全触发方式设置与切换指南

CodeBuddy提供灵活的代码补全功能,可通过状态栏图标或设置按语言启用,并自定义自动触发条件(如新行、缩进、括号输入)。支持快捷键手动唤出补全面板,可选择基于行或词的补全粒度,还可通过命令面板使用前瞻性补全,全面适配个人编码习惯。

时间:2026-05-23 18:16
灵珠AI辅助学术论文写作全流程指南

灵珠AI辅助学术论文写作全流程指南

灵珠AI平台通过多模态能力辅助学术论文写作,构建高效工作流:将文献图像转为结构化文本以快速精读;提取单页资料要点;横向对比多篇文献方法并生成表格;通过语音交互润色段落;将实验记录图像自动转化为符合期刊要求的方法描述。这些工具节省研究者重复性劳动时间,使其更专注。

时间:2026-05-23 18:15
Hermes Agent自动内容生成功能使用指南

Hermes Agent自动内容生成功能使用指南

使用HermesAgent自动生成内容需先通过配置文件定义身份与平台规范,再输入结构化指令触发生成。Agent调用知识库确保可信,通过语义转换适配多平台格式,并可绑定现有文档提升准确性。最后借助本地化渲染插件输出PDF等格式,形成可控的自动化生产闭环。

时间:2026-05-23 18:14
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程