Agent集体进化 腾讯谷歌加码 AI打工人要普及了吗
AI Agent 正在占领你的“工位”:从问答工具到数字同事的蜕变
最近X首页上有些微妙的变化,Agent 相关的内容明显多起来了。但和以前那种「某某模型能答对多少题」的画风不同,大家似乎正集体转向一个更务实的问题:哪个 Agent 能真正帮我把手头的事干完?
这股转向,不只是风向标的问题,而是实在的落地需求在推着它往前走。刚刚过去的5月,几件标志性事件接踵而至,让这个趋势变得格外清晰。
5月20日,腾讯推出了「马维斯」(Marvis),其最新的定位是「操作系统层级 AI 助手」。这个产品横跨 Windows、macOS、安卓三端,内置了6个7×24小时在线的专项 Agent。它们各司其职,覆盖文件、浏览器、应用、搜索和计算机操控等领域,开箱即用。紧接着,OpenAI 在5月21日宣布 ChatGPT 以 add-in 形式嵌入 Microsoft PowerPoint,免费用户和 Business 订阅者都能在侧边栏直接用自然语言生成或修改 PPT。而在同一周,Google 在 I/O 2026 上发布了 Gemini Spark,一个能够在 Google Cloud 专属虚拟机上 24 小时持续运行的个人 Agent,它可以读取你的邮件、修改你的文档、通过 Chrome 操作网页,你甚至不用一直盯着它。

(图源:雷科技制图)
这不难理解,为什么风向转得这么快。在经历过大量 AI 工具的信息轰炸后,大多数普通人已经不那么关心一个模型能答对多少数学题,反而更在意:哪个 Agent 能帮我搞定手头的活儿?
当 AI 真正开始“打工”
先说 ChatGPT for PowerPoint。加入 add-in 后,PowerPoint 右侧会多出一个侧边栏。你告诉它「做一份面向投资人的产品演示,从上周的 Outlook 里找项目进展」,它就会自己去拉取数据、生成内容并排好版,全程不需要你离开 PowerPoint。它能连接 Gmail、Outlook、SharePoint,这意味着它在尝试帮你整合信息,而不仅仅是生成内容。
实际体验下来,生成一份结构完整的初稿速度很快,很适合开会前临时需要一份 PPT 的场景。当然,OpenAI 也坦言,复杂的模板处理或字体排版目前还不太支持。

(图源:雷科技制图)
说实话,这类 AI 工具插件并不少见,它们还是在某个具体的场景里提供帮助,而且目前都不算特别成熟。但腾讯推出的马维斯则不同。它更像一个网状式的 Agent 智能体集合,由主 Agent 统筹任务,下面调度 File、Computer、App、Browser、Search 等专项 Agent 并行执行,把系统、文件、应用、算力、甚至跨端操作都纳进同一个中间层。你告诉它「帮我找上周 PM 发给我的那份 Agent 架构图 PPT,文件名忘了,保存在桌面上」,它会去扫描文件内容、做语义理解,而不是在文件夹里做简单的关键词搜索。

(图源:雷科技制图)
实际测试了几个场景,比如让它准备一份复盘会上的材料。马维斯的回答是先制定会前准备表,再给出一个 90 分钟的议程,顺序非常符合实际工作流。它还会把会前动作拆分成可分配的任务:运营去拉线索质量数据、产品来汇总客户反馈、销售整理卖点问题,每项都有负责人和预期产出。尤其聪明的一点是,它会自动把「卖点不清楚」这类模糊要求,转化为「整理客户原话和具体场景」,非常实用。
再比如,我们上传了一份 Word 经营简报和一张 Excel 明细表,要求它找出销售额、毛利、地区排名并指出明显异常。结果,它调用了 File Agent,将两份文件做了跨表串联,给出了销售额 2,357,512、毛利 836,257,并指出华南地区最高。它还识别出了重复客户电话、空负责人、零数量售后单和异常大单等问题。
当然,等待时间是个不容忽视的问题。简单的开场问答大约需要 30 秒,不是瞬时响应;文件分析从提交到最终结果约需 6 分钟,且中间过程的颗粒度还不够细,你能看到 File Agent 在处理,但不知道它读到了哪一步,还需要多久。不过,对于「手上有材料、开会前想快速扫一遍」的场景,6 分钟还是可以接受的。

(图源:雷科技制图)
马维斯能成功出圈,很大程度上与其设计有关。在侧边栏可以找到一个名为「办公室」的页面,打开是一个白色 3D 办公室场景,Marvis、App Agent、Browser Agent 像几个员工坐在各自的工位上,右侧则显示今日任务完成数、Token 消耗和进行中的任务。它用有趣的动画,直观地展现了 Agent 之间如何协作、分配任务的过程。和那些枯燥乏味的工具相比,「AI 牛马」的形象实在深入人心。
无论深度如何,从在 PowerPoint 里帮你一键出稿,到在你的电脑上帮你调文件、开会议、扫异常,这些产品都指向同一个方向:AI 正在从一个回答问题的工具,变成一位坐在工位上处理杂活的同事。唯一的区别是这个同事具体是干杂活,还是干更专精的活。
「AI 工位」之战:腾讯、OpenAI、Google 为何全力押注
这一轮对「AI 工位」的热抢,很大程度上是从 OpenClaw 烧起来的。
OpenClaw 的前身是 Clawdbot,由奥地利独立开发者 Peter Steinberger 在 2025 年 11 月打造,是一个开源的、可以跑在本地的项目。起初并未引起太多关注,直到 2026 年 1 月,几个视频开始流传,例如「AI 自主买车」和「30 分钟完成代码迁移」,开发者圈子瞬间被引爆。Clawdbot 两次因商标问题改名,最终定名 OpenClaw,从第一个版本到 GitHub Stars 突破 25 万,只用了大约 60 天,这个速度甚至比 React 十年的积累还快。它的创始人随后在 2 月加入了 OpenAI,继续深耕 Agent 方向。
OpenClaw 之所以能爆,不只是因为它新,而是它第一次让普通用户真切地体验到「AI 在帮我干活」的感觉,而不仅仅是「AI 在帮我回答问题」。它能读取本地文件、操作应用程序、调用浏览器、执行多步骤任务,通过一套名为 ClawHub 的技能注册表将 LLM 与真实工具连接起来。这套架构证明了一件事:把 AI 变成一个真正在电脑上干活的角色,技术上可行,而且用户非常愿意为此买单。

(图源:雷科技制图)
OpenAI 最初推出 Codex 时,它只是一个纯粹的 AI 代码工具,帮助开发者写代码、修 bug、提 PR。但从 2025 年 5 月到现在,Codex 悄然进化成了另一个东西——它能操作电脑、运行内置浏览器、处理图片、跨工具执行任务,还加入了「Goal Mode」,即你只需说出一个目标和成功标准,它便会持续运行直到任务完成。
这个变化并非 OpenAI 一开始就规划好的产品路线。一个足够能干的 Agent,只要在某一个场景里证明了自己,就会自然地往相邻任务扩张。编程之后是代码调试,调试之后是项目管理,项目管理之后是操作浏览器、处理文件、理解上下文……
这也解释了为什么腾讯要从操作系统层面切入,Google 要把 Gemini Spark 做成 24 小时不间断的持续 Agent,微软要在 PowerPoint 里推进 Agent Mode,而不是继续升级那个已经够用的聊天窗口。Gemini Spark 内置了对 Gmail、Google Docs、Sheets、Slides 的原生调用权限。本质上,他们都在抢同一个位置——「AI 工位」。

(图源:雷科技制图)
「AI 工位」最核心的根本不是一台装了 AI 软件的电脑,也不是桌面上多出一个聊天框。更准确地说,它代表了一种新的工作关系:当人把目标、材料、权限和验收标准交给 AI,AI 就在文件、应用、浏览器、系统和云服务之间调度动作,人则从执行者转变为管理者、审核者和最终拍板的人。当然,这其实就是把 AI 当「牛马」用。
加速迭代的 AI 办公,最终受益的是普通人
AI 工位对普通人的意义,并不是让每个人突然拥有一个高大上的智能办公室,而是把「我亲自操作软件」变成「我分配一件工作」。你不再需要记住材料放在哪个文件夹、哪个应用负责哪一步、输出结果要复制到哪里,而是将目标说清楚,让 AI 去查找、阅读、整理、调用工具,最后把结果交还给你。就像你在使用马维斯时,可以看到哪个 Agent 被调用,哪个 Agent 又跑去「摸鱼」了。
这也是为什么它会比单点工具更适合普通人,也更成为大厂们想要抢占的入口。一个 PPT 插件再好,本质上只是帮你做一份 PPT;一个真正成熟的 AI 工位,在完成 PPT 之余,还会顺便帮你准备好汇报所需的其他内容。这就是插件与 AI 工位的本质区别。

(图源:雷科技制图)
当然,就目前而言,普通人最先感受到的可能是 AI 工位的副作用。AI 要替你干活,就必须看到更多文件、拿到更多权限、理解更多上下文。以前你丢给聊天机器人一句话,错了大不了重问,但现在你把一串任务交给 Agent,错的可能是文件、数据、日程、格式,甚至是一次对外发送。所以,在 AI 工位真正普及之前,用户需要学会的不是更复杂的提示词,而是更清楚地定义目标、限制边界并检查结果。
但至少,AI 工位正在试图把我们从“打工的牛马”状态中解放出来,这也许才是它真正能够爆火的核心原因。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%
国行iPhone18ProMax电池容量达5391mAh,较前代增幅11 78%,增量近568mAh;Pro机型仅小幅提升68mAh。爆料称最终数据待验证,若属实则续航将显著增强。
HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池
HMDGlobal推出4款诺基亚功能手机,均配1450mAh可拆卸电池及独立AI按键,支持语音控制,免费180天后付费。部分机型带摄像头,支持microSD卡扩展至32GB,具双SIM卡、3 5mm接口及蓝牙5 0。
云南以旧换新补贴扩围 新增智能影音与无人机
云南省自2026年7月起扩大消费品以旧换新补贴范围,新增智能门锁、智能影音、无人机、数码相机等数码智能产品及吸油烟机、燃气灶、洗碗机、净水器等家电。按最终售价15%补贴,每类每件最高1500元,商户报名无限制。
小米Redmi 7英寸高性能手机传闻即将发布
最近圈内又有新动静了。据博主 @数码闲聊站 今天爆料,某家厂商的子系列下一代打算推出两款屏幕尺寸差异明显的机型:一块是 6 59 英寸的中屏 Pro,另一块则是 7 英寸的巨屏性能机。从该博主以往的爆料习惯来看,基本可以锁定是小米 REDMI 品牌的产品线布局。 有意思的是,早在今年 2 月,这位博
深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售
深光影像AF35mmF2 2CE全画幅镜头开售,提供E卡口和L卡口,标准版七百三十九元,套装版七百八十九元。全金属机身,重约一百七十五克,高三十六毫米,滤镜口径五十二毫米,光学结构五组七片,九片光圈叶片,最近对焦零点三五米,支持自动对焦。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-05 13:32
2026-07-05 13:32
2026-07-05 13:31
2026-07-05 13:31
2026-07-05 13:30
2026-07-05 13:30
2026-07-05 13:30
2026-07-05 13:30
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

