当前位置: 首页
科技数码
阿里发布QoderWork桌面Agent仅实习生水平可处理杂活

阿里发布QoderWork桌面Agent仅实习生水平可处理杂活

热心网友 时间:2026-06-12
转载

AI 实习生,已经正式上岗了。

阿里最近推出的 QoderWork,将原本专注代码的 Qoder Agent 能力,拓展到了日常办公领域。它的核心目标很明确:桌面 AI 不应该停留在“回答问题”的层面,而是要真正开始“完成工作”。

截屏2026-06-09 18.50.52.png

这个场景是不是特别眼熟?腾讯的 Ma vis、月之暗面的 KimiWork,还有第三方大神开发的 DeepSeek GUI,其实都在做同一件事——挑战 Codex 的地位。QoderWork 的打法也很常规:文件整理、数据分析、文档生成、研究整合、浏览器自动化,一个都不少。

当然,和 Codex 这类产品相比,它最大的优势在于更接地气。QoderWork 底层运行的是 Qwen 模型,目前 Qwen 3.7 Max 限时 15 天免费使用,诚意可以说是很足了。

说实话,“桌面 AI Agent”这个词过去两个月已经被反复提及。每个产品都在标榜自己能“干活”,但到底能不能?以下是实际体验后的结论。

QoderWork 长得就不像聊天机器人,这很重要

QoderWork 和大多数 AI 工具的使用方式有本质区别。就拿 Qwen 网页端来说,你问一句它答一句,所有内容都保存在聊天记录里。QoderWork 的逻辑是“任务”——你发起一个目标,它拆解成若干执行步骤,跑完后把产出物保存为文件。整个任务会保留在任务列表中,可以回溯、可以继续、可以监控。这种模式,听起来差别不大,实际上天壤之别。

以实测为例,在任务模式下,“苹果 WWDC2026 文章”、“商务介绍 PPT”、“IFA 2026 专题网页”都作为项目挂在左侧列表。点进去能看到执行步骤、产出文件,也能在原来的对话里继续调整。如果只是 AI 聊天,聊完也就结束了,你得到的不过是一段对话记录,仅此而已。

截屏2026-06-09 10.42.24.png

右侧的“任务监控”区域会显示待办步骤、最终文件、工作文件,以及调用过的技能和 MCP 能力。在第一轮文章任务中,监控列出了“研究写作风格-搜集 WWDC 2026 信息-提出选题角度并选定方向-撰写完整文章-生成 Word 文档”这一整条执行链路。这至少能让用户大致了解 AI 在每个阶段都做了些什么。

截屏2026-06-09 10.52.53.png

功能层面,QoderWork 提供了“专家套件”、“技能市场”、“定时任务”和“应用快照”。专家套件面向不同岗位集成能力,法律、产品、合同、投研、财税,安装完整套装就能直接用,不用自己拼凑工具。技能市场更接近插件机制,深入研究、数据分析、PPT 生成、Notion 信息图都在里面。第二轮 PPT 测试中,QoderWork 主动调用了 PPT 技能,又在发现系统缺少 Node.js 环境时询问用户是否安装依赖。这说明它有主动补齐工具链的意识,会把任务推进到最终文件。

截屏2026-06-09 15.08.52.png

定时任务也很好理解。提供的案例包括“午间充电站”、“每周竞品动态追踪”、“每日下载文件夹清理”、“每日数据报表更新”,这些任务可以设置成定期自动执行。如果稳定可用,它比普通聊天助手更容易产生长期价值。不过,目前这些定时任务需要电脑保持唤醒,断网或关闭屏幕就会失效。

截屏2026-06-09 15.09.04.png

应用快照是新潮功能之一。简单来说,它能把最前方的应用界面捕获为截图和可读文本上下文,让 QoderWork“看见”用户当前正在使用的界面。这是桌面 Agent 真正区别于网页 AI 工具的地方,也是权限门槛最高的地方。开启后需要授予 Computer Use、屏幕录制和辅助功能权限,macOS 上的首次授权流程可能需要一些时间。

截屏2026-06-09 15.09.13.png

整体来看,作为版本号还是“0.5”的一个桌面级 Agent,QoderWork 该有的功能基本都有了。技能和任务提供了很丰富的选择,任务链、思考流程也很完善。更值得一提的是限时免费的 Qwen 3.7 Max,这应该是目前最强的代码模型之一了。

写文章、做 PPT、搞网页,这个 Agent 真能干活

我们给它设计了三类测试,尽量贴近科技媒体编辑部的实际工作需求。第一轮,让它模仿风格,完全自动化地写一篇苹果 WWDC 2026 的文章并生成 Word 文档;第二轮,从 0 开始制作一份商务介绍 PPT;第三轮,做一个 IFA 2026 展会报道专题网页,代码、交互、响应式一个都不能少。

第一轮:写文章报道 WWDC,事实有些纰漏

第一轮任务,是让 QoderWork 研究官网最近的写作风格,整理苹果 WWDC 2026 的重点信息,完成一篇符合风格的稿件,并生成 Word 文档。资料搜索、风格识别、选题判断、长文写作和文档交付,这基本是一条编辑助理的完整工作链路。

QoderWork 完整跑通了整个流程。它分析写作风格,搜集 WWDC 2026 信息,给出三个选题角度,等用户确认方向之后继续撰写,最后生成 Word 文档。这个“等用户确认”的动作值得特别说一下——它在关键决策节点上停下来,没有擅自推进,说明它在一定程度上具备了“可控执行”的意识。

截屏2026-06-09 11.19.00.png

最终产出的文章,标题是《Siri 换脑重生!苹果 WWDC 2026 最大的悬念:补课两年,AI 这仗还能打赢吗?》,正文约 3500 字,包含导语、小标题、观点判断和结尾互动。能看出它努力写成了一篇有立场的科技媒体稿,有短句开头、口语化判断,也有围绕核心问题的结构。

但问题很明显。文章里出现了一些需要强来源支撑的信息,包括“每年 10 亿美元”、“1.2 万亿参数 Gemini”、“macOS Golden Gate”、“放弃 Intel Mac 支持”、“第三方 AI 模型作为默认对话引擎”。这些内容没有可靠的公开来源就写进正文,是非常典型的 AI 写稿问题。成稿看起来像样,不代表事实可靠。对科技媒体来说,这一点非常关键。

截屏2026-06-09 18.54.56.png

风格模仿上,“小雷哔哔”、“苹果终于急了”、“慢如蜗牛”、“掰开揉碎了聊”这类表达密度明显偏高。更像是在刻意模仿风格,而不是真正内化了那种有判断力、有信息密度的写法。真正可发的稿子,应该把口语感压一压,把判断和信息量提一提。

截屏2026-06-09 18.55.37.png

第一轮可以给到 7.5 分。它能完成编辑助理级别的完整工作流,但还不能当责任编辑——事实核验和风险判断仍然需要人工把关。

第二轮:PPT 确实做出来了,但审美差强人意

第二轮任务,是让 QoderWork 从 0 开始做一份商务介绍 PPT,假设受众是潜在合作伙伴。它需要搜索公开资料,整理媒体定位、内容方向、受众和合作价值,并生成可打开的 PPT 文件。

截屏2026-06-09 11.31.47.png

过程中发生了一件很能说明 QoderWork 能力边界的事:它发现系统缺少 Node.js 和 npm 环境,于是请求安装 Node.js v20 LTS,获得允许后自己下载安装依赖,又继续安装 PPT 技能所需的 npm 包,最后生成文件。普通 AI 聊天工具遇到环境缺失时,通常停在“建议层”——告诉你该安装什么,但不会自己推进。QoderWork 会主动尝试补齐工具链,把任务真正推进到文件生成,这是一个质的差别。

截屏2026-06-09 11.46.05.png

最终产出的是商务介绍 PPT,共 13 页,结构包含封面、目录、平台介绍、关注领域、内容优势与影响力、合作价值、合作方式和致谢页。结构逻辑是对的,封面和版式也有一定设计感,卡片、章节页、数据高亮页基本完整。作为 15 分钟左右生成的初稿,效率没话说。

截屏2026-06-09 18.56.49.png

但它最遗憾的问题,是商务 PPT 第一页最重要的东西缺失了:真实的 logo。它用了生成插画或泛科技视觉代替。说实话,没有公司 logo 对于一份商业合作介绍 PPT 来说,相当不专业。

另外,目录页还出现了模板残留的“05 I am the chapter name”,最后一页用了英文“Thank you!”。这些都是非常低级但非常明显的瑕疵,说明它虽然声称验证了 PPT,但实际上没有做到逐页检查。PPT 内使用的“全平台粉丝 600 万+”、“AWE 单次报道阅读 900 万+”等数据,声称来自公开资料,但没有任何脚注或来源说明,用在商务材料里需要重新核实。

截屏2026-06-09 18.57.34.png

第二轮也是 7.5 分。它确实从 0 到 1 做出了可打开、结构完整、有视觉设计的文件,但距离“可以直接发给客户”,还有一段距离。不过话说回来,目前几乎所有 Agent 做 PPT 都没办法抽一次卡就达到 100% 满意,这个效果尚可接受。

第三轮:做一个展会专题网页,完成度很高

不出所料,Qwen 3.7 Max 在第三轮专题页制作上的表现确实出色。

第三轮任务是让 QoderWork 做一个 IFA 2026 展会报道专题网页。它需要参考官网展会专题页,但不照搬设计。页面需要包含首屏大标题、展会导语、重点报道、现场快讯、图集、深度评论、展品分类,并用 HTML、CSS 和 JavaScript 生成可本地打开的静态网页。

截屏2026-06-09 11.50.04.png

先检查需求是否满足:页面包含 7 个 section,分别是首屏、导语、重点报道、展品速览、现场快讯、图集、深度评论。导航栏可跳转,卡片有 hover 效果,展品分类支持“全部、AI 硬件、智能汽车、智能家居、手机数码、机器人”的切换。桌面端和 390px 手机宽度下没有横向溢出,控制台也没有报错。移动端切换了汉堡菜单,页面主体显示正常。零出错。

截屏2026-06-09 18.58.49.png

深色科技风、蓝色高亮、固定导航、几何装饰元素和卡片布局基本完整。更重要的是,它写了真实可运行的代码,功能能跑、交互能触发,而不是生成了一张截图。这一轮最接近“桌面 Agent 帮用户完成一个前端任务”的预期,也是三轮测试里表现最扎实的一次。

当然,硬要挑刺的话,还是没有用真实 logo,用了蓝色方块加“L”代替。demo 可以接受,真实上线版本当然不行。而且图集和产品视觉大量使用 emoji 代替,机器人、汽车、手机、耳机一排排摆着。目前没有上线真实内容,它找了一些杂乱的文本来填充,做法可以理解,但不太美观。

截屏2026-06-09 18.59.14.png

三轮测试下来,可以给到 8 分。它证明了 QoderWork 在静态网页生成上,已经比写稿和 PPT 更接近可交付状态。

这三轮体验下来,能明显感觉到 QoderWork 确实已经实现了从“只会回答”到“能干活”的阶段性跨越。但目前成品的质量,可能需要多抽几次卡、多调整几次,才能真正投入到工作流中。

国产桌面 Agent,依然只是“实习生”水平

桌面 AI Agent 这件事,最近一年被反复提及,但真正能让人觉得“它在替我完成工作,而不是在协助我工作”的产品,其实还很少。QoderWork 做到了吗?三轮测试给出的答案是:已经很接近,但完全解放双手还不可能。

这件事的本质,其实是一个权力与责任的问题。普通 AI 聊天工具的逻辑是“我给你建议,你来决定”,用户拿到的是一段文字,然后自己决定要不要做。QoderWork 试图改变的是“我直接交付成品,你来使用或调整”。这一步的跨度,比表面上看起来要大得多。因为“交付成品”意味着 AI 要对内容质量负责——事实准不准确、格式合不合规,而且一旦发生错误,很可能要推倒重来。

截屏2026-06-09 10.44.23.png

QoderWork 目前解决了“从 0 到有初稿”的问题,但还没有解决“从初稿到直接能用”的问题。当然,退一步说,现在还没有哪个 Agent 能说自己 100% 命中,一次抽卡就给出能用的成品。

所以,更愿意称 QoderWork 为桌面的“AI 实习生”。它能干活,但未必干得好;它能省去很多启动阶段的时间成本,比如写一篇文章,至少不用从零开始收集资料。至于它什么时候能从“能做初稿”进化到“可以放心交付”?这或许就要交给时间去见证了。

来源:https://www.leikeji.com/article/77294

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
存储芯片价格暴涨10倍 现存相关企业超87万家

存储芯片价格暴涨10倍 现存相关企业超87万家

存储芯片价格暴涨,8TB固态硬盘售价达2 5万元,DDR5内存均价涨288%,车规级芯片涨180%。根源系AI算力爆发挤占产能,云厂商锁死供给,下游手机被迫涨价。紧缺格局至少持续至2026年。目前国内芯片相关企业超87万家,广东占比31 65%。

时间:2026-06-27 12:20
长恨歌六月惠民福利月系列活动上线

长恨歌六月惠民福利月系列活动上线

先说一个趋势判断:当前“十五五”规划周期已进入关键阶段,文旅深度融合、品质升级、惠民让利、消费激活这几条主线正在同步加速推进。今年暑期,全国文旅市场迎来一轮消费热潮,而“跟着演出去旅行”这个现象级趋势,正从小众选择进化为一股足以撬动地方文旅经济的新势力。在这个关键节点上,作为陕西文旅的标杆产品,舞剧

时间:2026-06-27 12:19
八位堂V3紫色版街机摇杆发布:三模连接宏编程,售价43元

八位堂V3紫色版街机摇杆发布:三模连接宏编程,售价43元

今天我们来聊聊八位堂街机摇杆V3的全新配色版本。六月十八日,这款经典的复古风格控制器正式推出了紫色款——没错,就是那种既充满怀旧韵味、又带点潮流气息的视觉新选择。 别以为只是换了个颜色,内在配置同样毫不含糊。这款摇杆支持三模连接——有线、无线(2 4G)以及蓝牙,三种模式一应俱全。主流游戏平台几乎都

时间:2026-06-27 12:19
魔声AC229开放式耳机15x7mm动圈32小时续航209元

魔声AC229开放式耳机15x7mm动圈32小时续航209元

魔声OpenEarAC229开放式耳机,售价209元,国补后仅169 2元。采用开放式不入耳设计,单耳仅重5 6克,亲肤硅胶材质佩戴舒适。搭载15x7mm大动圈单元,四麦克风ENC智能降噪,蓝牙6 0低延迟连接。单耳续航8小时,配合充电盒总续航可达32小时,满足日常使用。

时间:2026-06-27 12:19
HKC推出新款G24H3MAX 23.8英寸全高清260Hz高刷电竞显示器仅569元

HKC推出新款G24H3MAX 23.8英寸全高清260Hz高刷电竞显示器仅569元

HKC推出23 8英寸电竞显示器G24H3MAX,1080P 260Hz FastIPS 1ms,首发569元。色域125%sRGB 93%DCI-P3,有HDMI和DP,支持壁挂,适合预算有限的高刷玩家。

时间:2026-06-27 12:19
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜