面包屑图标 当前位置: 首页
AI资讯
热点详情

全球Agent都在卷的「Loop工程」:AI自己干活、监工和返工

AI热点日报
AI热点日报时间:2026-07-03
热点解读

昨天小雷刷到吴恩达在 X 上的一篇推文,讲的是 Agent 的 Loop(循环)工程。 图片来源:X 如果你最近半年用过 Claude Code、Codex、Workbuddy、Kimi Work 或者其他 Agent 产品,你可能已经感受到了那种变化——相比过去一句一句教 AI 干什么,现

最近业内流传着一则热门消息——吴恩达在 X 平台发布了一篇推文,深入探讨了 Agent 的循环(Loop)工程机制。

图片来源:X

如果你近半年使用过 Claude Code、Codex、Workbuddy、Kimi Work 或类似的智能体产品,应该能明显感受到一项重大变化:过去需要手把手地教导 AI 每一步该做什么,如今只需将需求输入,它就能自动编写代码、运行代码、发现错误后自行修正,直至完成任务。

这种“自主运转”的能力,正是 Loop 工程在 Agent 产品中的落地体现。

“你不再需要为 Coding Agent 撰写提示词,而应该设计 Loop。”6 月份,OpenClaw(龙虾)创始人 Peter Steinberger 的一条推文引起了广泛讨论。就在此前不久,Google 工程负责人 Addy Osmani 已系统性地梳理了这一概念,并正式提出了 Loop 工程。

图片来源:X

不过从公开信息来看,最早提出 Loop 概念,并率先将其在产品中落地发光的,其实是 Claude Code 的创始人 Boris Cherny。到了 6 月底,Anthropic 还专门发布了一篇博客,详细公开了 Claude Code 中四种核心的 Loop 原语。

短短一个月内,Loop 工程完成了从概念到行业共识的华丽转变,并迅速成为主流焦点。那么,Loop 究竟是什么?它对普通用户又意味着什么?

从提示词到 Harness 与 Loop,Agent 究竟多了哪些变化?

过去我们使用 AI,几乎离不开提示词。你让模型写代码、改文档、做研究,提示词写得越细致,结果就越符合预期。但当模型进化为 Agent,它不仅需要回答问题,还得知道何时读取文件、何时运行命令、何时查询网页、何时停下来向用户请示。此时,提示词工程和思维链已经远远不够用。

于是,Harness 工程应运而生。你可以把它理解为模型外部的运行框架,负责连接工具、管理权限、装载上下文、存储状态。模型依然负责推理和生成,但已经被放入一个能够执行任务的运行环境里。

Loop 工程则更进一步——它关注的核心是,如何让 Agent 围绕一个目标持续“循环”运作。

“龙虾”官方文档将 Loop 视为“基础”,图片来源:OpenClaw

简而言之,用户给出一个目标,Agent 先理解任务,再获取上下文,调用工具,观察结果,判断是否完成。如果未完成?那就继续改进,继续运行,继续检查。整个过程类似于人类工作的常态:先做一版,发现问题,再修订一版,直到结果可交付。

因此,Loop 的重点并不在于“循环”这个概念本身,而在于循环中究竟包含了哪些环节。

Claude Code 是最典型的例子。它并非简单地将 Claude 接入终端,而是让模型在一个 while-loop 中反复调用工具、编辑文件、运行命令、观察返回结果。真正复杂的地方反而在循环外部:权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储。

Agent 能否自主运转,依靠的不是模型一时兴起多想几步,而是整套工程设计在支撑它前行。

这也正是吴恩达此次讨论 Loop 工程的核心背景。到了 2026 年,Claude Code、Codex、ZCode、MiniMax Code 等 Agent 产品,已将“编写—运行—查看结果—再修改”变成默认能力。

Anthropic 在博客中将 Loop 划分为四种类型:turn-based(回合制)、goal-based(目标驱动)、time-based(定时触发)、proactive(主动式)。

- 你让它“帮我写一个登录页面”,它编写、测试、修改——这是 goal-based loop;

- 你每发送一条消息它回复一条——这是 turn-based;

- time-based 是你可以让它每隔两小时自动检查某个 PR,有更新就帮你审查;

- proactive 更为激进,它会自行发现问题,主动动手解决。例如发现测试覆盖率下降,它自行补充测试用例。

目标驱动 Loop,图片来源:Anthropic

这波讨论在 5、6 月突然升温,与产品进展也有直接关系。OpenAI 的 Codex 已不仅仅是“帮你写代码”的入口,而是在独立环境里读取仓库、修改文件、运行测试,再将日志和结果反馈回来。Anthropic 这边,Claude Code 本身几乎成为 Loop 工程的最佳样板。Boris Cherny 那句“不再自己写提示词,而是让一个 Agent 去提示 Claude”,听起来有些绕,但意思很清晰:人类不再负责每一步怎么询问模型,而应设计一套能让模型持续运转的机制。

这也正是 Loop 工程值得普通用户关注的地方。Loop 工程做得越好,Agent 就越像一个能承接任务的人:你给方向,它自行推进;跑偏了,它能从反馈中拉正;完成后,它会把过程和结果交给你检查。

放弃提示词,对普通人究竟有什么实际好处?

Agent Loop 对普通用户最直接的价值,就是大幅降低了提示词的设计门槛。

过去使用 AI,很像和一个聪明但缺乏经验的实习生合作。你需要告诉它每一步怎么做,何时停止,哪里需要查资料,哪里不能胡乱编造。你指挥得越细致,它表现越好;你说得越粗略,它越容易偏离方向。

而 Loop 做得好的 Agent,更像一个已经熟悉基本工作流程的人。你不需要每次都提醒它“如果代码报错就继续修改”,因为测试和返工本就是循环的一部分。你甚至不必一次性把所有上下文塞进对话框,因为 Agent 可以通过文件系统、搜索工具、记忆和索引,逐步获取所需信息。

这会改变用户与 AI 的关系。

以往用户写提示词时,往往需要扮演产品经理、项目经理、测试工程师和老师等多重角色。你要提供需求、拆分步骤、跟踪进度、纠正错误。未来,用户更像是设定目标并验收结果。

举例来说,你让 Agent 制定旅行计划。过去你需要写:预算多少、天数多少、先查机票、再查酒店、注意交通、整理成表格、最后汇总。Loop 做好之后,你只要说“下个月去东京 5 天,预算中等,想少折腾,多看展览”,Agent 就应该能自行查询时间、比较价格、规划路线、发现冲突、生成方案,甚至在你反馈“第二天太满”之后,自动重新安排。

这就是“放弃提示词比赛”的第一层含义:普通用户不再需要把自己训练成提示词工程师,Agent 产品应该替用户吸收那些复杂的流程。

另一方面,软件工程天然适合 Loop。目标可以写成 issue,过程可以拆成文件修改,工具可以运行测试,结果可以用 diff 和 CI 验证。Agent 写错了,系统马上能看到报错;修好了,也能看到测试通过。这种反馈闭环清晰、可验证、可沉淀,所以 Claude Code、Codex、ZCode、MiniMax Code 都先从代码场景突破。

图片来源:智谱 Zcode

但代码只是起点。研究、表格、PPT、数据分析、客服工单、法务检索、招聘筛选、运营监控——这些领域都有类似特征:任务不是一句话能完成,但成功标准可以明确写出,过程可以记录,结果可以检查。

这就是 Loop 的第二层价值:提升复杂工作的生产效率。人类不再紧盯每一步,而是负责定方向、看结果、调规格。吴恩达提到的 developer feedback loop,就是指 AI 能加速内部执行循环,但人依然要在更高一层循环中判断方向是否正确。

另外,体验不佳的 Agent,给人第一印象往往是“不稳定”“随意调用工具”“越做越偏离目标”。但从工程角度看,Loop 恰恰为可靠性提供了有力抓手。

在 Loop 工程设计下,Agent 为何搜索这个页面、为何修改这个文件、为何调用这个工具、为何判断任务已完成——这些都可以被记录。修复可以变成 skill,项目规则可以写进 AGENTS.md、CLAUDE.md 或类似的记忆文件。下一次 Agent 执行同类任务,就不需要重新摸索。

这里必须明确:Loop 不会自动带来可靠性。事实上,一个设计糟糕的 Loop,只会让错误更快地自我复制。

写在最后

过去三年,我们使用 AI 的方式经历了几次重大变化,但底层逻辑没有变——都是人发出指令,AI 执行,人再判断结果。人始终处在循环中,是驱动整个系统的核心。Loop 工程第一次把人从循环的中心移到了循环的外围:人不再是司机,而变成了导航。

这个变化的影响比想象中更为深远。对开发者而言,核心竞争力变成了定义问题、设计验收标准的能力。对产品来说,迭代速度会进一步加快,倒逼产品团队更懂用户、更懂业务——因为技术不再是瓶颈,判断力才是。

当然,所有这些都建立在一个前提上:模型还得继续进步。Loop 能转多少圈、能处理多复杂的任务,最终取决于模型的基础能力。如果模型跑个三五步就跑偏了,再精巧的 Loop 设计也无济于事。

好在从今年的情况看,模型进步的速度尚未放缓。GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4——半年时间,各家都更新了一代,而且每一代在 Agent 能力上都有显著提升。

模型越来越强,Loop 越转越顺,人越来越往后退。这个趋势已经十分清晰。

这件事听起来似乎只是效率提升,但仔细想想,它可能是 AI 从“工具”变成“协作者”的关键一步。工具是你使用它,你得知道怎么用、每一步如何操作。协作者是你告诉它目标,它自己想办法,你们一起把事情做成。

我们现在可能就站在这条分界线上。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:全球Agent都在卷的「Loop工程」:AI自己干活、监工和返工要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://36kr.com/p/3878518284565125
其他

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-04 19:00
Daetama数据科学完整准备工作系统指南与精选学习资源汇总

Daetama是面向数据科学面试和SQL能力提升的练习平台,已收录超100个覆盖基础到进阶的SQL题目,求职板块与课程模块在开发中,团队保持每周更新节奏,提供系统性刷题与模拟面试场景。

AI热点2026-07-04 19:00
AI驱动配音平台 Speakmulti

SpeakMulti是一款AI驱动的配音平台,可将YouTube视频翻译成多种语言,保留原始说话者的音色和语调,降低本地化成本。用户提交视频并选择目标语言后,AI自动完成配音,并由专家团队审核,确保准确自然。

AI热点2026-07-04 18:59
Umi-OCR图片转文字识别软件

需求人群 如果你经常需要从图片中提取文字——例如整理截图内容、翻译图片里的外语文本、识别带有水印的图片信息——那么 Umi-OCR 无疑是一款相当实用的工具。它完全在本地运行,无需联网,对隐私保护极为友好。 产品特色 这款工具的核心亮点都集中在实用性上。截屏识别操作非常顺手,按下快捷键即可框选区域,

AI热点2026-07-04 18:59
用AI生成你最爱的画家或艺术运动风格绘画

艺术创作与人工智能的融合,正在开启一个全新的创作时代。moonlightai 正是这样一款AI绘画工具,能够帮助用户通过人工智能快速生成不同风格的绘画作品——无论你想复刻文艺复兴时期的古典优雅,还是为画作注入梵高般炽热的笔触,甚至从艾沃佐夫斯基的海浪星空中汲取灵感,它都能轻松实现。 需求人群 简单来

延伸阅读