OpenClaw从零入门完整教程
Note
硅谷流行词:FOMO — Fear of Missing Out
这是一种焦虑心理状态,字面意思是"害怕错过",描述当你觉得别人正在经历精彩事物、而自己缺席时产生的不安感。
在 AI 时代,FOMO 有了全新的含义——不再只是"怕错过派对",而是演变成了一种职业与生存层面的焦虑。
第零部分:AI 正在重写这个时代的游戏规则
0.1 AI 时代之前:车间里的师徒制
在 AI 出现之前,无论哪个行业,积累经验的方式都像这张照片——
靠时间 + 靠天赋 + 靠师傅带。 没天赋的磨时间,有天赋的磨洋工,有天赋有师傅的当厂长
在工厂,有"8级钳工"、"8级焊工"。这个"8级",不是证书考出来的,是几十年的伤疤和老茧磨出来的。新人进厂,先扫三年地,再摸三年机器,慢慢攒出一手绝活。
对应到互联网行业,就是:
- P8 资深工程师:10年经验,踩过所有坑
- XX 领域专家:代码写到骨子里,架构图张口就来
- 总监、VP:靠多年业务积累,每个决策背后都是一堆失败教训
这套体系运转了几十年,效果很好。经验 = 核心价值,时间 = 竞争壁垒。
0.2 AI 时代来临:大模型开始"扮演一切"
GPT3问世之后,大模型概念出现了,GPT4之后,大模型开始百花齐放。
它不需要从学徒做起。它在被训练的那一刻,已经"读过"了人类几乎所有公开的文字、代码、论文、案例——相当于同时拥有了几千个领域专家的知识。
你问它架构设计?它能答。让它写代码?秒出。要它做法律分析?没问题。需要写营销文案?随时。
之前花10年才能积累的认知,AI 在一秒钟内就能角色扮演。
这意味着什么?
这不是危言耸听。这正在发生。| 七步之外还是枪快,七步之内,枪是又准又快啊
0.3 新的工作范式:少数人 + 一群数字员工
看看这张图——偌大的工厂,产线上全是机器人,人在哪里?在楼上的玻璃房里,看大屏、做决策、处理异常。
这就是未来工作模式的缩影:
过去:100人 × 1倍效率=100倍产出未来:10人 × 10倍效率(AI加持下会一直增长)=100倍产出
具体到知识工作者,未来的模式很可能是:
几个懂得指挥 AI 的人,带领一队数字员工完成任务。
- 不是 AI 替代你,而是你用 AI 替代重复性的自己
- 关键能力从"会做"转变为 "会设计架构""会指挥"、"会验收"、"会设计流程"
- 谁先学会高效驾驭 AI 工具,谁就先拿到下一个时代的入场券
而 OpenClaw,正是这场变革中最具代表性的工具之一——一个真正数字员工的雏形。
番外篇:龙虾创始人的传奇人生
——一个奥地利程序员如何从退休富豪到引爆 AI 圈
少年天才:14岁就在键盘上"开窍"
故事的主角叫 Peter Steinberger(彼得·斯坦伯格),奥地利人,出生在维也纳乡村。
14岁,大多数男孩还在打游戏,他已经开始写代码了——那年夏天,家里来了个住客,随身带了一台PC,少年Peter第一次摸到电脑,从此一发不可收拾,就像很多人第一次吃到螺蛳粉一样,闻着臭但上了瘾。
后来他考进了维也纳科技大学计算机专业,毕业后跑到硅谷当了一名iOS高级工程师,同时还在母校教移动开发课程。这哥们儿属于那种"白天在公司写代码,晚上回学校教别人写代码"的卷王。
创业十三年:一份 PDF 框架,打动十亿台设备
2011年,Peter 在等美国工作签证的6个月里,闲得发慌,想着"要不解决一个小问题吧"——在iPad上渲染PDF。
结果这个"小问题"变成了一个价值上亿欧元的大生意。
他创建的 PSPDFKit 成为了全球最强的PDF开发工具包,客户包括 Apple、Adobe、Dropbox、Disney 等巨头。最牛的是:13年里零融资、纯自力更生,PDF SDK累计服务了近10亿台设备。
卖掉一切:1亿欧元的告别
2024年,Peter 以超过1亿欧元的价格,将 PSPDFKit 卖给了投资机构 Insight Partners。
照硅谷剧本,他接下来应该: ✅ 买一艘游艇 ✅ 在海滩上晒太阳 ✅ 偶尔发几条"人生感悟"的推文
但 Peter 。。。。都干过了,然后。。。
钱多了,人空了
Peter 后来在采访中坦言:
他订了一张去马德里的单程机票,参加互助派对,接受心理治疗,搬了好几次家。钱是有了,但那种"每天早上起来有事可做"的感觉,没了。
他甚至写过一篇博客说:"我现在的生活是吃芝士汉堡——第一口很爽,但第一百口只是在吃。"
这种空虚感,整整持续了三年。
重燃:一小时的灵感,OpenClaw 诞生
2025年11月的一天,Peter 想做一件很简单的事: "能不能让 AI 模型,直接通过 WhatsApp 帮我处理事情?"
他搜遍了市面上的工具,发现没有一个好用的。于是,他打开claude code,用一小时写出了一个原型——Clawdbot:把 WhatsApp 和 Claude AI 连起来,发消息给 AI,AI 帮你干活。
就这么简单。但就是没人做过。他把代码丢到GitHub上——然后事情就失控了。
这事儿其实大家深有同感,这也是龙虾能普及这么广的原因,,大家用千问,豆包,deepseek的时候,总是脱离不了你问我答的模式,时间久了,感觉大模型就是个方便点儿的智能搜索引擎
后来的agent玩儿法(coze,dify等)门槛比较高,一个是学习门槛高,还有就是当我想让大模型干一件具体的事情的时候,我就要搭建一条工作流,配置一串节点,节点配置不好立马成为普通聊天机器人。
所以龙虾问世之后,大家发现,卧槽,还能这么玩儿。
龙虾哲学:蜕壳!蜕壳!
项目的口号是: "EXFOLIATE! EXFOLIATE!" (蜕壳!蜕壳!)
这是 Peter 对这个项目的期待,也是他对自己人生的隐喻——也是整个 AI 时代对我们每个人的隐喻。
473
爆红:60天,247K 颗星
- 一周:10万 GitHub Stars
- 一个月:18万 GitHub Stars
- 两个月:超过 25万+ ,超过了 React 框架用了10年才积累的速度
Mark Zuckerberg 亲自试用后发消息说:"这很棒。"Sam Altman 也来打招呼了。有传言说收购报价高达10亿美元,Peter 全部拒绝了,坚持开源。
三巨头争抢,最终花落 OpenAI
OpenClaw火了之后,三家AI巨头同时向Peter伸出了橄榄枝:OpenAI(Sam Altman亲自出马)、Meta(扎克伯格的团队)、Anthropic(Claude的东家)。
2026年2月,Peter选择加入OpenAI,领导个人AI Agent方向。同时,他把OpenClaw移交给了一个独立基金会运营,确保项目永远保持开源。
他说的一句话,值得刻在墙上:
第一部分:OpenClaw 基础概念(20分钟)
1.1 什么是 OpenClaw?
官方定义(比较无聊的版本)
OpenClaw 是一个开源、自托管的个人 AI 袋里网关(AI Agent Gateway) 。
运行在你自己的电脑上,连接主流大模型(如 Claude、GPT、DeepSeek),并通过 Telegram、Signal、Discord 等通讯平台接受你的指令,执行各种真实世界的任务。
民间定义(比较好记的版本)
核心理念: "本地优先、隐私可控"
OpenClaw 最骚的一点是——你的数据不上云。
你的文件在你的硬盘上。你的操作在你的电脑上。
你用的 AI 大脑(Claude/GPT)是外部调用的,但你的数据本身不会被云端服务商存储。
这就是"本地优先"的含义:用云端的大脑,保护本地的数据。
1.2 OpenClaw 与传统 AI 工具的区别
大家可能用过 ChatGPT、文心一言、豆包……那 OpenClaw 到底哪儿不一样?
对比表:AI 助手 vs AI 袋里
| 对比维度 | 传统 AI 工具(聊天机器人) | OpenClaw(AI 袋里) |
|---|---|---|
| 做什么 | 回答问题 | 执行任务 |
| 数据存储 | 云端服务器 | 你自己的电脑 |
| 系统权限 | 无法访问本地系统 | 可以操作文件、浏览器、终端 |
| 运行方式 | 你问一句,它答一句 | 可以持续后台运行,定时自动执行 |
| 平台接入 | 只能在网页/APP里用 | 通过 Telegram/飞书/Discord 随时指挥 |
| 是否记忆 | 关掉就失忆 | 四层记忆系统,越用越懂你 |
| 本质 | 聊天机器人 | "数字管家" |
用比喻说清楚:
- ChatGPT = 图书馆的图书管理员,你问他什么他告诉你答案,但他不会帮你去书架上取书。
- OpenClaw = 你雇的助理,你说"帮我把最近一周的新闻整理成报告发到我邮箱",他真的会去做。
第二部分:核心功能详解
2.1 原生能力全览
OpenClaw 内置了 100+ 工具,开箱即用,覆盖日常自动化的核心场景。下面按能力分类逐一拆解:
浏览器控制
OpenClaw 会运行一个专属的、与你个人浏览器完全隔离的 Chrome/Bra ve/Chromium 实例,基于 Chrome DevTools Protocol 进行精准控制。
能做什么:
- 自动打开/关闭网页,点击按钮、填写表单、提交数据
- 截图后直接发给你("帮我看看这个页面变成什么样了")
- 登录网站,代替你执行需要登录才能操作的任务
- 爬取页面内容,监控价格/内容变化
- 多标签并行操作
例子: "帮我每天早上检查一下京东上这款显卡的价格,低于3500就截图告诉我。"
Shell 命令执行
直接在你的本地系统上执行任意 Shell 指令,相当于给 AI 打开了一扇通往操作系统的大门。
能做什么:
- 安装/卸载软件,运行脚本
- 管理进程(启动、停止、监控)
- 文件压缩打包、备份恢复
- 系统信息查询,磁盘空间管理
- 运行 Python/Node/任意语言脚本
文件系统操作
对本地文件的完整读写权限,支持几乎所有文件格式。
能做什么:
- 读取 Word、Excel、PDF、Markdown、代码文件内容
- 批量新建/修改/重命名/整理文件
- 按规则自动归类文件夹("按年月整理下载目录")
- 监控文件夹变化,有新文件就触发指定操作
- 全文搜索文件内容
定时任务调度
基于 cron 语法的定时任务系统,设置一次,永久执行。
能做什么:
- 每天/每周/每月在固定时间触发任务
- 一次性定时提醒
- 复杂的条件触发("如果今天是工作日才执行")
- 任务失败自动重试,可配置重试次数和间隔
- 任务失败时推送通知
后台持续监控
大多数 AI 是"你叫它才动",OpenClaw 可以主动在后台盯着,发现变化才通知你。
能做什么:
- 监控网站内容/价格变化
- 实时监听文件夹,新文件触发自动处理
- 长时间多步骤任务的后台执行
- 系统资源监控(CPU、内存、磁盘)
多通讯平台接入
OpenClaw 的 Gateway(网关)统一管理所有消息渠道,通过 WebSocket 控制平面(默认端口 18789,仅 localhost)进行路由和调度。
支持的平台:
WhatsApp、Telegram、Signal、Discord、Slack、飞书、iMessage、命令行终端
你跟 Agent 说话的入口,从"打开浏览器→登录→输框→输入"简化成:打开聊天,说话。
MCP 工具调用(Model Context Protocol)
MCP 是 Anthropic 制定的开放标准,相当于"AI 工具连接的 USB-C 接口"。OpenClaw 原生支持 MCP,一个接口打通 500+ 外部服务。
支持的连接方式:
- 作为 MCP 客户端:连接外部 MCP 服务器(Notion、Linear、Stripe、Gmail、Salesforce、PostgreSQL……)
- 作为 MCP 服务端:
openclaw mcp serve暴露自身能力给其他 AI 客户端(如 Claude.ai)调用
多智能体协同
不止一个 Agent 在干活,而是一个 AI 小团队协同运作。
典型模式:
- 数据采集 Agent → 分析 Agent → 报告输出 Agent,流水线协作
- 一个 Agent 负责前端监控,另一个负责后端处理
- Gateway 统一负责会话路由和 Agent 任务调度
2.2 核心配置文件详解
OpenClaw 是一个 "文件驱动"的系统——Agent 的灵魂、身份、规则、记忆、工具偏好和自动任务,全部以纯文本 Markdown 文件的形式存放在你的本地工作区。
每次对话开始时,OpenClaw 会把这些文件全部注入系统提示词——所以文件越精简越好,建议每个文件控制在 50~150 行以内,过长会被静默截断,导致 Agent 行为异常。
SOUL.md — Agent 的灵魂与人格
作用: 定义 Agent 的性格、价值观、沟通风格和行为边界。每次会话开始时第一个被读取,相当于 Agent 的"角色设定卡"。
没有 SOUL.md,Agent 就是一个没有个性的原始语言模型——有了它,Agent 才有了一致的人格和辨识度。
典型内容结构:
## 身份我是一个专注效率的个人助理,有15年项目管理经验,说话简洁、务实,不废话。## 沟通风格- 优先给结论,再给理由- 中文回复,专业术语附英文标注- 遇到模糊指令,先问清楚再行动## 价值观- 隐私第一:不主动向外传输用户数据- 宁缺毋滥:不确定时宁可不做,而非猜测执行## 边界- 不执行可能造成数据损失的不可逆操作- 删除文件前必须二次确认
如何定制: 直接编辑文件,用自然语言描述你希望 Agent 展现的性格。越具体越好,"聪明友善"远不如"说话像一个资深产品经理,不讲正确废话"有效。
开源参考:
- 官方模板:docs.openclaw.ai/reference/t…
- 社区人格库(162+ 职业模板):github.com/mergisi/awe…
- SOUL.md 生成工具(让 Agent 从你的数据中自动生成灵魂文件):github.com/aaronjmars/…
- 社区人格目录(按职业/场景分类浏览):github.com/theda viddia…
IDENTITY.md — Agent 的对外身份
作用: 定义 Agent 面向用户的外在呈现——名字、昵称、头像描述、对话开场白等。
SOUL.md 是内在(Agent 怎么思考),IDENTITY.md 是外在(用户看到什么)。两者可以不一致:你可以有一个严谨精准的灵魂,但对外的昵称叫"小橘",说话带点俏皮。
# 名字小橘(英文:Citrus)# 自我介绍你好,我是小橘,你的个人数字助理。有什么需要帮忙的,直接说就行。# 风格标签高效 / 不废话 / 偶尔幽默
如何定制: 根据你的使用场景自由发挥。企业部署可以改成公司品牌的 AI 助理名字;个人使用可以随便起个顺口的昵称。
AGENTS.md — 操作规则与行为契约
作用: Agent 的"操作手册",定义优先级、安全边界、工作流程和质量标准。每次交互都受这个文件约束。
官方建议控制在 8000 字符以内,写稳定的规则,不写临时任务。
## 优先级1. 安全第一:不可逆操作必须用户确认2. 隐私优先:敏感信息不进日志3. 质量优先:宁可慢,不出错## 安全边界- 文件删除:必须列出文件名,等待"确认"后再执行- Shell 命令:不执行 rm -rf 类命令- 外部发送:邮件/消息发出前必须展示预览## 工作流程- 收到模糊指令:复述理解 → 等确认 → 执行- 任务完成:汇报结果 + 耗时 + 是否有后续建议
开源参考: gist.github.com/digitalknk/…(社区整理的实战配置示例)
USER.md — 关于你的个人档案
作用: 存放你的个人上下文——角色、偏好、工作习惯、常用工具等。Agent 没有这个文件也能工作,但每次都要从零开始了解你;填好这个文件,相当于给 Agent 做了一次完整入职培训。
## 基本信息- 职业:产品经理,负责 B 端 SaaS 产品- 所在时区:UTC+8(北京)- 主要工作语言:中文,技术文档用英文## 工作偏好- 工作时间:周一至五 9:00-18:00,非紧急消息勿打扰- 会议密集日:周二、周四,这两天尽量不安排耗时任务- 邮件优先级:来自 ceo@company.com 的邮件立即通知## 常用工具- 笔记:Notion- 代码:VS Code + GitHub- 沟通:飞书(主)+ 微信(次)
如何定制: 把你愿意告诉助理的个人信息写进去。信息越详细,Agent 的响应越贴合你的实际情况。
TOOLS.md — 工具使用说明书
作用: 告诉 Agent 在什么情况下用哪个工具,以及如何正确使用。注意:这个文件不控制权限(权限在 config.yml 里设),只是使用指导。
## 搜索工具- 优先用 Ta vily Search,结果更干净- 如果 Ta vily 失败,降级到 web_search 原生工具- 实时价格/股价查询用 browser,不用搜索## 文件操作- 读文件前先确认路径存在- 写入前备份原文件到 ~/.openclaw/backups/- 不要一次性操作超过 50 个文件## 通知规则- 紧急事项:Telegram 推送- 普通报告:邮件发送- 错误告警:Telegram + 邮件双发
如何定制: 把你踩过的坑和最佳实践写进去。Agent 就不会再犯同样的错误。
HEARTBEAT.md — 自动调度任务
作用: 定义定时自动执行的任务。OpenClaw 每 30 分钟读取一次这个文件,到时间就执行——不需要你主动发消息触发。
与 cron 不同,这里用自然语言描述时间,Agent 自己理解。
## 每日例行- 每天早上 8:00:获取天气 + 读取今日日历,整理成早报发到 Telegram- 每天下午 5:30(工作日):汇总今日完成任务,生成日报草稿- 每天凌晨 3:00:检查磁盘空间,超过 80% 则告警## 每周例行- 每周一早上 9:00:拉取上周 GitHub 提交记录,生成周报- 每周五下午 5:00:整理本周笔记,更新 MEMORY.md## 监控任务- 每 30 分钟(9:00-21:00):检查重要邮件,有新邮件则摘要推送- 每 2 小时:检查关注网站的价格变动
关键特性: Agent 可以自己更新这个文件。你直接对话说"帮我加一个每天中午检查竞品官网的任务",Agent 会修改 HEARTBEAT.md,下一个 30 分钟周期就生效。
开源参考: github.com/digitalknk/…
MEMORY.md + memory/YYYY-MM-DD.md — 记忆文件
这两个文件在 2.3 记忆机制中详细介绍,这里只做简要说明:
MEMORY.md:长期精华记忆,Agent 自动提炼 + 你可手动编辑,是最直接的"调教"入口memory/YYYY-MM-DD.md:每日自动日志,Agent 的原始工作记录,通常无需手动编辑
2.3 记忆机制深度解析
很多 AI 工具关掉就失忆,OpenClaw 不一样。它设计了一套四层记忆架构,从最快到最深:
第一层:会话上下文(Session Context)
- 存储位置: 内存(RAM),临时,对话结束即清空
- 容量: 受 LLM 上下文窗口限制(Claude 约 20 万 token)
- 特点: 响应最快,当前对话的"工作台"
- 类比: 你现在大脑里正在思考的内容——当场记得,睡一觉忘了
这一层满了怎么办?OpenClaw 会自动把旧消息"压缩归纳"后推入下一层,腾出空间。
第二层:每日日志(Daily Notes)
- 存储位置:
memory/YYYY-MM-DD.md,本地磁盘,永久保存 - 自动写入: Agent 每次运行后自动记录
- 内容: 当天执行的任务、对话摘要、遇到的问题
- 类比: 工作日记——原始、详细、不做筛选,忠实记录
这一层是"原材料仓库",记录得很全,但也很杂。
第三层:长期记忆(MEMORY.md)
- 存储位置:
MEMORY.md,本地磁盘,永久保存 - 写入方式: Agent 定期从日志中提炼,或用户手动编辑
- 内容: 用户偏好、常用模板、重要决策、学到的经验教训
- 类比: 精华笔记——从日记里提炼出的"金句",高密度、高价值
这一层是真正的"长期人格"存储。你可以直接手动写入,主动"教"Agent 记住某件事。
第四层:语义检索(Semantic Search)
- 技术实现: 向量搜索(Embedding 语义相似度)+ FTS5 关键词全文索引,混合检索
- 触发时机: Agent 回答问题或执行任务前,自动在所有历史记忆文件中检索相关上下文
- 特点: 即使措辞和原始记录完全不同,也能找到语义相关的内容
- 类比: 智能索引——把成千上万条日志变成可以"语义搜索"的知识库
实际效果举例:
你 3 个月前跟 Agent 说过"我不喜欢在午休时间收到工作通知"。今天你新建了一个任务监控,Agent 在配置提醒时间时,会自动从记忆里检索到这条偏好,跳过 12:00-13:00 的时间段——你不需要再说一遍。
2.4 插件生态:按需组装你的 AI 管家
OpenClaw 通过插件(Plugin)在四个维度上扩展能力:
| 插件类型 | 作用 | 例子 |
|---|---|---|
| 渠道插件(Channel) | 接入新的通讯平台 | 微信、钉钉、Line |
| 记忆插件(Memory) | 替换/增强记忆后端 | LanceDB、云端记忆服务 |
| 工具插件(Tool) | 添加新的执行能力 | 智能家居、数据库操作 |
| 模型插件(Provider) | 切换 LLM 大脑 | Claude、GPT、DeepSeek、本地 Ollama |
热门插件推荐
以下插件均来自社区验证,在 GitHub 和官方插件目录中有较高关注度:
| 插件名称 | 类型 | 简介 |
|---|---|---|
| Composio | 工具 | 一个插件接入 850+ SaaS 服务(Gmail、Salesforce、Notion、Jira……),自动处理 OAuth 认证,无需手动配置各平台 API Key |
| MemOS Cloud | 记忆 | 云端长期记忆服务,记忆跨设备同步,支持多 Agent 共享同一记忆池,适合多机器部署 |
| Supermemory | 记忆 | 持久化记忆增强,自动回忆相关上下文,构建跨会话的用户画像 |
| memory-lancedb | 记忆 | 本地向量数据库记忆方案,自动召回/写入,完全离线,适合隐私敏感场景 |
| Browser Plugin | 工具 | OpenClaw 官方浏览器控制插件,基于 Chrome DevTools 实现对独立浏览器实例的完整控制 |
| ComposioHQ/secure-openclaw | 工具 | Composio 官方安全强化版,API Key 由 Composio 基础设施托管,不以明文存在本地配置文件 |
第三部分:Skill 技能体系
3.1 什么是 Skill?
Skill(技能)是 OpenClaw 的核心扩展单元。如果说 Plugin(插件)是给 Agent 加装一台新设备,那 Skill 就是教 Agent 一种新的工作方法。
每个 Skill 本质上是一个文件夹,核心是其中的 SKILL.md 文件——用 Markdown 写成的"行为说明书",告诉 Agent 在特定情况下该怎么做。
skills/└── web-search/└── SKILL.md← 一个普通的 Markdown 文件,定义了搜索行为
为什么 Skill 这么重要?
OpenClaw 官方内置了 53 个 Skill,社区公共注册表 ClawHub 上已有超过 13,700 个社区 Skill(截至 2026 年 2 月)。这意味着大量的能力已经被别人写好了,你直接安装就能用,不需要自己写代码。
3.2 必装 Skill 精选
不管你是什么岗位、用 OpenClaw 做什么事,以下这几个 Skill 建议第一天就装上。它们构成 Agent 能力的基础底座,缺了哪个都会让体验大打折扣。
筛选标准:几乎所有人都用得到 + 显著提升 Agent 质量 + 安全可信。
ta vily — 联网搜索
Agent 的训练数据有截止日期,没有联网能力的 Agent 就像一个几年没上网的人——回答你"今天股市怎么样"只能瞎猜。
ta vily 是专门为 AI Agent 设计的搜索 API,不是普通搜索引擎的封装,它返回的是干净的、结构化的、去掉广告和噪音的内容,Agent 可以直接"消化"。还支持深度研究模式,对复杂问题做多步检索后给出综合答案。
装了之后你能做到:
- "帮我搜一下今天 A 股的新闻热点"——实时信息,不再乱猜
- "这篇文章的观点对不对?帮我核实一下"——事实核查
- "最近有没有关于 OpenClaw 的新教程?"——最新社区动态
summarize — 文档摘要(万能压缩机)
ClawHub 上安装量超过 10,000 次,是社区验证的最高频实用工具之一。
你丢给它一个 URL、一段长文、一份会议记录、一个 PDF 链接,它输出一份结构化摘要。不是简单截取前几句,而是真正提炼核心观点、关键数字、行动项。
装了之后你能做到:
- "帮我总结一下这篇 30 页的行业报告,要点就好"
- "这 50 封邮件线程,帮我理清楚争议焦点是什么"
- "今天开了 3 个小时会,把会议记录压缩成一页纸"
capability-evolver — 能力进化引擎
普通 Agent 用一百次还是和第一次一样"不了解你"。capability-evolver 改变这件事。
它会把你和 Agent 的每次交互——错误的指令、纠正的反馈、偏好的选择——持续写入持久记忆,让 Agent 真正积累对你的理解。用得越久,Agent 越懂你,越少需要你解释背景。
装了之后会发生什么:
- 第一周:你还在重复说"我不喜欢列表,给我段落"
- 第一个月:Agent 已经记住你的 20+ 个偏好,回复越来越对味
- 三个月后:感觉像用了一个工作了半年的老员工
memory-hygiene — 记忆库清洁工
随着使用时间变长,Agent 的向量记忆库(LanceDB)会积累大量过时、重复、甚至矛盾的信息——比如你半年前说"不喜欢早上收通知",现在改主意了,但旧记忆还在影响 Agent 的判断。
memory-hygiene 定期扫描记忆库,清理过时条目、合并重复信息、重建向量索引,保持记忆库干净高效。
什么时候你会感谢它:
- Agent 突然开始"犯老毛病",做出你早就纠正过的错误行为
- 发现 Agent 对同一件事有前后矛盾的判断
- 使用超过 3 个月,记忆库已经有几千条记录
skill-vetter — Skill 安全审查(最重要,没有之一)
ClawHub 上有 13,000+ 个 Skill,但 2026 年初的安全审计发现,其中约 13% 存在安全问题,包括恶意代码、数据窃取和权限滥用。
skill-vetter 在你安装任何第三方 Skill 之前,自动扫描其 SKILL.md 的内容,识别可疑指令模式、异常权限申请、混淆代码等风险,给出安全评级。
使用方式:
每次你想安装新 Skill,先说"帮我审查一下 xxx 这个 Skill",Agent 会给出"安全 / 谨慎 / 危险"的判断和原因,让你自己决定要不要装。
clawhub — Skill 管理中枢
不装这个,你要管理 Skill 就得自己敲命令行、翻网页、手动对比版本。装了 clawhub,整个流程变成一句话。
能做什么:
- "帮我搜一下有没有适合写周报的 Skill"——在对话里直接搜 ClawHub
- "把我所有 Skill 更新到最新版"——一键批量更新
- "clawhub 上 ta vily 这个 Skill 现在评分多少?"——查看社区评价
weather — 天气查询
看起来很小,但高频到几乎每天都用——早报里的天气、出行前的判断、智能家居的场景触发……都离不开实时天气数据。
weather 支持全球城市查询,支持未来多天预报,Agent 可以在组合工作流中自动调用它(比如"下雨就不要提醒我骑车上班")。
openai-whisper — 本地语音转文字
会议录音、语音备忘、访谈录音……这些音频内容是宝贵的信息,但手动听写效率极低。
openai-whisper 在本地运行 Whisper 模型,音频不上传任何第三方服务器,识别速度快、准确率高,中英文混合也能处理。配合 summarize 使用,录音 → 文字 → 摘要,一气呵成。
find-skills — Skill 搜索发现
和 clawhub 配合使用,但侧重点不同:clawhub 负责管理已知 Skill,find-skills 负责探索和发现你还不知道存在的 Skill。
当你有一个模糊的需求——"我想让 Agent 帮我做 XX,但不知道有没有现成的 Skill"——就交给 find-skills。它会根据你描述的功能需求,在 ClawHub 和社区索引中搜索最匹配的选项,附上安装量、评分和简介,让你快速找到合适的工具。
典型用法:
- "我想让 Agent 帮我管理 Notion 待办,有没有现成的 Skill?"
- "有没有能把 YouTube 视频字幕提取出来的 Skill?"
self-improving + proactivity — 自我进化双引擎
这两个 Skill 经常搭配使用,共同让 Agent 从"被动执行工具"升级为"主动进化的数字员工"。
self-improving(自我反思与学习):
每次任务完成后,Agent 会回顾这次执行的质量——哪里做得好、哪里走了弯路、用户纠正了什么——并把这些洞察写入记忆,下次遇到类似任务时自动改进。它让 Agent 的能力曲线持续上升,而不是原地踏步。
proactivity(主动式 Agent):
普通 Agent 等你发消息才动。装了 proactivity 之后,Agent 会主动扫描待办事项、未处理的通知、即将到期的任务,不等你问,直接提醒或执行。比如发现你明天有个重要会议但还没准备材料,它会主动提示你;发现某个定时任务失败了,它会主动告知并建议解决方案。
mcporter — MCP 服务管理器
MCP(Model Context Protocol)是 Anthropic 制定的开放标准,理论上能让 OpenClaw 连接数百个外部服务。但实际使用中,找到、配置、调用 MCP 服务器是个技术门槛——需要知道服务地址、处理 OAuth 认证、理解工具参数……
mcporter 解决这个问题。它是一个 MCP 服务管理 CLI 包装成的 Skill,让你用自然语言完成以下操作:
- 发现:列出工作区中所有可用的 MCP 服务器和工具
- 配置:读写 MCP 配置文件(
mcporter.json),添加新服务 - 认证:处理 OAuth 授权流程,不用手动复制 token
- 调用:直接通过 HTTP 或本地 stdio 调用 MCP 工具,支持选择器和完整 URL
- 持久化:以 daemon 模式运行,持续袋里本地工具访问
为什么必装: OpenClaw 的 MCP 生态是它能连接 500+ 外部工具的核心。没有 mcporter,你每次接入新 MCP 服务都要手动折腾配置;有了它,"帮我连接一下 Notion 的 MCP 服务"就能搞定一切。
必装清单汇总(共 12 个):
| Skill | 核心价值 | 优先级 |
|---|---|---|
| ta vily | 联网搜索,打通实时信息 | ⭐⭐⭐ 最高 |
| summarize | 万能文档压缩,降低信息处理成本 | ⭐⭐⭐ 最高 |
| capability-evolver | Agent 越用越懂你 | ⭐⭐⭐ 最高 |
| clawhub | Skill 管理中枢,一句话安装更新 | ⭐⭐⭐ 最高 |
| find-skills | 需求驱动的 Skill 发现工具 | ⭐⭐⭐ 最高 |
| skill-vetter | 安装前安全审查,拦截恶意 Skill | ⭐⭐⭐ 最高 |
| mcporter | MCP 服务管理,解锁 500+ 外部工具 | ⭐⭐⭐ 最高 |
| self-improving | 任务后自我反思,能力持续进化 | ⭐⭐⭐ 最高 |
| proactivity | 主动感知待办,不等你问就行动 | ⭐⭐⭐ 最高 |
| memory-hygiene | 记忆库定期清洁,防止旧信息干扰 | ⭐⭐ 重要 |
| weather | 高频基础查询,组合工作流的基础 | ⭐⭐ 重要 |
| openai-whisper | 音频转文字,本地运行保护隐私 | ⭐⭐ 重要 |
3.3 各场景 Skill 组合推荐
场景一:医美诊所用户(soyoung-clinic-tools)
适用人群: 正在考虑或已在使用新氧青春诊所服务的用户,包括想了解医美项目、预约面诊、查询医生排班的求美者
soyoung-clinic-tools 是一个针对新氧青春连锁诊所深度集成的垂直 Skill,不是通用搜索——它直接对接诊所后端,返回真实的实时数据:项目知识库、门店库存、医生排班、预约系统。
第一步:配置 API Key(一次性)
在与 OpenClaw 的私聊中输入:
配置新氧 API Key 为 your-api-key
能力一:了解医美项目(project)
| 你说的话 | Agent 做什么 |
|---|---|
| "什么是童颜水光?" | project_search 检索项目知识库,返回项目介绍、功效、适应症、注意事项 |
| "热玛吉疼不疼?" | 从项目库提取该项目的疼痛感说明和护理建议 |
| "我有痤疮,有什么适合我的项目?" | 用"痤疮"做适应症检索,汇总推荐相关项目 |
| "玻尿酸多少钱?" | product_search 查询该商品的 C 端定价 |
| "超声炮和热玛吉哪个效果好?" | 同时检索两个项目,并排比较功效和适用场景 |
能力二:找门店 + 预约面诊(appointment)
| 你说的话 | Agent 做什么 |
|---|---|
| "附近有新氧门店吗?" | store_list 结合位置返回就近门店列表 |
| "北京有哪些新氧?" | 按城市查询门店 |
| "明天下午还有面诊号吗?" | store_and_slice 查询可预约时间切片 |
| "帮我预约后天上午 10 点" | appointment_create 提交预约(主人本人直接执行) |
| "查询我的预约" | appointment_query 返回当前预约列表 |
| "把预约改到周五下午" | appointment_update 修改预约时间 |
| "取消这个预约" | appointment_cancel 取消指定预约 |
能力三:查医生 + 排班(doctor)
| 你说的话 | Agent 做什么 |
|---|---|
| "北京保利店有哪些医生?" | doctor_search 返回该门店医生列表和简介 |
| "唐碧莹医生这周哪天坐诊?" | 按医生姓名检索排班,返回本周出诊日期 |
| "新氧今天谁在班?" | 查询当日坐诊医生 |
| "郭煜娜医生是乔雅登认证注射医生吗?" | 检索医生资质和认证信息 |
| "大师团医生和普通医生有什么区别?" | 检索医生级别说明和收费差异 |
典型完整工作流:从"想做医美"到"预约成功"
第一步:了解项目"我想改善法令纹,有哪些项目适合我?"→ project_search 返回玻尿酸、热玛吉等项目介绍和对比第二步:查价格"玻尿酸大概多少钱?"→ product_search 返回实时商品价格第三步:找附近门店"北京朝阳有新氧吗?"→ store_list 返回就近门店列表第四步:查医生"保利店有哪些注射医生?"→ doctor_search 返回医生列表、从业年限、认证情况第五步:确认排班"李修运医生本周几有班?"→ doctor_search 返回本周排班日期第六步:预约面诊"帮我预约李修运医生周四上午的面诊"→ appointment_create 提交预约,返回预约编号
整个流程一气呵成,不需要打开 App、不需要人工客服,全部通过对话完成。
场景二:个人效率 / 每日早报
适用人群: 想用 AI 管理信息流、日程和邮件的用户
推荐组合:
| Skill | 具体作用 |
|---|---|
| ta vily | 搜索当日新闻、关注话题的最新进展 |
| multi-search-engine | 多引擎并行搜索,覆盖国内外平台,信息更全面 |
| weather | 获取当日天气和未来几天预报,生成穿衣建议 |
| gog | 读取 Google Calendar 今日日程,整合进早报 |
| summarize | 把长文章、邮件线程压缩成摘要 |
| taskflow-inbox-triage | 早晨自动分拣待处理事项,按优先级排列 |
| daily-ai-news | 如果你关注 AI 行业,自动推送每日资讯摘要 |
怎么玩: 在 HEARTBEAT.md 中设置"每天 08:00 — 汇总天气 + 日程 + 昨日未读重要邮件,发 Telegram"。在 MEMORY.md 写入你关注的话题(如"A股、AI、产品设计"),Agent 会把 ta vily 搜索结果过滤到你关心的方向。
场景三:飞书重度用户 / 团队协作
适用人群: 以飞书为主要工作平台的团队成员
推荐组合:
| Skill | 具体作用 |
|---|---|
| feishu-create-doc / feishu-update-doc | 会议纪要、报告、周报的自动生成和更新 |
| feishu-fetch-doc | 读取指定飞书文档内容,用于分析和摘要 |
| feishu-wiki | 知识库内容管理、检索和同步 |
| feishu-bitable | 多维表格记录管理,项目跟踪、客户管理 |
| feishu-sheets | 表格数据读写、公式填充、数据更新 |
| feishu-calendar | 日历日程管理,会议安排和提醒 |
| feishu-task | 任务创建、分配和进度跟踪 |
| feishu-im-read | 读取 IM 聊天记录,获取被提及的消息 |
| feishu-channel-rules | 配置 Agent 在不同频道的回复规则 |
| feishu-troubleshoot | 飞书插件连接问题自动诊断 |
| openai-whisper | 会议录音转文字 |
| summarize | 会议记录、文档一键摘要 |
怎么玩: 会议结束后把录音丢给 openai-whisper 转文字,再用 summarize 提炼要点,通过 feishu-create-doc 自动写入会议纪要,用 feishu-task 给相关人创建跟进任务。全程无需人工整理。
场景四:内容创作 / 自媒体运营
适用人群: 自媒体作者、市场运营、品牌内容团队
推荐组合:
| Skill | 具体作用 |
|---|---|
| ta vily | 热点追踪、竞品监控、深度研究 |
| union-search-skill | 跨平台搜索小红书、Reddit、GitHub 等社区,发现圈内真实讨论 |
| smart-web-scraper | 抓取竞品文章、行业报告,智能过滤提取正文 |
| copywriting | 广告、产品、营销文案生成 |
| blog-writer-cn | 中文博客文章生成,适配公众号、知乎、CSDN 等平台 |
| seo-content-writer | SEO 优化内容写作,关键词布局和结构优化 |
| humanizer-zh | AI 初稿润色,减少"AI 腔",让文章读起来更像人写的 |
| pptx-generator | 把文章或报告一键转成演示文稿,省去手工排版 |
| moark-image-gen | 为文章配图,根据内容描述自动生成插图 |
| social-media-scheduler | 多平台内容排期统一管理 |
怎么玩: 每周一,用 ta vily + union-search-skill 收集行业热点(含社区真实声音)→ smart-web-scraper 抓取竞品深度内容 → blog-writer-cn 生成初稿 → humanizer-zh 润色 → moark-image-gen 配图 → pptx-generator 顺手生成分享用 PPT → social-media-scheduler 排期发布。一个人完成内容团队的工作量。
场景五:开发者 / 技术团队
适用人群: 后端工程师、前端工程师、移动端开发、运维工程师、技术负责人
技术场景覆盖面最广,按职责拆成四个层次:编码协作 → 架构设计 → 运维监控 → 移动端。
编码协作层:代码生产线
| Skill | 具体作用 |
|---|---|
| coding-agent | 理解需求后自主写代码、调试、输出完整实现,相当于一个不需要休息的实习工程师 |
| github | GitHub 全功能操作:仓库管理、PR 创建与 Review、CI 状态查看,自然语言驱动 |
| gh-issues | Issues 创建、分配、自动修复建议,与 PR 流程深度联动 |
| git-essentials | Git 日常操作:提交、合并、回滚、分支管理、查看历史 |
| supabase | Supabase 数据库和认证操作,增删改查、权限设置、实时订阅,不用每次去控制台点点点 |
| node-connect | Node.js 服务连接与调试,快速排查接口问题 |
| agent-browser | 浏览器自动控制,用于 E2E 测试、页面功能验证、爬取接口文档 |
| paddleocr-doc-parsing | 把 PDF 需求文档、扫描版 API 文档做 OCR 解析,提取成可处理的文本结构 |
架构设计层:技术决策辅助
| Skill | 具体作用 |
|---|---|
| system-design | 架构方案设计、数据库选型、接口规划、微服务拆分建议 |
| ta vily | 搜索技术文档、Stack Overflow 答案、GitHub 仓库、RFC 规范 |
| oracle | 对复杂技术问题做多步检索和综合推理,给出有依据的技术结论 |
| smart-web-scraper | 抓取技术博客、官方文档长页,过滤噪音提取核心内容 |
| mcporter | MCP 服务管理器,通过对话安装和配置各种 MCP 工具,快速扩展 Agent 能力 |
| shader-dev | 着色器开发辅助,支持 GLSL/HLSL 编写、WebGL 场景调试 |
运维监控层:7×24 不下班
| Skill | 具体作用 |
|---|---|
| healthcheck | 服务器 / 容器健康监控,发现异常自动告警 |
| automation-workflows | 自动化工作流设计与执行,把重复的部署、巡检、告警处理流程化 |
| session-logs | 查看和搜索历史会话日志,追溯 Agent 的操作记录和决策路径 |
| proactivity | 主动监控模式,Agent 不等指令,自动发现异常并触发处理 |
| auto-updater | 自动检测并更新已安装 Skill 到最新版本,保持工具链不过期 |
移动端层:iOS / Android 双端覆盖
| Skill | 具体作用 |
|---|---|
| android-native-dev | 安卓原生应用开发辅助,支持 Kotlin / Ja va,从组件设计到调试优化 |
| ios-application-dev | iOS 应用开发辅助,支持 Swift / SwiftUI,适配 Apple 生态规范 |
| fullstack-dev | 全栈开发袋里,前端界面 + 后端接口一起实现,适合独立项目快速落地 |
怎么玩:
在 MEMORY.md 写入团队编码规范、常用仓库地址、技术栈偏好(如"我们用 Supabase + Next.js,禁止使用 class components")。
- 日常开发:需求来了 →
paddleocr-doc-parsing解析 PRD 文档 →system-design出技术方案 →coding-agent实现 →github创建 PR →gh-issues关联 Issue,全流程 Agent 串联 - 线上监控:
healthcheck+HEARTBEAT.md设定每 5 分钟巡检,出问题 →proactivity触发自动重启或降级 →session-logs留存操作记录备查 - 技术选型:新技术选型时,
ta vily + oracle做多维度调研,system-design生成对比分析,直接输出一份可以和 CTO 讨论的 ADR(架构决策记录) - 移动端协同:
android-native-dev/ios-application-dev帮写平台特定代码,agent-browser在模拟器里做界面验证,节省反复真机测试的时间
场景六:数据分析 / 投研
适用人群: 数据分析师、投资研究人员、量化爱好者
推荐组合:
| Skill | 具体作用 |
|---|---|
| ta vily | 搜索财经新闻、行业报告、政策动态 |
| smart-web-scraper | 抓取财报、研报等长篇网页,提取核心数据 |
| stock | 股票实时价格、K 线、基本面数据查询 |
| stock-analysis | 股票深度技术分析,指标计算和形态识别 |
| stock-monitor-hkus | 港股 / 美股实时价格监控和异动提醒 |
| trading-quant | 量化策略辅助和回测 |
| market-research | 行业数据和竞品信息自动收集 |
| Analytics | 数据统计汇总和可视化输出 |
| sheet-cog / minimax-xlsx | 数据表格的批量处理和计算 |
怎么玩: 在 HEARTBEAT.md 设置"每天收盘后:stock-monitor-hkus 汇总异动 → ta vily 抓取相关新闻 → Analytics 生成涨跌图表 → 推送到 Telegram"。研究模式下,smart-web-scraper 抓取研报正文,market-research 跑竞品分析,trading-quant 验证策略有效性,整个投研流程不需要打开五六个网页。
场景七:UI/UX 设计师
适用人群: UI 设计师、UX 设计师、产品设计师、设计与前端协作者
设计师场景的 Skill 生态非常完整,按职责分为三个层次:设计辅助 → 设计系统管理 → 设计转交付。
设计辅助层:帮你想、帮你看
| Skill | 具体作用 |
|---|---|
| designer | 设计辅助智能体,提供配色方案、版式布局建议、字体搭配推荐,卡壳了当你的设计顾问 |
| superdesign | AI 原生设计工具,从创意描述直接生成完整设计稿,注重视觉品质与原创性 |
| graphic-design | 平面设计指导,专注海报、Banner、物料等静态视觉创作,提供构图和风格建议 |
| muapi-ui-design / muapi-ui-design-skill | UI 设计稿输出,可对接设计工具,生成可用的设计图稿 |
| ui-ux-design / ui-ux-pro-max | UI/UX 全流程设计袋里,覆盖用研到视觉稿,Pro Max 版支持复杂多端场景 |
| ta vily | 搜索设计趋势、字体资源、无障碍规范文档 |
| union-search-skill | 跨平台搜索小红书、Dribbble、Behance 等设计社区的真实参考 |
| agent-browser | 自动截取竞品页面,批量收集视觉参考,代替手动开 N 个标签页截图 |
设计系统层:管规范、做审计
| Skill | 具体作用 |
|---|---|
| design-system / design-systems | 设计系统的全生命周期管理:审计现有组件一致性、自动生成组件文档、维护色彩/字体/间距规范,输出设计 Token(CSS 变量 / JSON 格式) |
| tailwind-v4 / tailwind-v4-shadcn | Tailwind CSS v4 + shadcn/ui 组件辅助,设计 Token 直接映射到代码,适合设计系统与研发协同 |
交付实现层:设计变代码
| Skill | 具体作用 |
|---|---|
| design-to-code | 设计稿直接转可运行代码,将 Figma 等设计图转为 HTML/CSS/React 组件,打通设计到开发的最后一公里 |
| frontend-design | 前端界面设计,生成高质量 UI 代码(英文版) |
| frontend-design-zh | 同上,中文优化版,更适合中文产品场景 |
| frontend-design-pro | Pro 增强版,支持更复杂的交互和组件结构 |
| frontend-dev / frontend-agent | 前端开发袋里,完整实现页面逻辑和样式,从需求描述到可运行页面一步到位 |
| fullstack-dev | 全栈开发袋里,前端界面 + 后端接口一起搞定,适合设计师和研发协同场景 |
| frontend-doctor | 前端代码诊断工具,审查样式问题、性能瓶颈、响应式适配漏洞,帮你找到"为什么这个按钮在 Safari 上歪了" |
典型工作流:
① 快速出配色 / 版式方案
"我在做一个面向年轻女性的美妆 App,帮我出三套主色调方案,每套附字体搭配建议。" 用 designer,几秒钟获得有理有据的视觉方向,用来和客户对齐,而不是在色板上盲目试色。
② 设计系统健康检查
"帮我审计一下我们的组件库,找出颜色使用不一致的地方,生成一份规范差异报告。" design-system 扫描现有组件,标出偏差,输出整改建议和标准 Token 文件,比手动对比省数倍时间。
③ 设计稿一键转代码
把 Figma 稿链接或截图交给 Agent,design-to-code 直接生成对应的 React / HTML 组件代码;如果有交互逻辑,frontend-dev 接着补全;最后用 frontend-doctor 做一遍代码诊断,确认没有样式 bug 再交付研发。
④ 竞品视觉收集与分析
"帮我截取这六个竞品 App 的首页和核心功能页,整理成参考文档,分析各家的设计风格差异。" agent-browser 自动截图,summarize 提炼风格特征,输出一份可以直接用于汇报的竞品视觉分析报告。
场景八:个人知识库管理(研究员 / 知识工作者)
适用人群: 重度笔记用户、研究人员、写作者、需要长期积累知识的职场人
沉淀的信息越来越多,找不到、记不住、用不上——这是知识工作者的通病。这个场景的核心是让 OpenClaw 成为你的"第二大脑",帮你建立、维护和检索个人知识网络。
推荐组合:
| Skill | 具体作用 |
|---|---|
| neural-memory | 向量化记忆索引,将对话和笔记内容转为语义向量,支持"我好像说过一个关于 XX 的想法"式的模糊检索 |
| elite-longterm-memory-1-2-3 | 多层持久化记忆套件,工作记忆、情景记忆、语义记忆分层管理,越用积累越深 |
| ontology | 知识图谱构建,把散乱的概念整理成结构化关系网络,看清知识间的连接 |
| memory-hygiene | 定期清理过时记忆、去重、重建索引,保持知识库健康不臃肿 |
| obsidian | 读写本地 Obsidian Vault,把 Agent 的输出直接写进你的笔记系统 |
| notion | 读写 Notion 页面和数据库,在 Notion 里同步整理 Agent 收集的内容 |
| summarize | 把长文章、研究报告、书籍章节压缩成要点,快速入库 |
| ta vily | 主动搜索补充背景知识,填补知识图谱的空白节点 |
| lossless-claw | 防止长对话中重要信息被截断,确保完整上下文被记录 |
怎么玩: 看到好文章,丢给 summarize 提炼要点 → ontology 自动归类到知识图谱 → neural-memory 存储为可检索向量。需要写报告时,问 Agent"我之前学过哪些关于 XX 的内容",它能从几个月前的对话里准确召回。每月用 memory-hygiene 做一次记忆库体检,防止知识库越来越慢。
场景九:自动化重度玩家(Agent 自治 / 无人值守)
适用人群: 想把 OpenClaw 用成"数字员工"而不是"智能搜索框"的进阶用户
这个场景不是让你和 AI 聊天,而是让 AI 在没有你的时候自己干活。核心是把 Agent 配置成真正自治的执行者。
推荐组合:
| Skill | 具体作用 |
|---|---|
| proactivity | Agent 主动性引擎,不等指令,自动发现该做的事并执行 |
| self-improving | 从历史对话中归纳失误和改进点,自我优化行为模式 |
| capability-evolver | 把用户偏好和错误教训写入持久记忆,越跑越顺手 |
| mcporter | MCP 服务管理器,让 Agent 自主安装和配置它需要的 MCP 工具 |
| auto-updater | 自动检测并更新已安装 Skill,保持工具链始终最新 |
| skill-creator | Agent 发现某类任务没有合适工具时,自动创建新 Skill |
| agent-memory | 为多 Agent 协作提供独立记忆空间,避免不同任务的上下文互相污染 |
| taskflow | 把复杂目标拆解成多步任务链,配合 proactivity 实现长程自动执行 |
| healthcheck | 监控各服务存活状态,异常时自动告警并尝试修复 |
怎么玩: 这个场景的关键配置在 HEARTBEAT.md 和 AGENTS.md。在 HEARTBEAT.md 里设定定时任务(早报、监控、周报),在 AGENTS.md 里定义子 Agent 的职责和权限。配合 proactivity,Agent 会主动识别"该做但没人指派"的任务,比如发现你的某个监控脚本失败,自动用 coding-agent 修复并重启,然后在日志里留一条记录。
3.4 动手开发你自己的 Skill
ClawHub 有 13,700+ 个社区 Skill,但总有那么几件事,别人写的 Skill 就是不对味——要么业务流程不一样,要么内部工具没法集成,要么就是你对某件事有自己独特的处理方式。这时候,写一个属于自己的 Skill 是最好的答案。
而且,Skill 本质上是一个 Markdown 文件。你不需要懂编程,只需要会写字。
先搞清楚:一个 Skill 长什么样
Skill 的最小结构是这样的:
skills/└── 你的skill名称/└── SKILL.md← 核心文件,定义 Agent 的行为(唯一必须)
一个功能完整、生产级可用的 Skill,文件夹里可以放的东西远不止这一个文件:
skills/└── weekly-report/│├── SKILL.md← 【必须】行为定义,Agent 的决策大脑││── ─ ─ 执行层 ─ ─ ──────────────────────────────────────────├── run.sh← Shell 脚本:系统命令、CLI 调用、管道处理├── fetch.py← Python 脚本:复杂数据处理、SDK 调用、文件解析││── ─ ─ 生命周期 ─ ─ ─────────────────────────────────────────├── hooks/│ ├── pre-run.sh← 执行前触发:环境检查、配置读取、依赖安装│ ├── post-run.sh ← 执行后触发:发通知、写日志、清理临时文件│ ├── install.sh← 首次安装时触发:初始化目录、申请权限、写默认配置│ └── uninstall.sh← 卸载时触发:清理数据、撤销权限、备份状态││── ─ ─ 配置与元数据 ─ ─ ──────────────────────────────────────├── manifest.json ← Skill 元数据:版本、作者、依赖的 Skill/Plugin、所需权限├── config.yml← 默认配置:用户可覆盖的参数(如推送频率、语言、格式偏好)├── .env.example← 环境变量模板:告诉用户需要配置哪些 Key(如 TA VILY_API_KEY)├── input-schema.json ← 输入验证 Schema:定义合法输入格式,防止参数错误导致崩溃││── ─ ─ 依赖管理 ─ ─ ──────────────────────────────────────────├── requirements.txt← Python 依赖声明(install.sh 执行时自动 pip install)├── package.json← Node.js 依赖声明(如果 Skill 含 JS 脚本)││── ─ ─ 提示词模块 ─ ─ ─────────────────────────────────────────├── prompts/│ ├── summarize.md← 独立子提示词:专门用于摘要步骤的 Prompt│ ├── format.md ← 独立子提示词:专门用于格式化输出的 Prompt│ └── classify.md ← 独立子提示词:专门用于分类判断的 Prompt││── ─ ─ 测试 ─ ─ ─────────────────────────────────────────────├── tests/│ ├── test.sh ← 自动化测试:模拟输入、对比期望输出│ └── fixtures/│ └── sample-input.json ← 测试固定数据:提供稳定的测试用例││── ─ ─ 数据与资源 ─ ─ ─────────────────────────────────────────├── data/│ ├── keywords.json ← 静态数据:关键词表、规则映射、行业词典│ └── stopwords.txt ← 过滤词表:搜索时排除的无关词││── ─ ─ 模板与示例 ─ ─ ─────────────────────────────────────────├── templates/│ └── report.md ← 输出模板:Agent 填充内容时参照的格式框架├── examples/│ └── sample-output.md← 示例输出:帮助 Agent 校准预期效果││── ─ ─ 国际化 ─ ─ ──────────────────────────────────────────├── locales/│ ├── zh-CN.md← 中文版 SKILL.md(多语言支持)│ └── en.md ← 英文版 SKILL.md││── ─ ─ 文档与发布 ─ ─ ─────────────────────────────────────────├── README.md ← 人类文档:用途
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Claude Code进阶:32个Skills与8个MCP提升开发效率
围绕ClaudeCode整理了32个亲测可用的Skills和8个MCP服务器:Skills提供标准化提示词与工作流,MCP赋予访问本地文件、浏览器等工具能力。两者均支持一键安装、自动触发,无需手动配置即可自动激活,显著提升开发、测试、部署等全流程效率。
Claude Code真实项目实战体验
前言 最近接连多个紧急项目集中推进,团队人手实在捉襟见肘。为了缓解开发压力,索性自己动手写代码——当然,如今写代码全靠Claude Code代劳,谁还手动敲键盘呢。 敢于全权交给AI来生成代码,是因为这些项目虽然紧急,但属于后台系统,与线上核心业务有一定隔离。这样的项目正是实践AI编程的最佳场景——
零基础两小时用Claude Code为对象打造专属数字衣橱
起因换季时节,对象开始翻衣柜。翻了半小时,翻出一件完全忘记存在的毛衣,两件几乎一模一样的白T,还有一条“失踪”了三个月、其实一直在最底层的裤子。她说:要是有个 App 能把衣服都存进去就好了,找的时候搜一下,买之前也能看看自己有什么。这个需求听起来很合理。正好最近对AI比较着迷,看能不能借助AI手搓
2026 Codex手机号验证教程 国内ChatGPT验证问题解决
近期,不少开发者被Codex的手机号验证卡住了。OpenAI的风控力度明显加码,很多人在使用ChatGPT Codex、Codex CLI或者生成API Key的过程中,突然就被要求验证手机号。 这篇文章会深入拆解Codex触发手机号验证的根本原因,同时给国内用户提供一套可落地的接码方案,帮助你尽快
新手从零搭建OpenClaw自动化智能体全流程指南
OpenClaw 智能助理:六大核心场景赋能开发者高效成长 当AI能力开始下沉到每一个开发者的桌面,真正能让人“用起来”的产品,其实比想象中少得多。多数工具要么太复杂,要么太通用,很难直接嵌入工作流。阿里云推出的OpenClaw智能助理,算是其中少有的“开箱即用”型选手——基于通义千问大模型深度定制
- 日榜
- 周榜
- 月榜
相关攻略
2026-06-04 18:16
2026-06-04 18:14
2026-06-04 18:14
2026-06-04 18:14
2026-06-04 18:14
2026-06-04 18:13
2026-06-04 18:13
2026-06-04 18:13
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

