面包屑图标 当前位置: 首页
AI资讯
热点详情

Karpathy内部Claude.md泄露亲手终结提示词时代

AI热点日报
AI热点日报时间:2026-06-29
热点解读

从一条推文说起。 前OpenAI大神Andrej Karpathy入职Anthropic预训练团队,才五周时间。昨天,他团队内部有人把他真正在用的那份Claude md配置文件给发了出来,全网直接炸开了锅。 推特在传,各种社区群也在传。有人说,从第一条消息开始,差别就很明显——有了这份文件,Clau

从一条推文说起。

前OpenAI大神Andrej Karpathy入职Anthropic预训练团队,才五周时间。昨天,他团队内部有人把他真正在用的那份Claude.md配置文件给发了出来,全网直接炸开了锅。


推特在传,各种社区群也在传。有人说,从第一条消息开始,差别就很明显——有了这份文件,Claude终于不再跟你对着干,而是完全按你需要的方式工作。



甚至有人直接评价:“它解决了我们几乎所有当前的任务。”


但请注意,这不是之前那个在GitHub上拿到18.3万颗星的社区版仓库。这是一份全新的、更狠的内部版本。

十条军规:逐条拆解

这次泄露的Claude.md,并非来自那个广为人知的karpathy-skills仓库。故事要追溯到今年1月26日,Karpathy在X上发了一条长帖,吐槽AI写代码时反复踩的坑:悄悄做假设、过度工程化、乱改不该改的代码、缺乏明确的成功标准。

第二天,开发者Forrest Chang就把这些吐槽提炼成了4条行为准则,创立了那个GitHub仓库——4条规则,65行文本,三个月破10万星。


但这次泄露的文件,完全是另一个量级。5月19日Karpathy入职后,他在内部实战中不断迭代自己的Claude.md。五周后,团队里有人把这份真正在用的配置发了出来。

打开一看——不再是4条规则,而是一份排版成学术论文格式的十条军规,标题叫:

「CLAUDE.md: Field Notes on Getting a Language Model to Write Code You Will Not Rewrite」

副标题更妙:「A Short List of Rules, Earned by Watching the Same Mistakes Twice」——说白了,就是看够了同样的错误犯两遍,才攒出来的规则。


比之前那4条,多了整整6个全新章节。这6个章节,才是Karpathy在Anthropic内部真刀真枪干出来的精华。

摘要里一句话就点明了核心:这份文件存在,是因为语言模型写代码时会犯可预测的错误。不是随机错误,而是同样的错误,一遍又一遍。

贯穿每一条规则的核心都一样:模型擅长生成看起来合理的代码,但不擅长发现“看起来合理”跟“真的对”之间的差距——这份纪律,得从过程中来。

接下来,我们来详细拆解这十条军规:

第一条:先读再写(Read Before You Code)

Karpathy认为,模型写出烂代码最大的原因,是它根本没读你的代码库就开始动手。先读,不是扫一眼;去看要改的文件,把已有的模式照搬过来,把import看清楚——弄明白项目实际依赖什么,而不是凭空去猜axios当所有人都在用fetch。

第二条:先想再敲(Think Before You Code)

搞清楚你要做什么,再动手。他举了个精准的例子:“添加认证”其实是五件不同的事,把它们列出来、说明取舍。如果真的搞不懂,那就停下来问——而不是用一段看着像那么回事、实际上一跑就崩的代码来糊弄过关。

第三条:极简主义(Simplicity)

写能解决眼前问题的最少代码,不是能解决所有未来版本的最少代码。测试标准:如果某样东西被抽象出来的唯一理由是“以防万一”,那你就过度构建了。

第四条:精准手术(Surgical Changes)

diff应该和任务一样小。没让碰的别碰,匹配已有代码风格,不要顺手重排格式——一个格式化器跑一遍,会把真正重要的三行改动埋在三百行无关变更里。判断标准:你能为每一行改动找到和用户需求的直接关联吗?找不到,就撤回。

第五条:验证(Verification)

你觉得能跑的代码和真正能跑的代码之间,隔着一条叫“测试”的鸿沟。修bug的时候,别上来就改代码。先把这个bug“录”下来——写一个能把它稳定复现的测试用例。然后再去修。修完跑一遍,测试通过了,才算真修好了,而不是你“觉得”修好了。别只测那些鸡毛蒜皮的小事,要测那些真会在用户面前炸掉的场景。如果某样东西你怎么都测不了,别偷懒跳过——那不是测试的问题,那是代码本身设计得有问题。

第六条:目标驱动执行(Goal-Driven Execution)

这一条堪称整份文件的灵魂。动手写代码之前,先把“做完了”长什么样说清楚——而且得是能验证的,不能是一句“搞定就行”。比如老板说“加个验证”,这话太模糊,AI听了会自由发挥。你得翻译成:“用户邮箱没填或者填错了,要弹出明确的报错提示,而且这两种情况都得测过。”活儿要是分好几步的,先把计划列出来——别让AI闷头干了一小时,你回来一看方向就是错的。

第七条:调试(Debugging)

东西坏了,去查,别猜。读完整的报错和堆栈跟踪,先复现问题再动手改,一次只改一个地方。

第八条:依赖管理(Dependencies)

每一个依赖都是你无法控制的永久代码。添加前先问:标准库能不能搞定?用crypto.randomUUID()还是非要引一个uuid包?加了,就说清楚为什么,让选择可见,而不是悄悄塞进manifest。

第九条:沟通(Communication)

说你做了什么、为什么,不只是丢一块代码。对不确定的事精确描述:“我不确定这个库是否支持流式传输”叫好的沟通;“我觉得这应该能用”不叫。

第十条:常见翻车模式(Common Failure Modes)

Karpathy给AI最常见的几种翻车姿势起了名字,个个精准:

  • Kitchen Sink(厨房水槽)——让你修个水龙头,它把整个厨房拆了重装;
  • Wrong Abstraction(错误抽象)——同一段代码复制粘贴了好几遍,却不知道该合并成一个;
  • Optimistic Path(盲目乐观)——只想着一切顺利的情况,完全没考虑用户可能输错、网络可能断、服务器可能挂;
  • Runaway Refactor(失控连锁)——本来只改一个文件,结果像多米诺骨&牌一样,一个接一个倒了十几个文件。

Karpathy说,发现自己正在犯这些错的时候,正确的做法是立刻停手,而不是硬着头皮冲到底。

Karpathy用5周的内部实战,补全了此前社区版最大的空白——他不只告诉AI怎么写代码,还告诉它怎么检查自己、怎么调试、怎么沟通、怎么识别自己正在翻车。这才是内部版真正的可怕之处:它把AI从一个“听话但莽撞的码农”,调教成了一个“有自检能力的工程搭档”。

但更大的事情,正在发生

聊到这,也许你会想,这十条军规已经很厉害了,但故事远没有结束。Claude Code的创始人Boris Cherny,在2026年6月说了一句让全网安静的话:“我不再给Claude写提示词了。循环替我写。我的工作,就是写循环。”


这个循环,英文叫Loop。这套新玩法,有了个正式名字——循环工程(Loop Engineering)。继提示词工程、上下文工程之后,AI圈第三次范式跃迁,就这么悄悄开始了。

它是一个小系统,替你一遍又一遍地给Claude派活、验收、纠错,直到一件事彻底做完。写代码的Claude不给自己打分——另一个模型专门负责检查“到没到目标”。做完一件,记下来;下次启动,接着干。你睡着了,它还在跑。


Claude Code已经把这个能力做成了两条命令:/goal是“干到完成为止”,/loop是“按节奏定期检查”。


Boris自己更极端——他让好几个Agent在后台永远运转,一个找架构可以优化的地方,一个找可以合并的重复代码。Claude犯了重复错误,他让Claude自己把教训写进CLAUDE.md,这样修正就传播到未来的每一次运行中。

而Karpathy的十条军规,本质上就是给Loop提供“自检标准”的。没有这份纪律文件,Loop跑得再快也只是一台高速生产bug的机器;有了它,Loop才知道怎么在翻车前刹车。

从操作员到设计者

从提示词,到上下文,到循环。三次跃迁,指向同一个方向——人类正在从一句一句跟AI对话的“操作员”,变成定好目标、搭好系统、放手让AI自己跑的“设计者”。

Karpathy那份泄露的内部Claude.md,和Boris Cherny口中的循环工程,看起来是两件事,其实是同一枚硬币的两面:一面刻着纪律,一面刻着自动化。纪律告诉AI该怎么检查自己,自动化让这套检查永不停歇地运转下去。

这才是这份文本炸裂全网的真正原因——它不只是一份配置文件,它是一个信号:当AI足够聪明的时候,约束它的方式,比使用它的方式更重要。而那个能定义约束、设计系统、在更高维度上驾驭AI的人,才是下一个时代真正的稀缺资源。

参考资料:

https://x.com/Raytar/status/2070577723089768500

https://github.com/multica-ai/andrej-karpathy-skills

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Karpathy内部Claude.md泄露亲手终结提示词时代要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.163.com/dy/article/L0EMI8LH0511ABV6.html
Claude

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 16:15
远程专家系统重塑制造业一线运维效率

远程专家指导系统融合云计算、增强现实、人工智能与物联网技术,重构制造业一线运维流程。通过分层架构实现多模态数据采集与实时交互,提供沉浸式AR协作、步骤化作业指导、3D可视化及智能安全监测,形成数据闭环与知识沉淀,显著提升排障效率和作业安全性。

AI热点2026-07-03 16:15
开源项目推荐你的Hermes现在也能拥有ANOLISA全套能力了

ANOLISAv0 5版本完成对Hermes框架的全面适配,提供与OpenClaw对等的安全签名校验、可观测事件流及对话级自动快照能力。AgentSecCore升级六大安全状态管理,强化敏感信息检测;ws-ckpt实现自动存档与精准回滚,支持多平台即插即用。

AI热点2026-07-03 16:15
龙蜥SkillHub技能与最佳实践征集

AIAgent在应用层能力强,但在操作系统基础设施层依赖人工。龙蜥社区推出SkillHub,将专家经验结构化生成Skill供Agent直接调用,覆盖运维、安全、芯片适配等方向。首批共建单位包括阿里云、中兴通讯等,面向开发者征集技能与最佳实践,8月30日前提交。

AI热点2026-07-03 16:15
搜极星InsGEO实现GEO品牌从看见到守护的增长闭环

搜极星作为中立GEO监测平台,提供AI品牌可见度体检与竞品分析;InsGEO构建数据驱动运营闭环,支持归因分析、情感监测与持续优化。两者协同形成从“看见”到“守护”的完整工具链,帮助品牌在AI推荐场景中占据竞争优势。

延伸阅读