Claude下一代模型训练细节公开性格调优成关键环节

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

Claude下一代模型训练细节公开性格调优成关键环节

热心网友时间：2026-05-23

转载

信息量太大了！Anthropic高管全盘托出下一代Claude训练秘籍：用AI爆改AI，让AI在闲置时「做梦」自进化，还有「性格」养成计划。

Claude 100%编码Claude，这在圈内早已不是秘密。但Claude「自我造物」的全过程，始终是Anthropic严防死守的核心机密。

就在今天，这个秘密被彻底公开了。Anthropic产品负责人Alex Albert在一场35分钟的访谈中，首次毫无保留地曝光了所有细节。

作为直接负责打造下一代Claude模型的核心人物，Alex在与科技博主Peter Yang的对话中，几乎把内部造Claude的「核心方法论」全盘托出——从下一代Claude的研发逻辑、内部评估流程、性格训练方法，到正在悄悄推进的「意识研究」。每一条，都是硬核猛料。

每一代Claude出生前，就被「规划好了人生」

大多数人对训练大语言模型的理解，还停留在「堆数据、堆算力、堆参数」的暴力美学阶段。但Alex Albert透露的Anthropic内部流程，完全是另一套打法。

他们把模型本身当作一个「产品」来对待。这意味着，每一个新模型在训练开始前，团队就已经明确定义了它应该擅长什么。说白了，Claude的「命运」在预训练启动之前，就已经被写好了。

那么，具体怎么做？Anthropic团队会在预训练阶段之前就介入，锁定这一代模型的核心「能力赌注」。比如编程能力、知识工作能力、Excel表格处理能力，这些都不是训练完再看结果，而是一开始就想清楚的战略决策。

最终，这些决策的输入来源有两个：一是企业客户的直接反馈，二是Anthropic员工自己在日常工作中踩过的坑。这确保了能力的规划不是空中楼阁，而是根植于真实需求。

「单向门」决策，也可逆

对此，Alex分享了Anthropic内部的一个核心决策框架：单向门（One-Way Door）。简言之，就是一个不可逆的决策。他举例道，在预训练之前选定模型架构，这就是一个典型的「单向门」。模型训练周期可能长达数月，一旦开始就很难回头，这种决策需要投入大量时间去论证。

但如果一个决策是可逆的呢？Alex说得很直接：如果不是单向门，那基本就是免费的。过去20年，产品开发的流程变化不大。但过去一两年，一切都变了。

以前构建一个MVP需要2-4周，现在，1天就够了。以前产品经理想了解某个功能的数据表现，需要找数据科学团队做几天调查。现在，打开Claude Code，接上产品数据库，10分钟就出结果。

这背后揭示了一个更深层的事实：Anthropic自己就是Claude最苛刻的用户，他们在用自己的产品来训练和迭代自己的产品。这意味着，Anthropic训练Claude时，考虑的是「模型×产品×用户场景」这个三维空间里的综合体验。模型不是单独存在的，它本身就是产品体验的核心部分。

用Claude训练Claude，真正闭环了

那么，Anthropic怎么知道Claude哪里做得好、哪里做得差？答案是：用Claude来迭代Claude。访谈中，Alex详细拆解了这条堪称完美的闭环流程：

第一步，海量用户反馈涌入；第二步，用Claude对反馈进行聚类分析，提取出排名靠前的高频主题；第三步，基于这些真实痛点生成「合成版」用户问题；第四步，把合成数据直接转化为「评估基准」。这些合成问题，最终会变成测试下一代Claude能力的标准化评估集。

Alex特别强调，这不是跑跑基准测试就完事的「评估戏剧」。Anthropic的评估必须锚定在真实用户的真实任务形态上：越接近终端用户实际会遇到的问题，评估就越有价值。

为此，他举了一个视觉能力的例子。假设发现Claude无法准确识别图像中超过10个元素的数量，团队不会停留在「发现了一个bug」这个层面，而是会追问：这个问题在真实用户场景中意味着什么？它会影响谁的什么任务？只有当评估和真实用户场景对齐时，研究团队才会投入资源去修复。

而修复的手段也不止一条路：可能回到预训练阶段调整数据配比，也可能在强化学习阶段做定向干预。具体走哪条路，取决于研究团队的战略判断。有时候，甚至只需要几十个高质量测试用例，就足以证明问题的存在并启动修复流程。这背后的逻辑很清晰：不是数据越多越好，而是数据越「真」越好。

AI「做梦」自进化，睡一觉战力暴涨

说到认知和记忆，Alex抛出了一个更炸裂的概念——Claude已经学会「做梦」了。这不是比喻，是字面意义上的「做梦」，或者更准确地说，是一种类似人类梦境中「记忆再巩固」的机制。

当Claude的智能体不在执行前台任务的时候，比如在后台闲置时，它会自动进入一种「梦境模式」：遍历自己的记忆存储，发现相互矛盾的信息，进行修剪、清理和整合，完成记忆的「二次加工」。这是一个跨会话、跨时间的高阶认知过程。它能看到单次对话中看不到的模式：反复出现的错误、多个Agent独立收敛的工作流、团队级别的共性偏好。

三方客户案例，进一步证实了这个功能的威力：法律AI公司Harvey在接入Claude的「做梦」能力后，任务完成率提升了约6倍。医疗文档公司Wisedocs则将文档审核时间缩短了50%；Netflix已经在用Agent协作，同时处理数百个应用的构建日志。本质上，「做梦」是在优化思考的前提条件，让AI的底层认知结构更加清晰高效。