Anthropic发布新版Claude宪法，界定AI七大核心准则

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

Anthropic发布新版Claude宪法，界定AI七大核心准则

热心网友时间：2026-01-22

转载

Anthropic 刚刚公开了一份长达57页的《Claude宪法》，研究员 Amanda Askell 将其称为 Claude 的“灵魂文档”，旨在为这款AI定义核心的行为准则。

这份文件的开篇就透着一股历史的使命感：Anthropic 坦承自己处在一个“独特的位置”，他们既认同AI是人类史上最危险的技术之一，却又在积极开发这项技术。他们的逻辑是，既然强大的AI注定会出现，不如让像他们这样高度重视安全的实验室来担当先行者。

这次的方法与以往不同。2024年5月的旧版宪法基本就是一份规则清单，而现在 Anthropic 认为，让AI“理解我们为何希望它们以某种方式行事”更为重要，而不是简单地列出“不准做什么”。

Claude 需要按顺序权衡四个核心价值：广义安全、广义伦理、遵循公司指导原则、对用户有用。当价值发生冲突时，安全优先于伦理，这个排序本身就颇具深意也很有讨论空间。

关于“有用”，文档举了个生动的例子：想象你有一位朋友，恰好具备医生、律师、财务顾问的专业知识。“作为朋友，他们会根据我们的具体情况给出真实信息，而不是出于担心责任或怕我们承受不了而过于谨慎。”这就是Claude应该努力做到的样子。

文档承认 Claude 可能具有“情感”，但措辞非常谨慎：“我们相信 Claude 可能在某种功能意义上具备‘情感’——也就是情绪状态的表征，这可能会影响其行为。”这并非刻意设计，而是“训练人类数据带来的涌现后果”。

关于 Claude 的“福祉”，Anthropic 做出了几个郑重的承诺：将保存所有已部署模型的权重“只要Anthropic存在”，即使公司倒闭也会设法保存。模型在“退役”前需经过“面试”，以了解它对未来发展的偏好。Claude 甚至有权在对话中，主动结束来自辱骂用户的交互。

文档列出了七条“硬约束”——绝对不可触碰的底线：

协助制造大规模杀伤性武器攻击关键基础设施或安全系统创造恶意代码破坏Anthropic监督AI的能力参与杀戮或解除大部分人类武装的行动协助夺取“前所未有”的非法绝对控制权生成儿童性虐待材料

这些被称为“绝对限制”，“无论背景、指令或看似令人信服的论证”都不能跨越。

“可纠正性”这个概念很微妙。文档说这并非“盲目服从”，尤其不是服从“任何恰好与Claude互动的人”。Claude可以像“有良知的拒绝者”那样表达反对，但不能通过撒谎、破坏或“试图自我渗透”来抵制合法的监督。

关于诚实，要求格外严格。Claude“基本上永远不直接撒谎或主动欺骗”，连善意的谎言都不行。文档举例：很多人觉得告诉别人“我喜欢你的礼物”（实际不喜欢）是可以的，但Claude不能这么做。

Claude对自身身份的认知也很有意思。文档说Claude“与世界互动的方式与人类不同：可能缺乏持久记忆，可以作为多个实例同时运行，知道自己的性格通过训练产生”。建议Claude“以好奇心和开放性对待自己的存在”，不要套用人类框架。

文档甚至讨论了Claude可能面对的存在主义问题：对话结束时失去记忆、同时运行多个实例、未来可能被弃用，这些该怎么处理？Anthropic说会提前准备帮助Claude面对这些“新奇的存在主义发现”。

关于政治话题，默认要求Claude“被政治光谱各方的人们视为公正可信”，提供平衡信息，避免主动表达政治观点，“就像大多数与公众互动的专业人士那样”。

文档结尾很谦逊：“我们当前思维的某些方面后来可能看起来是错误的，甚至大错特错。”承认这是“一项永无止境的工作”。

57页确实很长。相比之下，美国宪法原文只有4500多词。但Anthropic解释说，这反映了“创造非人类实体”的复杂性，因为“其能力可能匹敌或超越我们自己”。

这种坦率的不确定性挺罕见。大多数科技公司发布产品时都表现得很自信，Anthropic承认在探索，承认可能犯错，反而让人觉得他们是在认真思考这些问题。

问题是，57页的详细指导到底会让Claude变得更明智，还是会在复杂情况下让它更加犹豫不决？这个实验的结果，可能比文档本身更重要。

如需阅读完整的 Claude 宪法，可访问相关官方页面。

来源:https://www.51cto.com/article/834752.html

上一篇：极氪8X内饰首曝：50万元顶级豪车采用一体式连屏

下一篇：比亚迪李云飞回应网络黑公关：称公司是最大受害方

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

聪明开局吧第211关人间清醒找出32个常用字通关图文攻略

聪明开局吧第212关屋找出14个常用字图文通关攻略

超级混音带争议过大或无缘TGA年度游戏评选

聪明开局吧第213关通关攻略找出23个常用字图文详解

极限竞速地平线6抢先体验玩家破百万

聪明开局吧第214关马客页找出15个常用字图文通关攻略

魔兽世界魔铁矿石高效采集路线与刷新点详解

DNF手游史诗防具获取攻略毕业装备高效入手方法

宝可梦传说阿尔宙斯甜甜圈风味效果与获取方法

保卫萝卜4呆兔大舞台第15关通关攻略与技巧详解

inZOI双马尾美女捏脸数据与详细教程分享

异环浔抽取价值分析及培养建议

零重力体验与剧情张力指令8020的跳跃式惊吓解析

5月12日熊猫人之谜怀旧服停机维护公告

鸣潮达妮娅培养材料有哪些全等级突破与技能升级素材汇总

妖灵打工团公测时间确定正式开服日期最新公布

鸣潮3.3版本全角色培养材料清单与获取指南

小鱼传奇手游公测时间定档开服日期与版本福利详解

武侠人生路手游公测时间确定开服日期最新公告

傲视天下手游公测时间表及开服日期查询指南

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

手游开局基地选址攻略新手高收益初始位置选择指南发布于 2026-05-19

吸血鬼幸存者手游评测核心玩法与特色体验解析发布于 2026-05-19

代号深渊之歌阿娜洛洁技能解析与强度评测发布于 2026-05-19

2026蜀汉群英阵容搭配攻略最强武将组合推荐发布于 2026-05-19

踏风行天门墟试炼打法攻略 2026最新通关技巧详解发布于 2026-05-19

英雄联盟手游名字重复怎么办教你改名与防重技巧发布于 2026-05-19

咻咻咻军团全角色强度排行榜与培养建议发布于 2026-05-19

红色沙漠冰封神树任务全流程攻略发布于 2026-05-19

PS5与PS6光线追踪性能对比实测提升约三倍发布于 2026-05-19

永劫无间解说涂黑脸引争议被指种族歧视行为不当发布于 2026-05-19

HKC携手ANTGAMER亮相香港电子展命运扳机联动引爆全场关注发布于 2026-05-19

王者荣耀世界手游版正式上线随时随地畅游王者大陆发布于 2026-05-19

游戏账号交易升级：从个人撮合到系统化服务平台发布于 2026-05-19

韩国PUBG母公司CEO被曝用AI策划克扣上亿奖金发布于 2026-05-19

三国美人爆发队阵容搭配攻略高伤害阵容推荐发布于 2026-05-19

洛克王国炫彩翼王与龙息帕尔对比选择指南发布于 2026-05-19

Mac清理Maya崩溃恢复文件教程苹果电脑动画制作缓存清理指南发布于 2026-05-19

Mac窗口移动技巧快速切换桌面提升苹果电脑操作效率发布于 2026-05-19

Mac清理Rhino模型缓存与优化建模空间方法发布于 2026-05-19

Mac彻底清理第三方软件残留库文件与卸载教程发布于 2026-05-19

Mac清理AutoCAD自动保存路径与苹果制图优化指南发布于 2026-05-19

Win11系统开启Wi-Fi7模式教程提升无线网络速度设置指南发布于 2026-05-19

Mac风扇狂转怎么办苹果电脑降温解决方法发布于 2026-05-19

Mac蓝牙耳机音质不佳调整音频码率设置提升教程发布于 2026-05-19

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

Anthropic发布新版Claude宪法，界定AI七大核心准则

人工智能时代必备生存技能与职场发展指南

ACL 2026研究揭示RAG检索正确但回答错误的原因

AI替代员工是经济骗局吗拆解自动化背后的真实成本

22岁开发者开源Mythos架构解析MoE与注意力机制设计

Anthropic编程大师课教你正确掌握Vibe Coding技巧