Anthropic公布Fable 5上线方案，为AI越狱定标准

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

Anthropic公布Fable 5上线方案，为AI越狱定标准

热心网友时间：2026-07-05

转载

7月1日消息，当地时间周二，Anthropic发布了一篇长文，详细还原了其两款模型——Claude Fable 5和Claude Mythos 5——从被美国出口管制、暂停访问再到恢复上线的全过程。

这并非一篇简单的“恢复服务”公告。真正值得关注的是，Anthropic正试图借这一事件，将“AI模型被越狱到底有多严重”这个模糊问题，打造成一套可量化的行业评分标准。与此同时，前沿模型的发布流程，也在被推入政府预发布测试和安全协作的新轨道。

根据Anthropic的说明，Fable 5将于7月1日起面向全球用户恢复开放，覆盖Claude Platform、Claude.ai、Claude Code和Claude Cowork等主要平台。Pro、Max、Team以及部分Enterprise用户在7月7日前，可将Fable 5用于最多50%的每周使用额度，之后则通过用量积分继续使用。此外，Anthropic表示会尽快在AWS、Google Cloud和Microsoft Foundry上重新开放访问。

相比之下，Mythos 5的恢复范围要小得多。Anthropic透露，在美国政府6月26日批准后，他们已为一组美国机构恢复了Mythos 5的访问，接下来会继续与政府协调，将范围扩大到Glasswing项目中的更多国内及国际合作伙伴。

一次“越狱”报告，引发模型下架

整件事的源头，是6月12日的一纸禁令。

Anthropic称，美国政府当日对Claude Fable 5和Claude Mythos 5实施出口管制，要求限制外国国民访问这两款模型。需要注意的是，这里的“外国国民”不只包括美国境外的用户，也涵盖在美国境内的非美国公民。由于指令立即生效，而Anthropic又无法实时核验所有用户的国籍身份，最后只能选择暂停所有用户的访问。

按照Anthropic的最新复盘，Fable 5和Mythos 5都是在6月9日发布的。两者共享同一套底层模型，但面向的场景截然不同：Fable 5配备了更强的安全防护，面向更广泛的普通用户场景；而Mythos 5的防护相对较少，仅限Project Glasswing项目中少数可信的合作伙伴用于防御性网络安全任务。

美国政府出手的直接导火索，是一份来自亚马逊研究人员的报告。报告称，他们找到了一种绕过Fable 5安全防护的方法，成功让模型识别出了若干软件漏洞，其中一个案例中，模型甚至还生成了演示如何利用这些漏洞的代码。

Anthropic对此的回应是：这件事暴露的是Fable 5安全防护中的一个边界案例，并未释放出Mythos级别的独特网络攻击能力。公司表示，经过测试，Claude Opus 4.8、GPT-5.5、Kimi K2.7等能力更低的模型同样能识别出这些漏洞；在生成单个漏洞的利用演示时，多个模型也给出了类似的结果。

简而言之，Anthropic想要强调的是：这不是Fable 5突然冒出了独有的危险能力，而是安全分类器在一个模糊的边界区域被绕过了。