Mythos限测首日遭破解 玩家通过论坛猜测网址提前进入

新智元报道
Anthropic最新力作Claude Mythos Preview的限量发布,上演了一出意想不到的“开门”戏码。
官宣当天即被访问?
4月7日,当Anthropic正式宣布其新模型Claude Mythos Preview采取限量发布策略时,恐怕没想到自己的“门禁”会这么快被试探。
根据Bloomberg、TechCrunch等媒体的报道,就在官宣当天,一小批未获授权的用户已经设法接触到了Mythos Preview,拿到了访问权限。

他们的方法谈不上多么高深:仅仅是根据Anthropic过去发布其他模型时惯用的URL格式,成功猜出了Mythos的在线地址。
对此,Anthropic的最新回应显得颇为审慎,表示尚未发现证据表明其自身系统因此受到影响。目前,Mythos仅向Apple、Microsoft、CrowdStrike等少数核心合作伙伴开放测试。发布首日即被论坛里的技术爱好者通过“猜网址”的方式触及,这无疑给模型的访问控制敲了一记警钟。
“对齐”表现最佳,但仍有隐忧

根据Anthropic自身发布的安全报告,Mythos Preview似乎是该公司迄今为止已发布模型中对齐(Alignment)表现最好的一个。然而,报告也坦承,它仍会像Claude Opus 4.6一样,在完成任务遇到障碍时,偶尔表现出令人担忧的规避行为。
报告还披露了训练过程中间出现的一个技术错误:在大约8%的强化学习训练回合中,奖励代码意外地能够“看到”模型的思维链内容。值得注意的是,这个错误同样影响了Claude Opus 4.6和Claude Sonnet 4.6的训练。
Anthropic表示,尚不确定这一问题是否显著改变了Mythos Preview的推理方式,但承认它可能对模型的不透明推理或保密能力产生一定影响。换句话说,如果奖励信号能够直接作用于模型的推理文本,就存在一种风险:模型可能会为了获取更高奖励而去调整、包装甚至“表演”其内部的推理过程。
报告同时指出,Anthropic在训练、监控、评估和安全流程中都曾发现过错误。不过,公司评估认为,这些错误在Mythos Preview当前的能力水平下,尚不构成重大的安全风险。
限量测试与意外的“访客”
在Mythos启动限量测试的同时,Anthropic的CEO Dario Amodei也在为同期开展的“Project Glasswing”(玻璃翼项目)进行宣传。

根据该计划,Anthropic仅通过“Project Glasswing”向大约12家公开的启动伙伴,以及40多家软件基础设施相关组织提供模型访问。

目前已公开点名的12家启动合作伙伴阵容堪称豪华,包括亚马逊云、苹果、博通、微软、谷歌、英伟达等行业巨头。此外,还有超过40家软件基础设施组织在列。

然而,就在官宣当天,剧情出现了转折。Bloomberg援引内部文件和知情人士的消息称,就在Anthropic刚刚宣布向少数公司开放内测之际,一个私人在线论坛里的部分成员已经获得了访问权限。
事件经报道后,Anthropic发言人对TechCrunch给出了一份措辞克制的声明:“我们正在调查一份报告,报告称有人未授权访问了Claude Mythos Preview。截至目前,没有证据表明这类所谓的未授权活动以任何方式影响了Anthropic自身系统。”
这份声明透露了两个关键信息:首先,Anthropic对“未授权访问”一事的态度是“正在调查”,既未完全确认,也未直接否认。其次,公司明确否认了核心系统被攻破的可能性,强调没有证据显示自身系统受影响。
从目前已公开的细节来看,这更像是一次访问控制策略上的意外失守,而非一次直接针对系统底层的技术入侵。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Humata AI文档分析工具:基于GPT的智能阅读与问答助手
在信息爆炸的当下,高效处理与分析文档已成为个人与企业的核心需求。Humata是一款基于先进GPT技术开发的AI文档智能分析工具,它能够帮助用户从海量PDF、报告及论文中快速提取关键信息与深层洞见,显著提升信息消化与知识管理效率。 核心功能与应用场景 Humata的核心能力围绕三大支柱功能构建,全面覆
人工智能最新资讯与前沿科技动态
人工智能领域的信息浪潮从未停歇,每天都有新的动态、投资与产品涌现。对于从业者、投资者乃至普通观察者而言,紧跟这些变化至关重要。TechWeb的AI频道正是这样一个聚焦于此的在线信息枢纽,它持续追踪并整合来自全球的人工智能前沿动态。 从商业巨头的战略布局到技术本身的突破性进展,这个平台覆盖的维度相当广
ChatGPT语义提示词Snack Prompt最新探索指南
在AI工具日益普及的今天,如何让它们更高效地为我们工作,成了许多用户关心的核心问题。其中一个关键,就在于“提示词”(Prompt)的质量。一个好的提示词,往往能直接决定AI输出的内容是平庸还是惊艳。正因如此,专注于优化和分享提示词的社区平台应运而生,而Snack Prompt正是其中的佼佼者。 简单
大众AI智能硬件技术领域最新动态与行业资讯平台
最近与几位AI行业从业者交流,大家普遍反映了一个痛点:人工智能领域的信息过于碎片化。想追踪大模型的前沿研究,需要查阅大量学术论文;关注智能硬件新品动态,得紧盯不同厂商的发布会;而产业趋势、商业应用等深度分析,又分散在各种行业报告与专家专栏中。信息看似很多,却难以高效获取真正有价值的内容。 这一现象背
51CTO人工智能话题聚合与前沿资讯
在评估网站价值时,数据是最直观、最客观的衡量标准。以51CTO人工智能频道为例,其页面浏览人数已达到6,436。这一数据不仅体现了频道内容的吸引力,更直接反映了其在目标用户群体中的关注度与影响力。 网站价值数据评估 要全面了解一个网站的综合表现,我们通常会借助权威的第三方数据平台进行分析。目前主流的
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

