当前位置: 首页
AI资讯
Anthropic发布Opus 4.7模型回应质疑

Anthropic发布Opus 4.7模型回应质疑

热心网友 时间:2026-05-20
转载

一家AI公司,究竟做了什么,能让开发者在GitHub上公开声讨,直指其模型“退化到没法用”?

过去几周,关于Claude Opus 4.6“疯狂降智”的讨论就没停过。AMD的一位资深总监在GitHub上发帖,直言“Claude已退化到无法信任执行复杂工程的地步”,一石激起千层浪,无数开发者跟帖补刀,分享着相似的糟糕体验。

就在这场信任危机发酵到顶点时,2026年4月16日,Anthropic悄无声息地推出了Claude Opus 4.7。

这个时机,耐人寻味。

“退化”风波,Anthropic欠开发者一个答案

要理解Opus 4.7的意义,得先搞清楚它出现之前发生了什么。

Opus 4.6上线初期,口碑其实不错。但随着时间的推移,开发者们陆续发现不对劲:这个模型在处理复杂工程任务时,变得越来越“保守”,动不动就在多步骤任务中途放弃,甚至开始给出一些“看起来合理、实则错误”的答案。

这种“退化感”,在AI产品里堪称最致命的信任危机。用户或许能接受一个能力平平的工具,但绝对无法忍受一个用熟了的伙伴突然变得不可靠。

从数据视角看,财报分析平台Hex的评估点出了问题的本质。他们发现,Opus 4.6在遇到数据矛盾时,倾向于给出“看似合理的错误回退”,而不是老老实实承认“数据缺失,我无法回答”。对于一个被用来做数据分析的工具而言,这比单纯的“不会”更危险。

面对如潮的反馈,Anthropic的回应方式很直接:上新版本。没有公开的解释,也没有“我们听到了”的官方声明,就是一个新模型悄然上线。

对技术公司来说,这大概是最硬核的道歉方式了。

Opus 4.7到底强在哪

Anthropic给Opus 4.7贴的标签是“软件工程领域的显著提升”,并引入了一个全新的“xhigh”努力等级。

官方数字显示,其编码基准提升了13%,生产级任务的自主完成率提升了3倍,同时还带来了高达3.75兆像素的高分辨率视觉支持和更新的分词器。

但这些数字对开发者而言有些抽象。更有说服力的是来自Cursor团队的反馈。作为目前最受开发者青睐的AI编程工具之一,Cursor用其内部基准CursorBench测试了Opus 4.7,结果是自主编码成功率从Opus 4.6的58%跃升至70%。

12个百分点的差距,听起来不大,但放在“自主完成复杂任务”这个维度上,意义就完全不同了。过去在Opus 4.6上需要两到三次提示才能搞定的任务,在4.7上通常一次就能跑通。对于那些深度依赖AI工作流的开发者来说,这直接意味着来回调试的成本能减少一半以上。

Hex对Opus 4.7的评价,则从另一个维度印证了这次升级的含金量。他们直接称其为“评估过最强大的模型”,核心理由是它在面对数据矛盾时,不再试图编造貌似合理的答案,而是选择如实告知“数据缺失”。这听起来像是个微小的行为变化,但它指向的是模型“自知能力边界”这一更深层的进步。

价格倒是没变。输入每百万token 5美元,输出每百万token 25美元,与Opus 4.6保持一致。

两周三更新,Anthropic在打什么算盘

如果只看单次发布,Opus 4.7是一次扎实的迭代升级。但把时间线拉长到过去两个月,这次更新背后的逻辑就更有看头了。

自2026年1月以来,Anthropic大约保持着每两周一次重大更新的节奏。这个频率,在AI军备竞赛白热化的今天,本身就是一种战略表态:“我们在跑,而且不会停”。

更值得关注的是另一件几乎同时发生的事。就在Opus 4.7发布前几周,Anthropic向精选企业客户悄悄开放了Claude Mythos Preview,这是其“Project Glasswing”网络安全计划的一部分。据报道,这个模型能力极强,甚至能够渗透主要银&行系统,且具备同时攻击多个目标的潜力。Anthropic联合创始人杰克·克拉克为此专门向特朗普政府做了汇报,随后财政部长斯科特·贝森特和美联储主席鲍威尔也紧急召集了与银&行高管的会议。

这意味着,Anthropic现在同时在打两场战争。一场是公开的、面向开发者和企业客户的产品战,Opus 4.7是这场战争里的一枚棋子;另一场则是关于AI能力边界的政策博弈,Mythos和Project Glasswing是这条线上更为敏感的棋局。

两件事放在一起看,你会发现Anthropic的产品哲学正在发生微妙转变。他们越来越清楚,最强大的模型不能直接扔给所有人用,但也不能把那个“足够强”的通用模型给做差了。Opus 4.7扮演的,正是这个“足够强且可控部署”的角色。

开发者生态的新格局

Opus 4.7的发布,对整个开发者工具生态的影响,远不止“Claude又更新了”那么简单。

编程助手这个赛道,今天比拼的已经是“工作流深度绑定”的能力。Cursor选择将Opus 4.7作为核心模型接入,这背后是一个明确的判断:在当前竞争格局下,Claude系列对复杂软件工程任务的理解深度,依然拥有明显优势。

VentureBeat的一个分析视角很有意思,他们认为Opus 4.7代表着AI正从“创意助手”向“可靠执行者”的角色迁移。这个说法道出了企业采购决策的核心逻辑:创意助手可以偶尔出错,但执行者不行。

当然,也有值得留意的隐患。新分词器的引入意味着,同样的输入文本可能会消耗更多token。虽然单价不变,但实际使用成本可能悄然上涨。这对于高频调用API的企业来说,是一个需要重新测算的变量。

还有一个更根本的问题,正如Decrypt的评论所指出的,AI行业至今仍缺乏一套被广泛认可的能力评估标准。Anthropic说编码基准提升了13%,但这个基准与真实开发场景之间的距离,每个人的感受都不一样。Cursor那个70%的成功率数据,之所以比所有官方基准都更有说服力,正是因为它源于真实工作流中的实际验证。

几周前,开发者在GitHub上公开抱怨Opus 4.6“不能用了”。今天,Anthropic用一个新版本回应了这份不满,并用实打实的性能数据,赢回了Cursor、Hex这些头部工具团队的背书。

但用户的信任,不是靠一次发布就能彻底修复的。每两周一次的迭代节奏,既是优势,也是压力。因为它意味着,每一次发布都必须足够好,否则下一轮关于“退化”的声讨,只会来得更快、更猛。

对Anthropic而言,真正的考验不在于今天能否推出一个更好的版本,而在于能否让开发者相信,这种“更好”是持续的、可预期的。这对任何一家AI公司来说,都是一个巨大的挑战。

*头图来源:LLM Stats

来源:https://www.geekpark.net/news/362708

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
侨银股份下跌237成交额785904万元后市走势分析

侨银股份下跌237成交额785904万元后市走势分析

侨银股份5月20日股价下跌2 37%,成交额7859 04万元。公司核心收入源于城乡环卫保洁,一季度营收与净利润同比下滑。业务已拓展至数字乡村、智慧城市及人工智能领域,近期成立数智城市研究院聚焦AI技术。当日主力资金净流出,股价接近关键支撑位,需关注后续走势。

时间:2026-05-20 20:58
南通创新区聚焦人工智能产业 2026年打造长三角科技高地

南通创新区聚焦人工智能产业 2026年打造长三角科技高地

南通创新区在长三角产业科技论坛阐述产业布局,聚焦人工智能、IC设计和生命健康三大领域,以AI为战略主轴,资源配置围绕智能体、具身智能及数据要素展开,强调垂直领域深度研发。园区通过建设数字基础设施赋能传统产业升级,推动新技术本地首用,已吸引多家企业研发中心落户,并与高校。

时间:2026-05-20 20:57
半导体ETF大涨超6%领跑市场 电力板块回调跌逾4%

半导体ETF大涨超6%领跑市场 电力板块回调跌逾4%

今日市场分化,科创50指数涨超3%。半导体产业链强势延续,相关龙头股价创新高,光纤、液冷服务器等板块走强。半导体设备ETF涨超6%,主要受存储芯片扩产及晶圆厂扩产预期驱动,AI与存储高景气或延续至2026年。电力ETF跌超4%,政策推动人工智能与能源双向赋能,聚焦保障算力能源供给、促进绿色转型及供需协同。

时间:2026-05-20 20:57
Gemini Omni实测:一句话生成视频,草图秒变电影大片

Gemini Omni实测:一句话生成视频,草图秒变电影大片

谷歌发布全新AI模型GeminiOmni,标志着视频生成从“创造内容”迈向“创造世界”。它能理解物理规律,将抽象概念可视化,并通过自然语言对话编辑视频。其多模态架构从底层设计,实现了能力的阶跃式跨越,被视为视频生成领域的新物种。

时间:2026-05-20 20:57
Govee Matter户外灯柱降价40% 智能庭院照明性价比之选

Govee Matter户外灯柱降价40% 智能庭院照明性价比之选

GoveeMatter户外灯柱近期在亚马逊降价至259 99美元,为历史第二低价。该产品支持Matter协议,可接入主流智能家居平台,具备IP66防水等级与360度照明能力,最远照射约9 75米。内置红外传感器兼具迎宾与安防功能,可自动调节灯光并发送异常提醒。

时间:2026-05-20 20:57
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程