Claude Sonnet新版发布:Opus级智能体验,性价比超Opus,OpenClaw API开放
Jay 发自 凹非寺
量子位 | 公众号 QbitAI
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
春节才是真正的大模型战场,全世界参与的那种。
大年初二,Anthropic史上最强Sonnet——Claude Sonnet 4.6发布。
计算机操作是这次更新的主打卖点。
Anthropic表示,对填写复杂Excel、网页清单等任务,Sonnet 4.6已经接近人类水平。
其他方面也是全方位升级:编码、长上下文推理、Agent规划、知识型工作、设计……Beta阶段还支持1M上下文。
重点来了!定价依然跟Sonnet 4.5一样,免费用户也能用。
性价比简直高到离谱。
创业者Alex Finn体验后表示「难以置信」:
在大多数Agent任务上,Sonnet 4.6的表现跟Opus系列差不多好,速度还更快,价格只要1/5。

还不只一个人这么说。
Anthropic表示,内测用户对Sonnet 4.6的喜爱程度,已经超过了超大杯Opus 4.5。
史上最强Sonnet
计算机操作能力,可以说是这次Sonnet 4.6最亮眼的部分了,Anthropic也在这部分花了不少笔墨。
虽然跟最熟练的人类工作者比还有差距,但进步速度真的恐怖。
看下面这张图——
四个月一次的高频率更新下,性能曲线依然保持着不错的上升势头。

当然,计算机操作能力提升,也意味着如果模型被prompt injection,风险会更大。
Anthropic也想到了这一点,专门给用户们塞了颗定心丸:
Sonnet 4.6的安全等级相比前代Sonnet 4.5有显著改进,表现跟Opus 4.6差不多。

事实上,计算机操作只是冰山一角,Claude Sonnet 4.6在各类Benchmark上都有提升。
具体细节都在下面这张表,一个大杯模型,智能却直逼超大杯Opus系列。
从Benchmark上还可以看到Claude这边出现了「倒反天罡」的情况。
在金融分析和办公室任务这两项测试中,Sonnet 4.6用一骑绝尘的数值,拿下了SOTA,力压历代Opus。

用户的反馈更能说明问题。
在Claude Code的早期内测中,Anthropic发现,在59%的场景下,用户更倾向于选择Sonnet 4.6(而不是Opus 4.5)。
大家评价说,Sonnet 4.6明显更少出现过度设计和「偷懒」,指令遵循方面表现更好。
同时,虚假成功声明更少,幻觉更少,多步骤任务的执行也更加稳定。
对了,这次Sonnet 4.6还提供100万token的上下文,能装下几十篇研究论文。最重要的是,在这么大规模的上下文中,Sonnet 4.6依然保持了相当领先的推理水平。
这一点在Vending-Bench Arena上特别明显。
这是个测试模型在长时间跨度内模拟运营一家企业能力的Benchmark,引入了竞争机制,不同模型需要相互对抗,争取更高利润。
在这个测试中,Sonnet 4.6采用了一种新策略:前10个模拟月份大幅投入产能建设,支出明显高于竞争对手,但在后期迅速开始想办法盈利。
这种转向时机的把握,帮助它在最终成绩上明显领先。

除此之外,用户还反馈称前端代码生成能力有提升。
Sonnet 4.6生成的视觉输出更加精致,布局、动画和设计感都比之前的模型好,达到可用于生产环境的质量所需的迭代轮次也减少了。
OpenClaw又发力了
实在是奇怪,一款大杯模型,内测中居然比超大杯旗舰款还招人喜欢。
但目前看来,也有许多网友并不买账,甚至说Anthropic是没活硬整。

主要是不太理解:
既然Opus仍然是最强,为啥要用Sonnet 4.6?

对此,有人出来解释称:这其实是定价策略和目标用户不一样。
对于本就不差钱的用户来说,这事儿影响不大。毕竟Max订阅套餐里本来就有大量补贴后的Opus 4.6额度,随便用。
但这是C端的思考方式。
在B端,企业客户可没这么大方的token补贴,调用量却高出好几倍。
与此同时,很多场景根本用不着那么强的智能。如果只是让AI帮你居中一个div这种简单活儿,Opus未免有些太奢侈。
从这个角度看,Anthropic的战略路线其实已经很清晰:
Opus用来争夺王座,维持C端品牌认知;Sonnet用来占领市场,用更低的成本将智能下放。

不过,这个「市场」其实也不光是企业客户。
计算机操作能力大幅提升,Opus级智能,Sonnet级定价……
这不就是为OpenClaw量身定做的API嘛!
果然,Anthropic这款高性价比模型的消息一出来,「龙虾大军」立马就涌进来了:
立即升级您的OpenClaw至Sonnet 4.6!
网友直接放话:这是有史以来最棒的OpenClaw模型,大家赶紧给自己的龙虾安排上。

实在是有些drama,Anthropic真得好好谢谢OpenClaw作者。
人家项目名字都被整没了,自己也加入了OpenAI,结果……OpenClaw至今还在帮Anthropic带货。
参考链接:
[1]https://www.anthropic.com/news/claude-sonnet-4-6
[2]https://x.com/AlexFinn/status/2024828886287708303
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
工信部发布防范 OpenClaw(“龙虾”)开源智能体安全风险“六要六不要”建议
工信部发布“六要六不要”,为OpenClaw(“龙虾”)开源智能体安全风险划出红线 近日,工业和信息化部网络安全威胁和漏洞信息共享平台发布了一份重磅文件,针对当前热门的OpenClaw(因其图标酷似龙虾,业内常昵称为“龙虾”)开源智能体,提出了清晰的安全使用指引——“六要六不要”。这份建议可不是空穴
荣耀 CEO 李健:荣耀机器人全栈自研,将聚焦消费市场
荣耀CEO李健详解机器人战略:全栈自研,聚焦三大核心消费场景 荣耀春季旗舰新品发布会圆满结束后,关于公司未来发展的蓝图更加清晰。在随后的媒体沟通会上,荣耀CEO李健不仅公布了年度销售目标,更首次系统性地阐述了荣耀在机器人领域的完整战略规划与市场布局。 在探讨机器人业务发展方向时,李健明确了荣耀的坚定
别只盯着“上门装龙虾赚26万”!看懂OpenClaw背后的“意图入口”大战
别再只关注“上门装龙虾赚26万”!深度解读OpenClaw背后的“意图入口”新战争 最近科技行业的热潮,充满了戏剧性的现实色彩。一只“红色龙虾”AI智能体搅动了整个市场:有人通过提供安装服务,收取每次五百元,短短几天就赚取二十六万元收入;腾讯大厦前甚至排起长队,大家竞相领取免费的安装体验权限。这场全
openclaw安装配置
一、系统要求 在开始安装 OpenClaw 之前,请务必确认您的计算机满足以下最低配置要求。这如同搭建房屋前检查地基,是确保后续安装流程顺利、软件稳定运行的前提。更高的硬件配置将为复杂任务处理和流畅体验提供有力保障。 操作系统:支持 Windows 10 及以上版本、macOS 最新稳定版,以及主流
自研第一个SKILL-openclaw入门
自研第一个SKILL:手把手教你开发openclaw自定义技能 当你成功构建好openclaw之后,如何让它真正“智能”起来?关键在于为其开发SKILL——这些技能是openclaw的“内功心法”,决定了它能帮你做什么、做多好。 本文将带你亲自动手,从零开始开发你的第一个openclaw自定义技能,
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

