Claude Sonnet 5发布部分性能逼近Opus 4.8
7月1日,Anthropic 正式发布了其最新AI模型 Claude Sonnet 5,被誉为Sonnet系列中智能体能力最强的版本。简而言之,该模型能够自主制定计划、调用浏览器和终端等工具,并直接执行任务——它不再局限于回答提问,而是真正具备执行操作的能力。

在费用与接入方面,该模型现已上线,并集成至 Claude Code 和 Claude Platform。开发者在调用API时,只需指定“claude-sonnet-5”即可直接使用。

就技能而言,Claude Sonnet 5是Anthropic目前最具智能体能力的Sonnet模型。它能规划执行步骤,操控浏览器和终端,并以自主方式运行——换句话说,只需提供目标,它便能独立完成整个流程,无需逐步催促。

性能提升是衡量模型实力的关键指标。在智能体搜索评测BrowseComp、计算机使用评测OSWorld-Verified等项目中,Sonnet 5.0相比Sonnet 4.6取得了显著进步,甚至在某些任务上已接近Opus 4.8的水平。这充分表明,两者之间的差距正在快速缩小,Sonnet系列正稳步向旗舰级性能迈进。
在安全性方面,Anthropic提供了积极的数据:Sonnet 5的整体不良行为发生率低于Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性等维度上均有改善。简而言之,该模型更加安全、不易被误导,并且极少产生虚构内容。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
小米集团辟谣官微上线,定位官方辟谣平台
小米辟谣官微6月30日正式上线,作为集团官方辟谣阵地,用户可查询辟谣声明、反馈谣言线索。账号将主动澄清网络谣言,维护合法商誉,并致力于打造权威辟谣通道,保障公众知情权与合法权益。
小米官方辟谣账号上线持续维护合法商誉
6月30日,小米集团的一则动态引发热议:小米辟谣官方账号,正式上线了。简单来说,小米这次将澄清谣言的工作直接推到了前台——在中央网信办违法和不良信息举报中心的指导下,小米辟谣的全新阵地宣告成立。 目前,这个辟谣账号已在微博开通。用户可以通过它核实与查阅小米官方的辟谣声明,也可以反馈任何涉及小米的谣言
特斯拉Cybercab无驾舱量产车在奥斯汀启动L4级公开道路测试
特斯拉Cybercab量产车在奥斯汀启动L4级公开测试,彻底取消方向盘等物理控制装置。安全监督员仅观察不干预。车辆专为Robotaxi设计,搭载HW4 0与FSDV14 3 3系统,续航672公里,支持无线充电,实现全程独立驾驶。
鸿蒙智行回应问界M5车内异味系第三方配件所致
6月30日,针对近期网络热议的“问界M5车内异味”事件,鸿蒙智行官方小助手在社区帖子下方发布了正式回应。官方表示,已对刘先生的这辆车进行了全面检测排查。工作人员上门核查后发现,涉事车辆内部加装了大量第三方配件,包括非原厂皮质、塑胶收纳摆件、脚托、抱枕、车衣等。在拆除所有加装配件后,工作人员严格依照国
闫闯直言20万买电车选400V太愚蠢
2026年6月30日,微博上一则关于电动汽车高压平台技术路线的争论迅速引爆热搜。坐拥超过475万粉丝的汽车领域博主闫闯,在归还体验了4天的理想i6时,专门花费6分多钟把电量充至满格,并掷地有声地留下一句:“一点不比加油慢。”随后他补充道:“还是那句话,都这时代了,20万+电车还买400V的绝对愚蠢。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:21
2026-07-02 11:21
2026-07-02 11:21
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

