Claude Sonnet 5登场 系列最强智能体 部分性能逼近Opus 4.8
7月1日,Anthropic 正式发布了 Claude Sonnet 5,官方称这是 Sonnet 系列中智能体能力最强的模型——能自己制定计划、调用浏览器和终端工具,还能自主运行。说白了,它不再只是回答问题,而是能主动“干活”了。 费用方面,模型已经上线,接入了 Claude Code 和 Cla
7月1日,Anthropic 正式发布了 Claude Sonnet 5,官方称这是 Sonnet 系列中智能体能力最强的模型——能自己制定计划、调用浏览器和终端工具,还能自主运行。说白了,它不再只是回答问题,而是能主动“干活”了。

费用方面,模型已经上线,接入了 Claude Code 和 Claude Platform。开发者调用 API 时指定“claude-sonnet-5”即可。价格分两个阶段:
优惠期(至 2026 年 8 月 31 日)
- 每 100 万 Tokens 输入费用:2 美元(约合 13.6 元软妹币)
- 每 100 万 Tokens 输出费用:10 美元(约合 68 元软妹币)
优惠期后(2026 年 8 月 31 日后)
- 每 100 万 Tokens 输入费用:3 美元(约合 20.4 元软妹币)
- 每 100 万 Tokens 输出费用:15 美元(约合 102.1 元软妹币)
技能上,Claude Sonnet 5 被定位为“迄今最具智能体能力的 Sonnet 模型”。它能自主规划、调用浏览器和终端工具,并以无人干预的方式运行。这意味着开发者可以把复杂任务交给它,让它自己一步步完成。
性能表现是这次发布的最大亮点。官方数据显示,在智能体搜索评测 BrowseComp、计算机使用评测 OSWorld-Verified 等项目中,Sonnet 5.0 相比 Sonnet 4.6 有明显提升,部分任务甚至逼近了 Opus 4.8 的水准——要知道 Opus 是更高阶的系列,这种跨级的性能追赶值得关注。
安全方面,Anthropic 指出 Sonnet 5 整体不良行为发生率低于 Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性方面均有改善。这意味着它更“听话”也更“聪明”,不容易被带偏,也不容易编造内容。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Claude Sonnet 5登场 系列最强智能体 部分性能逼近Opus 4.8要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点那些碘伏性的科技创新,从来不只是技术层面的突破——它们催生新的创业风口,重塑城市格局,改写财富分配逻辑,本质上是一场深刻的社会变革。未来三年,人工智能将如何改变我们的生活?它会深度嵌入人类活动方式,推动AI与全球价值链加速整合,引发新一轮产业变革,最终成为城市发展和经济高质量发展的核心引擎。 在科技
近年来,在众多汽车行业技术交流与AI应用研讨会上,一个经典但又始终缺乏标准答案的议题再次被热议:在开发智能助手时,究竟应该选择模型微调路线,还是依靠RAG技术来撑起实际应用?今天,我们以汽车销售这一具体业务场景为切入点,把这个话题掰开揉碎,深入聊一聊。首先给出一个核心判断:没有绝对的优劣之分,只有场
人工智能时代,医疗、教练、艺术创作、发型设计、社工等需要情感互动、领导激励或精细手艺的职业相对安全。机器人难以复制人类的情感理解、直觉和复杂人际能力,因此无法完全替代这些工作。
人工智能(AI)如今已成为各行各业关注的焦点,制造业也不例外。媒体上频繁报道的新功能与新趋势,无疑在加速生产数字化进程中发挥了重要作用。然而,坦率地说,当前AI在众多应用场景中仍处于理论探索阶段,距离大规模普及尚有相当距离。不少第三方服务商打着“基于AI技术”的旗号,将自家产品包装得玄妙且昂贵,反而
- 日榜
- 周榜
- 月榜
热点快看
