AI圈卷疯了,xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
就在刚刚,Anthropic正式宣布,Claude 3.5 Haiku已经可以通过API访问。

巧的是,几乎同一时间,xAI那边也官宣,Grok API正式开启公测。

Claude 3.5 Haiku正式开放API
现在,Claude 3.5 Haiku已经在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上全线就位。
Anthropic的开发者关系运营负责人Alex Albert发帖称:“该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。” 这意味着,它已经带着最新的知识储备上场了。

从性能角度来看,Claude 3.5 Haiku的表现确实不俗,已经在向Sonnet看齐。

在编程和袋里任务上,它的表现也超越了除新款3.5 Sonnet之外的所有此前Claude模型。

SWE-bench Verified测试的结果,恰好印证了它在解决实际软件问题上的能力。
AI公司iGent的CEO评价道:“Claude 3.5 Haiku展现了令人印象深刻的推理和代码生成能力,包括展示强大的多轮代码优化功能,使与代码相关的错误减少了60%。它和其他体积更大的模型处于同一水平。”

基于这些特性,Claude 3.5 Haiku非常适合面向用户的产品、专业化的子袋里任务,以及从大量数据(如购买历史、定价或库存记录)中生成个性化体验。
Anthropic也给出了一些典型的使用场景:
1. 代码补全:提供快速、准确的代码建议和补全,加速开发工作流。
2. 交互式聊天机器人:凭借增强的对话能力和快速响应,非常适合支持大规模互动,这对客户服务、电商和教育平台尤其有价值。
3. 数据提取和标注:高效处理和分类信息,在快速数据提取和自动化标注任务中表现出色,对金融、医疗和研究机构特别实用。
4. 实时内容审核:通过改进的推理和内容理解能力,提供可靠的即时内容审核,对社交平台、在线社区和媒体组织很有价值。
不过,性能提升的代价也很直接——Haiku的价格直接翻了4倍。现在的定价是每百万输入tokens 1美元,每百万输出tokens 5美元。


网友:能力不咋行,涨价第一名
这个价格一出,网友们的吐槽就涌上来了。
“Jimmy Apples”感慨道:“如今,Anthropic的光芒正在褪去。” 比起隔壁的4o-mini,3.5 Haiku在很多基准测试上的表现更差,但价格却更贵。

网友“John”专门做了一张Claude 3.5 Haiku和Gemini 1.5 Flash的性能/价格对比图,结论很直观:3.5 Haiku要花几十倍的钱,但换来的性能提升却微乎其微。


网友“elvis”甚至直接画了柱状图,直观地展示Haiku夸张的涨价幅度。

同时,他还对比了Claude 3.5 Haiku、GPT-4o Mini和Gemini 1.5 Flash在MATH Benchmark和GPQA Diamond Benchmark上的表现——结果显示,3.5 Haiku相比上一代价格翻了4倍,而那些表现基本持平甚至更好的同类模型,价格却“断崖式”地便宜。


当然,网络中也不乏惊喜的欢呼声。

Grok API开启公测
与此同时,马斯克的xAI也带来了新消息:Grok API正式开启公测。到2024年底,每月有25美金的免费额度,人人可参与。如果之前已经购买了预付费额度,比如50美元,那么在11月和12月,每月都能获得75美元(25+50)的免费额度。

模型性能
根据官方博客,此次xAI公开了一个全新的Grok模型,代号“grok-beta”,目前正处于开发的最后阶段。该模型上下文长度为128000 token,意味着它可以处理更长的文本输入,理解更复杂的上下文关系。


除了支持函数调用,它也支持系统提示词,让开发者能更灵活地控制模型行为。这意味着它可以与外部工具高效连接和交互,为各种复杂应用场景的实现提供了可能。
借此机会,xAI还透露,除了纯文本版本外,下周还将发布一个支持图像输入的多模态版本。以后,Grok不仅能读懂文字,也能“看懂”图片了。
兼容OpenAI和Anthropic API
值得留意的是,为了让开发者用得顺手,xAI的REST API完全兼容OpenAI和Anthropic的API,迁移起来非常方便。如果你正在使用OpenAI的Python SDK,只需要做两个简单的改动:
– 将base_url改为https://api.x.ai/v1
– 使用在console.x.ai创建的xAI API密钥
就这么简单,你的应用就能无缝切换到Grok了。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
RAG四标融合企业知识资产体系四库协同GEO优化实践
生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略,在大模型的内容采信规则下已经基本失效。取而代之的,是生成式引擎优化(GEO)。它不再关注外链数量,而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG(检索增强生成)架构真正看重的核心指
一个普通上班人分享WorkBuddy使用心得与真实体验
前言 最近我开始使用WorkBuddy——这是腾讯推出的一款AI办公工作台。差不多用了一周时间,趁印象还新鲜,把真实的使用感受记录下来,给还在犹豫的朋友做个参考。不吹不黑,只说实际体验。 初印象:不只是聊天机器人 之前用过不少AI工具,大多数就是个对话框,你问它答,答完就结束了。WorkBuddy不
AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录
先讲一个颇具戏剧性的开端。 这件事的开端颇显荒诞——有用户前来咨询,称AI Pro版的介绍中提到我们有一款“视频录制拓展”。团队全体成员都感到困惑,翻遍产品列表,发现根本不存在该组件。AI那种“一本正经胡说八道”的能力,这次确实让我们陷入尴尬。 按常理,此事到此便可结束——一句“抱歉,暂时没有这个拓
别再混淆OLAP和SQL-on-Hadoop两者查询本质不同
OLAP和SQL-on-Hadoop虽都使用SQL查询数据,但本质不同。SQL-on-Hadoop负责海量数据批量计算与ETL,查询速度秒级至分钟级;OLAP通过预聚合实现毫秒级多维分析,适合BI报表。两者在数据平台分工协作,前者是后厨加工,后者是前台快速服务。
GEO优化深度解析:AI偏好FAQ还是长文内容?
在GEO优化中,AI对内容形式无统一偏好:FAQ在简单查询中引用率41%,长文在复杂查询中达58%。内容应基于用户意图选择形式,FAQ适配简单事实类问题,长文建立主题权威,两者互补而非替代。
- 日榜
- 周榜
- 月榜
相关攻略
2026-07-01 17:42
2026-07-01 17:42
2026-07-01 17:41
2026-07-01 17:41
2026-07-01 17:41
2026-07-01 17:41
2026-07-01 17:41
2026-07-01 17:41
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

