当前位置: 首页
AI资讯
Hy3大模型为何在OpenRouter排行榜上遥遥领先

Hy3大模型为何在OpenRouter排行榜上遥遥领先

热心网友 时间:2026-05-27
转载

最近大模型发布节奏快得让人眼花缭乱,这时候,一个能通过统一API调用多数主流模型的平台就显得格外有用。OpenRouter正是这样的服务商。作为用户与各大模型API之间的桥梁,它积累了海量、极具代表性的用户使用数据。难得的是,OpenRouter选择将这些数据公之于众,在其“AI模型排行榜”页面上实时更新——这与各大模型实验室通常将此类数据视为竞争机密而秘而不宣的做法,形成了鲜明对比。最近浏览这个排行榜时,一个奇怪的现象引起了我的注意。

数据获取于2026年5月25日。

两个新模型在令牌使用量上,竟然超过了曾经的宠儿Claude,而且领先幅度超过50%?DeepSeek Flash V4我有所耳闻,这是深度求索公司的开源模型,不仅速度快、价格低,性能也接近头部模型,性价比极高,它的流行并不意外。但“Hy3 preview”又是什么来头?此前从未听说过Hy3,也没见任何人讨论过它。简单搜索后发现,这是中国巨头腾讯发布的一款开源模型。然而,它在Hugging Face上的模型页面信息寥寥,甚至包含了一些对其不利的、略显“实诚”的基准测试结果,显示其表现逊于其他中国开源模型。

来自腾讯Hugging Face仓库的Hy3代码能力基准测试结果。

在Hacker News上搜索Hy3,只找到一条不相关的提交;Reddit上的讨论也更多集中在“开源权重”本身。倒是有一条5月6日的Reddit帖子提到了Hy3的崛起,但当时OpenRouter提供的是免费端点。如今免费通道已关闭,这意味着当前排行榜上Hy3的使用量,全部来自付费用户。

看起来,Hy3 preview的流行并不仅限于智能体编码领域。

数据获取于2026年5月25日。

难道我错过了什么重要信息?经过一些非严格的测试,这个模型的质量确实如基准测试所示,与提及的其他中国模型处于同一梯队,与Claude Opus 4.7或GPT 5.5等模型尚有差距。它并非一颗被埋没的“魔法钻石”,那么其流行背后必然另有原因。好在OpenRouter的数据或许能帮助我们缩小解释的范围,但仔细查看数据后,疑惑反而更深了。

在OpenRouter API上,Hy3 preview的标称输入价格为每百万令牌0.066美元,这确实比当前排名第一的DeepSeek V4 Flash(标价0.10美元/百万令牌)更便宜。考虑到LLM和编码智能体成本急剧上升,一个更便宜的模型如果质量相近,自然会胜出——但问题恰恰在于,Hy3 preview的质量似乎并未达到同等水平。

这是OpenRouter模型页面上显示的Hy3 preview使用量随时间变化的图表:

图表显示,Hy3 preview在5月8日之前没有任何使用数据,这很可能就是该模型从免费SKU切换到付费SKU的时间点。自那以后,使用量保持稳定,而本文引用的初始排名数据是在切换几周后统计的,这表明其使用量至少是有机增长(或者伪造成本极高),而非一次性异常值。值得注意的是,如果计算一下图中数据,会发现LLM API调用的输入令牌与输出令牌比例,在聚合层面上达到了惊人的98%比2%

回顾OpenRouter AI模型排行榜的历史,特定应用突然切换默认模型曾导致使用量飙升,例如2025年9月Kilo Code免费提供Grok Code Fast 1时。但这种情况似乎不适用于Hy3,因为应用仅占其活动量的极小部分。

排名前五的应用贡献了Hy3 preview总活动量的不到1%。

OpenRouter的核心价值之一是能够自动将API请求路由到不同的供应商。对于DeepSeek V4 Flash这类开源模型,OpenRouter列出了13个供应商,但同为开源权重的Hy3 preview却只有一个供应商1——总部位于新加坡的SiliconFlow。OpenRouter上SiliconFlow的使用量页面显示,在Hy3出现之前,其使用量一直很低。

绿色区域对应免费Hy3使用量,蓝色区域对应付费Hy3使用量:OpenRouter在鼠标悬停时未作区分,这疑似一个显示Bug。

巧合的是,该数据可视化显示,当Hy3 preview从免费转为付费时,使用量并未急剧下降,这本身就是一个有趣的现象:如果用户无法从免费模型中获取价值,一旦开始收费,他们很可能会停止使用。

我到底遗漏了什么?是不是我想多了,答案其实很简单,就是“因为它最便宜”,并且从免费期获得了足够的“亏本引流”效应?

……但Hy3 preview真的是OpenRouter上由大公司支持的最便宜的LLM吗?为了核实一些假设,我发现OpenRouter的数据显示,事实并非如此:性能良好的LLM中最便宜的其实是DeepSeek V4 Flash,只不过这里有些有趣的细节。

2026年的LLM经济学

这里需要先补充几个关于LLM API工作原理、却不常被讨论的要点。LLM调用目前仍然是无状态的,这意味着每一轮对话(包括用户向LLM提问的消息)后,当前会话线程中的所有令牌都会被重新处理。对于智能体应用来说,输入令牌的数量会随着每条后续消息累积增加,这也是为什么当上下文填满时,频繁开启新会话线程被鼓励用于高效智能体使用的原因之一。

使用DeepSeek V4 Flash的Zed Agent在一分钟内的OpenRouter日志(反向时序)。

其实,早在智能体工作流出现之前,处理大型输入(如完整PDF)就已经会类似地膨胀上下文。因此,大多数LLM提供商实施了提示词缓存技术,复用对话中较早处理的输入令牌。这是一个双赢策略:既为LLM提供商节省了时间与算力,也将节省的成本传递给了客户。大多数LLM提供商会自动缓存输入,包括通过OpenRouter访问时也是如此:成本旁边的磁盘闪电符号就表示令牌已被缓存。当然,缓存并非总能命中,特别是在OpenRouter在线程中途切换供应商时。 Anthropic(Claude)API是个特例,它需要先付费购买缓存写入权限。

通常,缓存读取成本是输入成本的10%。OpenAI API、Anthropic API和Google Gemini API的最新模型都是如此。对于提供DeepSeek V4 Flash的13家供应商,缓存读取成本在输入成本的20%到50%之间,这可以理解,因为它们可能不具备同等的规模经济效应。然而,有一家DeepSeek V4 Flash供应商例外:

缓存读取成本只有2%!(乘以2,小数点左移两位)DeepSeek的缓存读取价格为何如此之低?从V4开始,DeepSeek采用了一种新的KV缓存方法。作为模型的创造者,它最有条件充分利用自身的技术创新,正如前文所说,这种好处最终惠及了客户。当由DeepSeek自身提供服务时,其DeepSeek V4 Pro变体模型的缓存读取成本更是低至0.83%!(这个数字最好用计算器验证一下)

还记得前面提到,现在LLM API成本的98%都来自输入令牌,而这些输入令牌又被积极地缓存吗?这意味着LLM的“标称”价格现在具有误导性,不过这种误导对客户有利,因为实际有效价格会便宜得多!为了消除这种模糊性,OpenRouter现在在模型页面上提供了一个有效价格表,其中考虑了缓存命中带来的成本节省。以下是DeepSeek V4 Flash通过OpenRouter各供应商的有效定价(因缓存读取成本和命中率不同而各异):

数据获取于2026年5月25日;这些值每小时更新。

价格参差不齐,但请注意第二行,由DeepSeek自身作为供应商时,其输入价格高达每百万令牌0.018美元!那2%的缓存读取成本确实带来了巨大优势。与Hy3 preview进行同类比较,其模型页面显示,来自SiliconFlow(缓存读取成本高达44%)的有效价格为每百万令牌0.034美元,几乎是DeepSeek自身提供的DeepSeek V4 Flash价格的两倍!当然,这仅适用于明确使用DeepSeek作为供应商的情况,而一些下游的OpenRouter客户端/智能体可能不支持此选项。不过,OpenRouter上的价格与直接从DeepSeek获取的价格一致,因此使用直接的DeepSeek API密钥效果相同。

此外,房间里还有一头“大象”:DeepSeek是一家中国公司,部分用户可能不愿意——或者法律上不允许——将他们的支付处理信息或LLM输入数据提供给一家在其OpenRouter数据政策信息中将提示词训练设为true的中国公司,这是一个合理的顾虑。

诚然,如果你能持续用尽使用限额,像Claude Code和Codex这类订阅制LLM服务仍然是性价比最高的选择。但通过API使用超级便宜的DeepSeek V4 Flash,不会将你锁定在订阅制中。如果你需要额外的智能体算力来完成一个项目,它比订阅服务支付超额费用更划算。2 至少,在2026年袋里式AI竞争白热化之际,它构成了对潜在额外定价策略的一种微观经济制衡。

总的来说,我仍然无法完全理解Hy3 preview在OpenRouter上流行的原因。根据现有的数据和分析,我的猜测是,可能有一个与腾讯无关的大型独立应用,将Hy3用作其数据处理后端,而且这个应用并非纯粹的智能体编码应用。不过,OpenRouter的优势之一就是切换模型和供应商的成本极低。因此,一旦人们意识到DeepSeek V4 Flash的定价优势,它在几周内使用量激增,我也不会感到意外。

  1. Hy3的许可证限制非常严格,这可能会阻碍其他供应商采用该模型。↩︎

  2. DeepSeek刚刚也宣布了其基于V4 Flash的编码智能体平台,声称利用了其强大的缓存技术,但其输入成本为50%,缓存读取成本则显著更高,为20%,因此尚不清楚其经济性是否真的比使用DeepSeek API密钥搭配其他智能体更优。↩︎

来源:https://www.bestblogs.dev/article/f06308da?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
朗玛信息股价下跌3.16%后市走势分析及投资机会探讨

朗玛信息股价下跌3.16%后市走势分析及投资机会探讨

今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市

时间:2026-05-27 23:00
Kimi联网搜索排除干扰技巧 精准限定提示词方法

Kimi联网搜索排除干扰技巧 精准限定提示词方法

在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,

时间:2026-05-27 23:00
Qoder编辑器自动保存功能设置与基础配置教程

Qoder编辑器自动保存功能设置与基础配置教程

为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。

时间:2026-05-27 22:58
人工智能驱动外贸增长 机器人出海成新趋势

人工智能驱动外贸增长 机器人出海成新趋势

当前,全球人工智能产业浪潮澎湃,这股技术变革之风不仅深刻重塑着全球产业格局,也正为中国外贸增长注入全新的动力。一个清晰可见的趋势是,以算力服务、智能硬件为代表的“高含智量”产品与服务,已成为国际出口市场上的新焦点与增长点。 在广东汕头,一项名为“来数加工”的创新政策试点,正成功地将无形的计算能力转化

时间:2026-05-27 22:56
Nocera成立控股公司融资3亿美元 加速布局AI与数据中心市场

Nocera成立控股公司融资3亿美元 加速布局AI与数据中心市场

科技产业的竞争格局正迎来新一轮深刻变革。近日,纳斯达克上市公司Nocera, Inc (股票代码:NCRA)正式宣布启动一项全面的企业转型与品牌升级计划。其核心举措是成立全新的控股实体——Nocera控股公司,旨在系统性地布局人工智能、AI基础设施、数据中心、机器人技术、生物科技以及区块链与数字资产

时间:2026-05-27 22:56
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程