当前位置: 首页
科技数码
Token成本优势:中国AI模型以极致性价比挑战美国巨头

Token成本优势:中国AI模型以极致性价比挑战美国巨头

热心网友 时间:2026-03-28
转载



越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“Token出海”现象。

一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus 4.6编程,发现“好用但贵”,单日Token(词元,模型输入与输出基本单位)消耗数千万个,每日成本动辄上百美元。这名开发者转而拥抱中国大模型公司MiniMax的M2.5开源模型,干活性能相当,Token消耗所产生的费用却仅为美国头部模型的十七分之一。碾压级的性价比,催生高频调用。

此非个案,而是风潮。全球AI模型聚合平台‌OpenRouter是见证者。该平台允许开发者通过单一API(应用程序接口)访问全球超300款主流大模型,无需再为每个模型单独注册或适配接口。数据显示,近一个月来,在中美大模型API调用量的较量中,中国模型更胜一筹,调用量第一、第二和第四均为中国模型,分别为MiniMax M2.5、阶跃星辰Step 3.5 Flash,以及DeepSeek V3.2。另外,平台前十模型的Token总消耗量的60%以上来自中国模型。



OpenRouter数据显示,近一个月来,在中美大模型API调用量的较量中,中国模型更胜一筹。

这意味着,全球开发者更喜欢调用中国大模型,愿意为调用所消耗的Token付费。大模型推理所需算力、电力均在中国完成,却创新实现了“Token出海”这一数字服务贸易形式。

这其中,我国低成本电力无疑是核心优势之一。利用乌兰察布、宁夏等地可再生能源丰富及气候优势,我国实行“东数西算”,绿电价格较美国电价低50%到70%,从而降低了数据中心运营成本。字节、阿里等大厂均在中西部地区布局数据中心。


腾讯贵州贵安七星数据中心。

但“Token出海”的更硬核辅助,在于中国大模型的技术实力,以及硬件厂商的高质量算力。

MiniMax多次登顶OpenRouter调用量第一,创始人闫俊杰本月中在2026上海全球投资促进大会开幕式上透露,MiniMax致力于AI普惠,早在“龙虾”大火前就定下目标:复杂Agent(智能体)运行1小时,成本1美元。


闫俊杰在2026上海全球投资促进大会开幕式上。

MiniMax的M2.5的确做到了。在编程最硬核的SWE-Bench Verified榜单上,M2.5拿到80.2%的高分,几乎逼平Claude Opus 4.6。但M2.5的推理速度是主流模型的约两倍,输入、输出价分别为0.3美元/百万Token、2.4美元/百万Token。也就是说,这个大模型不仅脑子好使,还不卡顿,更有极致性价比。

具体来看,其一,MiniMax率先投入资源,研究MoE架构,于2024年初上线国内首个基于MoE架构的大模型。此架构将模型分成多个专家子网络,视情动态激活,以节省计算开销。其二,在模型传统注意力机制中,Token长度与算力消耗呈平方关系。MiniMax成为全球首家敢于投时间、人力、算力资源,去验证“线性注意力机制”可行性、并最终用于大规模商业化部署的模型厂商,已实现Token长度增加后算力消耗的线性增长。其三,M2.5早在RL(强化学习)阶段,就引入MiniMax自研的Forge架构,从而绕过Agent场景下逻辑断裂、训练效率受重复前缀拖累两大痛点。

可见,中国模型实现能力、速度、价格之间的平衡,均基于颠覆式创新。

国内芯片企业同样励志,正全力适配自主创新大模型的研发。据记者了解,国内某头部模型厂商与国内自主芯片企业的合作算力已达数千卡规模,海外芯片正逐渐让位于国内芯片。国产GPU在易用性与成本上的综合优势,对于日均Token调用量上亿乃至十几亿的头部大模型而言,是其商业竞争力的关键因子。

据悉,这一波“Token出海”,寒武纪、昆仑芯、天数智芯等技术领先的芯片企业已率先实现适配及应用。如阶跃星辰Step 3.5 Flash等多款模型的推理和训练微调,均在天数智芯的通用GPU集群上完成,天数智芯加速卡还为多家AI企业大模型研发提供算力资源支撑。


天数智芯今年初在港交所上市。

在天数智芯副总裁宋煜看来,“Token出海”浪潮下,算电协同下的高质量算力,成为助力中国大模型持续提升全球竞争力的关键力量。他认为,评判高质量算力,有高效率、可预期、可持续三大维度。

高效率,指在真实训练和推理场景中,将电力、带宽、显存和互联尽可能转化为有效吞吐;可预期,指在大规模集群、复杂业务负载和功率约束下,算力性能、时延和稳定性能被准确评估并持续兑现。如天数智芯有业内独家的IX-SIMU全栈软件仿真系统,可在集群部署前仿真模拟实际运行效果,从而避免盲动,减少“上线后发现不行”的风险;可持续,则指芯片不只跑今天的算法,还能持续向“后”兼容。当前大模型几乎“三月一迭”,算力芯片须尽力适配,保障客户在采购后能支撑后续新模型的运行。

大模型推理,产出的是代码、分析、翻译和创意,是一种更深层的嵌入。一旦开发者对模型形成习惯,其切换成本会随时间积累而越筑越高。此番Token高质量出海,大幕刚刚拉开。

原标题:《中国“Token出海”,极致性价比碾压美国模型,不止是电价便宜》

来源:作者:解放日报 李晔

来源:https://www.163.com/dy/article/KP3BHL7D055040N3.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
雷军反思小米SU7战略布局 五款车型角逐30万纯电市场

雷军反思小米SU7战略布局 五款车型角逐30万纯电市场

30万元以上高端纯电动汽车市场,始终是各大车企的核心战场。乘联会最新数据显示,虽然2026年第一季度该细分市场增速略有放缓,但其高客单价、强用户忠诚度以及显著的品牌溢价潜力,依然吸引着特斯拉、理想、蔚来等新势力品牌,以及传统豪华车企持续投入资源,竞争态势日趋白热化。 小米汽车将战略重心锁定在这一区间

时间:2026-05-23 07:39
雷军推出小米SU7标准版售价直降两万市场反响如何

雷军推出小米SU7标准版售价直降两万市场反响如何

在备受瞩目的小米汽车新品发布会上,预热已久的“入门款”车型YU7终于揭开了神秘面纱。值得注意的是,雷军特别强调,这款新车并非外界猜测的“青春版”或“低配版”,而是被正式定名为“标准版”。与此同时,原先的“标准版”车型则升级更名为“长续航版”。这一巧妙的命名调整,清晰地划分了产品序列的定位与差异。 那

时间:2026-05-23 07:38
具身智能企业出海四大路径解析

具身智能企业出海四大路径解析

中国机器人出口增长迅速,但多数仍用于科研文娱。行业正转向工厂等真实场景,强调量产与稳定交付。企业出海呈现产品渗透、场景落地、生态卡位和部件嵌入四大路径,核心是从硬件销售转向可持续的产业闭环。竞争焦点已从技术叙事转向实际交付能力与商业化验证。

时间:2026-05-23 07:37
太平洋航运遭股东减持30.1万股 股价影响分析

太平洋航运遭股东减持30.1万股 股价影响分析

5月19日,股东HeltKristian以每股约3 33港元减持太平洋航运30 1万股,涉资约100万港元。减持后其持股数量降至1318 3万股,持股比例相应下降。

时间:2026-05-23 07:06
荣耀上市计划持续推进 内部开放员工减持通道

荣耀上市计划持续推进 内部开放员工减持通道

荣耀召开内部会否认上市终止,但未给出新时间表。公司为员工开放减持通道,退股方案预计三个月内落实。此前上市辅导验收节点已过,相关机构未发布完成公告。分析指出,存储芯片价格上涨、手机盈利持续性及AI领域表现等因素构成其上市的现实压力。

时间:2026-05-23 06:33
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程