当前位置: 首页
科技数码
又一家美国科技巨头悄然转向中国大模型

又一家美国科技巨头悄然转向中国大模型

热心网友 时间:2026-07-01
转载

一个显著的行业趋势正在显现:越来越多的美国科技企业,正在将中国开源AI模型部署到其生产基础设施中。

背后的深层原因并不复杂——顶级美国模型的API调用成本持续上涨,迫使企业在按需付费的灵活性、模型性能与压缩AI账单的成本压力之间,找到最佳平衡点。中国开源模型恰好在这一成本与性能的交叉点上,提供了极具吸引力的替代方案。

最典型的案例来自美国加密货币交易平台Coinbase。其CEO Brian Armstrong近日在社交平台X上分享,公司已通过内部LLM网关,将智谱GLM 5.2和月之暗面Kimi K2.7设定为全体工程师的默认大模型。


尽管Armstrong未透露具体节省金额,但他指出,在Token使用量保持指数级增长的同时,通过更换默认模型、实施智能路由策略以及强化缓存机制,Coinbase的AI相关支出已压缩近一半。他强调,这套成本优化方案任何企业均可复制。关键在于,公司91%的工程师此前从未触及用量上限,因此此次优化并非削减员工配额,而是将代码审查、文档摘要等常规任务的默认模型,从Anthropic、OpenAI的顶尖模型,切换为两款中国开源权重模型。

下面具体了解这两款模型的核心实力。

GLM 5.2是智谱AI于6月12日发布,并随后以MIT协议开放权重的旗舰模型。在业界公认的第三方基准测试平台Artificial Analysis上,它取得了当前开源权重模型中的最高分,稳居全球第一梯队。更具体地说,GLM 5.2在SWE-bench Pro这类高难度工程评测中,性能甚至超越了OpenAI的GPT-5.5;而在FrontierSWE等更具挑战性的任务里,也已逼近Anthropic的旗舰模型Opus 4.8。能够在一系列高强度工程任务中与闭源前沿模型正面竞争,而调用价格仅为Opus 4.8的几分之一——这才是其核心吸引力所在。

月之暗面的Kimi大模型同样在海外市场不断巩固其地位。今年3月,美国AI编程工具Cursor(近期被马斯克以600亿美元收购)被曝其自研模型Composer 2“借鉴”了Kimi K2.5的架构。该公司的年度经常性收入(ARR)从3月的约1亿美元快速攀升至4月的2亿美元以上,海外API收入自去年11月以来增长了约四倍。资本市场迅速反应,月之暗面的估值在半年内从43亿美元飙升至200亿美元。Coinbase此次默认调用的Kimi K2.7 Code,正是Kimi于6月12日发布的最新代码模型。

Coinbase的案例绝非孤例。在美国企业AI开支普遍面临失控的背景下,转向中国开源模型已成为一条明确的降本增效路径。去年,Airbnb已将其客服模型从GPT替换为千问(Qwen);近期,美国AI公司Lindy更是将模型从Anthropic Claude迁移至DeepSeek V4,而在此之前,其AI支出已超过员工工资总额。Snowflake的CEO曾算过一笔账,认为GLM 5.2完全能够以显著更低的价格,实现与Claude相当的性能表现。

数据同样印证了这一趋势。美中经济与安全审查委员会今年3月的一份报告估计,约80%的美国AI初创公司正在使用中国开源模型。在OpenRouter平台上,中国模型的Token市场份额已从一年前的不足2%,猛增至今年4月的40%以上。阿里巴巴千问(Qwen)系列的累计下载量在今年1月已突破7亿,在Hugging Face上的累计下载量已超越Meta的Llama,成为全球下载量最高的开源模型家族之一。

在OpenRouter的调用排行榜上,来自中国的DeepSeek、小米MiMo、MiniMax、腾讯混元、智谱GLM等模型,长期稳定占据第一梯队位置。


值得特别关注的是,这一切发生在中美围绕AI领域持续摩擦的大背景下。智谱AI早在2025年1月就被美国商务部以“助力中国军事现代化”为由列入实体清单,成为首家上榜的中国大模型公司;月之暗面则于今年2月被Anthropic公开点名,被指与DeepSeek、MiniMax一同通过虚假账号“蒸馏”Claude。今年6月,Anthropic又指控阿里巴巴的Qwen团队实施了规模更大的蒸馏行为。针对数据安全与国家安全等合规问题,Coinbase的解释是:已将开源权重下载至自有服务器进行自托管运行,代码和查询请求不会流向位于中国的API接口。

企业将工程负载默认切换至中国开源模型这一趋势,正对西方前沿厂商的定价策略形成直接压力。Anthropic已于6月1日向美国证监会秘密递交IPO招股书,其接近万亿的市场估值核心,依赖于企业付费金额的快速增长。而如果企业大规模地将日常负载迁移至更便宜的中国开源模型,外界很可能将此视为其增长故事中需要面对的核心风险。

高盛预测,全球Token消耗量到2030年可能将增长至目前的24倍。在OpenAI、Anthropic等美国闭源厂商定价持续高企的情况下,如果单Token成本无法下降,企业的账单压力只会进一步加剧。更何况,GPT 5.6与Claude Fable 5的封禁风波,使得模型的可获得性本身也成了企业必须审慎评估的风险因素。当性能已进入第一梯队的国产模型,与更低的价格同时呈现在企业面前时,摆在它们面前的选择就不再是意识形态问题,而是越来越具体且紧迫的成本控制、性能需求与部署控制权问题。一旦价格差距拉开,所谓的技术忠诚度,就会变得相当脆弱了。

来源:https://www.163.com/dy/article/L0K298MB051481US.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
宇树验证具身智能新趋势核心战场不止于模型

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

时间:2026-07-01 12:20
智元精灵G2机器人产线直播完成64828件成功率99.99%

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

时间:2026-07-01 12:20
纯电动Cayenne首秀保时捷驾驶中心全国路演

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

时间:2026-07-01 12:20
AI工具能否成为高价志愿咨询纠纷的破局之道

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

时间:2026-07-01 12:19
头部企业全产业链布局锂电池回收循环

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持

时间:2026-07-01 12:19
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全