当前位置: 首页
业界动态
小米AI模型永久降价99% 雷军追加600亿投资布局人工智能

小米AI模型永久降价99% 雷军追加600亿投资布局人工智能

热心网友 时间:2026-05-28
转载

今天,科技行业迎来重磅消息:小米正式宣布对其大模型API定价体系进行永久性调整。官方公告显示,MiMo-V2.5系列API价格最高降幅达到惊人的99%,新价格已于北京时间5月27日0点起全球同步生效。

继DeepSeek之后,小米成为国内又一家宣布大模型API永久降价的科技巨头。然而,一个值得关注的对比是,就在小米向全球开发者提供极具竞争力价格的同时,其最新发布的2026年第一季度财报,却显示出利润大幅下滑、营收承压的局面。

降价力度空前,统一费率、Token额度大幅提升

本次价格调整主要针对MiMo-V2.5和MiMo-V2.5 Pro两个核心版本。最关键的变化在于,新定价取消了按输入长度区分的复杂计费模式,采用统一费率,降价幅度堪称“行业地板价”。

具体来看,MiMo-V2.5 Pro的输入缓存命中价格直接降至0.025元/百万tokens。这是什么概念?相比原价中≤256k规格的1.40元,降幅高达98%;而与256k-1M规格的原价2.80元相比,降幅更是达到99%。输入未命中缓存的定价调整为3.000元/百万tokens,较原价7.00元下降57%,对比长窗口原价14.00元的降幅则为79%。输出定价定为6元/百万tokens,相比原价的21元和42元,分别下降71%与86%。

标准版MiMo-V2.5的降价力度同样显著。其输入缓存命中价格降至0.02元/百万tokens,较原价0.56元和1.12元分别有96%和98%的降幅。输入未命中缓存定价为1.000元/百万tokens,降幅在64%到82%之间。输出定价则定为2元/百万tokens,降幅高达86%至93%。

除了直接的API价格下调,MiMo的Token Plan计费体系也同步升级,实现了“加量不加价”。新的计费规则下,用户获得的使用量提升至原来的5到8倍。官方已公布调整后的详细计费规则。

更令现有用户惊喜的是,所有已订阅代币计划且仍在有效期内的用户,其积分配额已在5月27日0点被完全重置,并直接适用新的、更优惠的计费规则。这项福利覆盖了参与Quadrillion代币创建者激励计划的用户,也包括享受Apache软件基金会独家福利的用户。对于代币计划已过期的历史付费用户,小米也准备了“惊喜礼物”,预计将在下周内公布。

需要留意的是,本次调价核心针对MiMo-V2.5系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策。而更早的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型的API价格则保持不变,其Token Plan套餐也不再参与此次调整并即将下线。这一策略意图明确:引导开发者向性价比更高的V2.5系列迁移。

据了解,主导MiMo-V2.5系列迭代的,是曾任职于DeepSeek的95后AI技术专家罗福莉。目前,MiMo产品矩阵分工清晰:MiMo-V2.5-Pro主打高性能复杂推理,面向企业级智能体开发和深度业务分析等高端商用场景;MiMo-V2.5则聚焦轻量化通用需求,服务中小开发者的日常调用;MiMo-V2.5-TTS以免费策略,全力拓展语音合成赛道的生态入口。

营收利润双双承压,雷军宣布未来三年AI投入600亿

如此力度的降价,底气从何而来?小米将原因归结于技术团队对推理系统的持续优化。官方解释称,通过完全支持基于SGLang HiCache的SWA(滑动窗口注意力)技术,成功将KV缓存在GPU内存、CPU内存和SSD等多级存储之间的数据传输量减少到了优化前的近七分之一,并将可缓存token数量提升到优化前的近五倍,这显著提升了缓存命中率和推理效率。同时,通过优化专家并行方案和输入长度分桶策略,进一步提升了集群的输入吞吐量容量,从而持续降低了每枚token的服务成本。

在公告中,小米强调:“技术的价值最终在于其广泛的使用。让更多人使用更好的模型,这是MiMo坚定不移的使命。”这或许揭示了此次激进降价背后的战略考量。

然而,支撑这份“使命”的,是巨额且持续的投入。根据小米在5月26日晚发布的2026年第一季度财报,本季度其在技术创新领域的研发支出高达90亿元,同比增长33.4%,研发团队规模也扩大至26048人。不过,相比2025年第四季度96亿元的研发开支,本季度减少了6.7%,小米解释这“主要是基于手机xAIoT相关的研发项目进度所致”。

如果把视线从AI研发投入移开,看向整体财报,情况则不容乐观。小米第一季度总收入为991.4亿元,同比下跌10.9%;经调整净利润从106.8亿元大幅回落至60.7亿元,跌幅达43.1%;毛利为218.1亿元,同比下跌14.2%。经营利润的承压更为严重,从去年同期的131.3亿元大跌59.5%至53.1亿元。可以说,营收和利润数据都面临着不小的压力。

即便如此,小米在AI赛道押注的决心似乎毫不动摇。就在财报发布前后,小米创始人雷军公开表示,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上,已跻身全球开源模型并列第一。”他同时宣布,“小米今年AI投入至少160亿元,未来三年在AI领域计划投入600亿元。”在主营业务承压的背景下,这份持续加码的承诺,显得格外引人注目。

中美AI定价策略分化,海外开发者热议中国模型性价比

小米并非近期唯一降价的大模型厂商。就在不久前,国内的DeepSeek已经率先开启了“永久降价”模式,宣布其DeepSeek-V4-Pro模型API价格在5月31日结束限时优惠后,将永久调整为原定价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,实现了75%的降幅。

回顾一下,DeepSeek V4-Pro模型自4月24日上线并开源后,原价仅维持了两天便推出2.5折限时优惠,之后又将优惠期延长。如今直接锁定为原价的四分之一,其调用成本已经低到让业界咋舌,甚至比GPT-5.5便宜了34倍。

这一系列来自中国厂商的降价动作,在海外开发者社区引发了热烈讨论。有海外网友兴奋地表示:“我已经迫不及待想搭建一个大模型集群,用上百个DeepSeek和Mimo模型协同运行。如今真是技术狂飙的时代。”他们算了一笔账:在人工评测榜单上,小米MiMo的得分仅比Opus低3分,但价格却便宜了百倍以上,性能差距微乎其微。即便是DeepSeek V4 Flash(非Pro版),调到高性能档位后,能力基本比肩Claude Opus 4.7,响应速度极快,成本还极低。“连续对话数小时,花费也才几美分。”

也有技术爱好者指出了更深层的行业逻辑:“除了DeepSeek和小米,现在很多AI实验室的缓存读取计费方式可能存在‘陷阱’。如果你为缓存读取支付了高昂费用,实际上可能只是在为几秒钟的显存占用时间买单。自回归语言建模的本质决定了,每一个输出token都会‘读取’缓存。因此,缓存命中的价格下限理论上应该是1个输出token的固定成本。但现实是,缓存占用了宝贵的显存,可能会挤占其他用户的服务资源。”

更广泛的困惑在于中美AI公司截然不同的定价策略。“所有美国公司(OpenAI、Anthropic、Google、MS Copilot)最近都涨价了,而中国公司则在降价。问题是,他们是怎么做到的?”有海外网友发出疑问,“按理说,他们本应因芯片制裁而更吃力才对。其次,为什么是现在?原本人们认为美国公司也会通过补贴来维持竞争力,但现在看来他们已经跟不上了。大家都在转向按使用量计费的模式,这对他们来说似乎不可持续。毕竟他们的资金也很充足。如果真的存在能够降低算力需求的硬件突破,我相信这对全世界来说都是一件好事。”

这股降价潮并非个例。据了解,除小米与DeepSeek外,国内的阿里云通义千问、字节跳动豆包等通用型大模型也已相继下调了API调用价格。

一个直观的反映是全球在线AI托管平台OpenRouter的榜单。今年以来,包括小米MiMo、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi在内的中国大模型持续占据前列。OpenRouter的排名逻辑很直接:在API能力足够用的前提下,调用成本越低,调用总量排名就越高。中国模型的集体“霸榜”,正是其极致性价比策略生效的证明。

“借助中国模型,谁都能用上高性价比的AI服务。”有网友总结道。而另一句评论则更为尖锐,直指当前全球AI竞争的格局:“当前美国AI公司几乎没有机会收回哪怕一小部分估值。”当技术差距被快速抹平,而成本差距却拉大到数十倍时,市场的天平会如何倾斜,答案似乎正在变得清晰。

来源:https://36kr.com/p/3827244866425731

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
小红书获2026世界杯免费转播权 手机电脑投屏皆可观看

小红书获2026世界杯免费转播权 手机电脑投屏皆可观看

2024年5月28日,一则重磅消息引爆了体育圈与互联网行业:生活方式平台小红书正式官宣,已成功获得2026年美加墨世界杯的持权转播商身份,并成为中央广播电视总台(CMG)的顶级赛事直播战略合作伙伴。 这一合作意味着什么?根据官方发布的权威信息,除总台自有平台及已获授权的中国移动咪咕外,小红书是唯一一

时间:2026-05-28 09:51
360智语Agent平台布局企业级AI智能体应用效能评估规范

360智语Agent平台布局企业级AI智能体应用效能评估规范

最近,一场关于《企业级AI智能体应用效能评估规范》的团体标准研讨会在北京召开。会议的核心议题很明确:直面当前AI智能体在企业落地过程中的种种难题,围绕标准制定、效能如何评估、行业怎么用、安全合规怎么保障这些关键点,展开了一场深入的讨论。360数智化集团的首席解决方案架构师李方翔在会上做了主题分享,不

时间:2026-05-28 09:50
千问AI眼镜线上零售额占比超30% 稳居市场首位

千问AI眼镜线上零售额占比超30% 稳居市场首位

千问AI眼镜全系列线上零售额份额达30 4%,稳居市场第一。其新品G1与S1上市仅两月,份额即达19 4%,展现强劲爆发力。当前智能眼镜市场竞争激烈,品牌众多,行业正从尝鲜转向普及。千问S1近期通过升级提升服务与显示能力,进一步扩大市场优势。

时间:2026-05-28 09:49
微星PRO MAX 80主机搭配34寸QD-OLED显示器台北电脑展首发

微星PRO MAX 80主机搭配34寸QD-OLED显示器台北电脑展首发

微星再次以创新思维引领市场风向,此次将战略重心聚焦于现代办公场景,正式宣布扩充其PRO MAX系列产品矩阵。值得关注的是,一款全新设计的PRO MAX 80系列紧凑型商务台式机,以及一款PRO MAX 341QPXW14G专业显示器,已确认将于2026年台北国际电脑展(COMPUTEX Taipei

时间:2026-05-28 09:48
刺客信条黑旗重制版2026年7月发售 首次支持全中文配音

刺客信条黑旗重制版2026年7月发售 首次支持全中文配音

育碧于2026年5月27日正式发布的宣传片,为全球玩家揭晓了重磅消息。《刺客信条:黑旗 记忆重置》不仅公布了确切的发售日期,更宣布将提供全程专业中文配音,这无疑是中国玩家社区期待已久的突破。 这一举措意义深远。自2007年系列首作问世以来,这将是首部拥有全剧情中文配音的正统《刺客信条》作品。对于广大

时间:2026-05-28 09:47
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程