小米AI模型永久降价99% 雷军追加600亿投资布局人工智能

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

小米AI模型永久降价99% 雷军追加600亿投资布局人工智能

热心网友时间：2026-05-28

转载

今天，科技行业迎来重磅消息：小米正式宣布对其大模型API定价体系进行永久性调整。官方公告显示，MiMo-V2.5系列API价格最高降幅达到惊人的99%，新价格已于北京时间5月27日0点起全球同步生效。

继DeepSeek之后，小米成为国内又一家宣布大模型API永久降价的科技巨头。然而，一个值得关注的对比是，就在小米向全球开发者提供极具竞争力价格的同时，其最新发布的2026年第一季度财报，却显示出利润大幅下滑、营收承压的局面。

降价力度空前，统一费率、Token额度大幅提升

本次价格调整主要针对MiMo-V2.5和MiMo-V2.5 Pro两个核心版本。最关键的变化在于，新定价取消了按输入长度区分的复杂计费模式，采用统一费率，降价幅度堪称“行业地板价”。

具体来看，MiMo-V2.5 Pro的输入缓存命中价格直接降至0.025元/百万tokens。这是什么概念？相比原价中≤256k规格的1.40元，降幅高达98%；而与256k-1M规格的原价2.80元相比，降幅更是达到99%。输入未命中缓存的定价调整为3.000元/百万tokens，较原价7.00元下降57%，对比长窗口原价14.00元的降幅则为79%。输出定价定为6元/百万tokens，相比原价的21元和42元，分别下降71%与86%。

标准版MiMo-V2.5的降价力度同样显著。其输入缓存命中价格降至0.02元/百万tokens，较原价0.56元和1.12元分别有96%和98%的降幅。输入未命中缓存定价为1.000元/百万tokens，降幅在64%到82%之间。输出定价则定为2元/百万tokens，降幅高达86%至93%。

除了直接的API价格下调，MiMo的Token Plan计费体系也同步升级，实现了“加量不加价”。新的计费规则下，用户获得的使用量提升至原来的5到8倍。官方已公布调整后的详细计费规则。

更令现有用户惊喜的是，所有已订阅代币计划且仍在有效期内的用户，其积分配额已在5月27日0点被完全重置，并直接适用新的、更优惠的计费规则。这项福利覆盖了参与Quadrillion代币创建者激励计划的用户，也包括享受Apache软件基金会独家福利的用户。对于代币计划已过期的历史付费用户，小米也准备了“惊喜礼物”，预计将在下周内公布。

需要留意的是，本次调价核心针对MiMo-V2.5系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策。而更早的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型的API价格则保持不变，其Token Plan套餐也不再参与此次调整并即将下线。这一策略意图明确：引导开发者向性价比更高的V2.5系列迁移。

据了解，主导MiMo-V2.5系列迭代的，是曾任职于DeepSeek的95后AI技术专家罗福莉。目前，MiMo产品矩阵分工清晰：MiMo-V2.5-Pro主打高性能复杂推理，面向企业级智能体开发和深度业务分析等高端商用场景；MiMo-V2.5则聚焦轻量化通用需求，服务中小开发者的日常调用；MiMo-V2.5-TTS以免费策略，全力拓展语音合成赛道的生态入口。

营收利润双双承压，雷军宣布未来三年AI投入600亿

如此力度的降价，底气从何而来？小米将原因归结于技术团队对推理系统的持续优化。官方解释称，通过完全支持基于SGLang HiCache的SWA（滑动窗口注意力）技术，成功将KV缓存在GPU内存、CPU内存和SSD等多级存储之间的数据传输量减少到了优化前的近七分之一，并将可缓存token数量提升到优化前的近五倍，这显著提升了缓存命中率和推理效率。同时，通过优化专家并行方案和输入长度分桶策略，进一步提升了集群的输入吞吐量容量，从而持续降低了每枚token的服务成本。

在公告中，小米强调：“技术的价值最终在于其广泛的使用。让更多人使用更好的模型，这是MiMo坚定不移的使命。”这或许揭示了此次激进降价背后的战略考量。

然而，支撑这份“使命”的，是巨额且持续的投入。根据小米在5月26日晚发布的2026年第一季度财报，本季度其在技术创新领域的研发支出高达90亿元，同比增长33.4%，研发团队规模也扩大至26048人。不过，相比2025年第四季度96亿元的研发开支，本季度减少了6.7%，小米解释这“主要是基于手机xAIoT相关的研发项目进度所致”。

如果把视线从AI研发投入移开，看向整体财报，情况则不容乐观。小米第一季度总收入为991.4亿元，同比下跌10.9%；经调整净利润从106.8亿元大幅回落至60.7亿元，跌幅达43.1%；毛利为218.1亿元，同比下跌14.2%。经营利润的承压更为严重，从去年同期的131.3亿元大跌59.5%至53.1亿元。可以说，营收和利润数据都面临着不小的压力。

即便如此，小米在AI赛道押注的决心似乎毫不动摇。就在财报发布前后，小米创始人雷军公开表示，“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上，已跻身全球开源模型并列第一。”他同时宣布，“小米今年AI投入至少160亿元，未来三年在AI领域计划投入600亿元。”在主营业务承压的背景下，这份持续加码的承诺，显得格外引人注目。

中美AI定价策略分化，海外开发者热议中国模型性价比

小米并非近期唯一降价的大模型厂商。就在不久前，国内的DeepSeek已经率先开启了“永久降价”模式，宣布其DeepSeek-V4-Pro模型API价格在5月31日结束限时优惠后，将永久调整为原定价的四分之一。调价后，其输入缓存命中价格同样为0.025元/百万tokens，实现了75%的降幅。

回顾一下，DeepSeek V4-Pro模型自4月24日上线并开源后，原价仅维持了两天便推出2.5折限时优惠，之后又将优惠期延长。如今直接锁定为原价的四分之一，其调用成本已经低到让业界咋舌，甚至比GPT-5.5便宜了34倍。

这一系列来自中国厂商的降价动作，在海外开发者社区引发了热烈讨论。有海外网友兴奋地表示：“我已经迫不及待想搭建一个大模型集群，用上百个DeepSeek和Mimo模型协同运行。如今真是技术狂飙的时代。”他们算了一笔账：在人工评测榜单上，小米MiMo的得分仅比Opus低3分，但价格却便宜了百倍以上，性能差距微乎其微。即便是DeepSeek V4 Flash（非Pro版），调到高性能档位后，能力基本比肩Claude Opus 4.7，响应速度极快，成本还极低。“连续对话数小时，花费也才几美分。”

也有技术爱好者指出了更深层的行业逻辑：“除了DeepSeek和小米，现在很多AI实验室的缓存读取计费方式可能存在‘陷阱’。如果你为缓存读取支付了高昂费用，实际上可能只是在为几秒钟的显存占用时间买单。自回归语言建模的本质决定了，每一个输出token都会‘读取’缓存。因此，缓存命中的价格下限理论上应该是1个输出token的固定成本。但现实是，缓存占用了宝贵的显存，可能会挤占其他用户的服务资源。”

更广泛的困惑在于中美AI公司截然不同的定价策略。“所有美国公司（OpenAI、Anthropic、Google、MS Copilot）最近都涨价了，而中国公司则在降价。问题是，他们是怎么做到的？”有海外网友发出疑问，“按理说，他们本应因芯片制裁而更吃力才对。其次，为什么是现在？原本人们认为美国公司也会通过补贴来维持竞争力，但现在看来他们已经跟不上了。大家都在转向按使用量计费的模式，这对他们来说似乎不可持续。毕竟他们的资金也很充足。如果真的存在能够降低算力需求的硬件突破，我相信这对全世界来说都是一件好事。”

这股降价潮并非个例。据了解，除小米与DeepSeek外，国内的阿里云通义千问、字节跳动豆包等通用型大模型也已相继下调了API调用价格。

一个直观的反映是全球在线AI托管平台OpenRouter的榜单。今年以来，包括小米MiMo、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi在内的中国大模型持续占据前列。OpenRouter的排名逻辑很直接：在API能力足够用的前提下，调用成本越低，调用总量排名就越高。中国模型的集体“霸榜”，正是其极致性价比策略生效的证明。

“借助中国模型，谁都能用上高性价比的AI服务。”有网友总结道。而另一句评论则更为尖锐，直指当前全球AI竞争的格局：“当前美国AI公司几乎没有机会收回哪怕一小部分估值。”当技术差距被快速抹平，而成本差距却拉大到数十倍时，市场的天平会如何倾斜，答案似乎正在变得清晰。

来源:https://36kr.com/p/3827244866425731

上一篇：微信小游戏百万日活与五千万内免分成政策解析

下一篇：叶国富应向段永平请教企业经营之道