小米大模型API降价99% 紧跟DeepSeek宣布永久免费

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

小米大模型API降价99% 紧跟DeepSeek宣布永久免费

热心网友时间：2026-05-28

转载

图片来源：界面图库

大模型市场的价格战，再次迎来重磅升级。今日，小米技术正式发布公告，宣布对其MiMo-V2.5系列API实施永久性降价，最高降幅达到惊人的99%。此举距离DeepSeek宣布永久降价仅过去不久，标志着围绕API调用成本的“地板价”争夺战已全面进入白热化阶段。

此次调价，小米不仅大幅下调了价格，更对计费规则进行了革新。公司取消了传统定价中依据上下文窗口长度区分的模式，并对Token Plan计费体系进行了优化。这意味着，在同等付费水平下，开发者可使用的Token数量最高可提升至原来的5到8倍，性价比得到跨越式提升。

具体来看降价细节，力度空前。以高性能的MiMo-V2.5-Pro为例，调价后，输入缓存命中的价格仅为0.025元/百万tokens。这一价格极具竞争力：相较于原价中≤256k规格的1.40元，降幅高达98%；若对比原256k-1M长窗口规格的2.80元，降幅更是触及99%。同时，输入未命中缓存和输出的价格也分别实现了57%至86%的显著下调。

标准版MiMo-V2.5的降价力度同样可观。其输入缓存命中价格调整至0.020元/百万tokens，相比原价最高降幅达98%；输入未命中缓存和输出的价格，降幅区间也达到了64%到93%。对于广大中小开发者及初创企业而言，如此低廉的调用成本将极大降低AI应用的开发门槛与试错成本。

值得注意的是，本次调价主要聚焦于MiMo-V2.5核心系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策，而更早发布的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型，其API价格保持不变。同时，旧系列的Token Plan套餐将不再调整并计划下线。这一系列举措意图明确：强力引导开发者生态全面转向更具性价比的V2.5系列。

小米的AI战略布局与人才引擎

MiMo-V2.5系列的快速迭代与市场攻势，离不开其背后的关键掌舵人——罗福莉。这位曾在DeepSeek担任要职的95后AI技术专家，于2025年11月正式加盟小米，出任MiMo大模型业务负责人。她所组建的研发团队平均年龄仅25岁，其中清华、北大毕业生占比超过60%。据市场消息，雷军以千万年薪的诚意，成功将这位年轻的技术领军者招入麾下。

在罗福莉的带领下，小米MiMo大模型实现了快速迭代。今年3月，小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型，随后迅速演进至V2.5进阶版本，全面补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。目前，V2.5系列已成为小米大模型产品矩阵中，面向商用普惠市场的主力军。

如今，小米已构建起层次清晰的MiMo大模型产品矩阵：MiMo-V2.5-Pro主打高性能复杂推理，面向企业级智能体开发、深度业务分析等高阶需求；MiMo-V2.5聚焦轻量化通用任务，服务广大中小开发者；MiMo-V2.5-TTS则以免费策略主攻语音合成赛道，旨在抢占音频生态入口。此外，定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni，共同构成了技术探索的前沿阵地。

就在降价公告发布前夕，小米创始人雷军对外透露，“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上，已取得全球开源模型并列第一的成绩”。他同时宣布，未来三年小米在AI领域的投入计划将高达600亿元。这向市场释放了明确信号：小米已全力押注AI大模型赛道，志在必得。

降价潮背后的行业深层逻辑

小米并非此轮降价潮的发起者。此前，国内大模型头部厂商DeepSeek已率先开启“永久降价”模式，主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后，整体价格将调整为原定价的四分之一。调价后，其输入缓存命中价格同样为0.025元/百万tokens，整体降幅达75%。

DeepSeek-V4于今年4月下旬发布，凭借百万字超长上下文、卓越的Agent能力与推理性能，在国内外开源社区引发广泛关注。其远低于GPT-4o、Claude等国际主流模型的调用成本，通过高性价比策略快速吸引了大量开发者与企业用户，也为小米等厂商的跟进降价提供了现实的市场参照。

事实上，纵观国内大模型市场，一场“K型分化”格局正在形成。一方面，阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格，走“以价换量”的普及路线；另一方面，智谱GLM、腾讯混元等主打企业级深度定制与私有化部署服务的模型，则维持价格稳定甚至略有上浮，坚守“价值溢价”的高端市场。通用模型降价走量，高端模型溢价保值，已成为当前市场的新常态。

这一现象的背后，远非简单的价格竞争所能概括。它标志着整个行业正从初期的营销与规模竞争，转向深层次的技术效率与成本竞争。降价已成为底层算法持续优化、推理技术不断突破、算力成本稳步下行等多重技术红利共同驱动的必然结果。

AI聚合平台AI.cc发布的《2026年AI API基础设施报告》印证了这一趋势。报告显示，过去一年，企业级大模型的Token调用成本同比暴跌67%。同时，开源模型已占据企业Token调用量38%的份额。这些数据清晰地表明：在技术快速普及与商业化落地的关键阶段，性价比已成为决定市场份额与生态繁荣的核心要素。

可以预见，随着技术红利持续释放与规模效应进一步显现，大模型API的调用成本仍有下探空间。这场由头部厂商引领的降价潮，或许只是序幕。对于整个AI生态而言，更低的门槛将催生更广泛的创新与应用，最终推动整个产业迈向普惠与繁荣。

来源:https://36kr.com/p/3827259464585862

上一篇： DuckDuckGo搜索量在谷歌AI功能发布后激增

下一篇：企业级AI Agent选型指南 MCP CLI与Skills定位选择及最佳实践