小米大模型API降价99% 紧跟DeepSeek宣布永久免费

图片来源:界面图库
大模型市场的价格战,再次迎来重磅升级。今日,小米技术正式发布公告,宣布对其MiMo-V2.5系列API实施永久性降价,最高降幅达到惊人的99%。此举距离DeepSeek宣布永久降价仅过去不久,标志着围绕API调用成本的“地板价”争夺战已全面进入白热化阶段。
此次调价,小米不仅大幅下调了价格,更对计费规则进行了革新。公司取消了传统定价中依据上下文窗口长度区分的模式,并对Token Plan计费体系进行了优化。这意味着,在同等付费水平下,开发者可使用的Token数量最高可提升至原来的5到8倍,性价比得到跨越式提升。
具体来看降价细节,力度空前。以高性能的MiMo-V2.5-Pro为例,调价后,输入缓存命中的价格仅为0.025元/百万tokens。这一价格极具竞争力:相较于原价中≤256k规格的1.40元,降幅高达98%;若对比原256k-1M长窗口规格的2.80元,降幅更是触及99%。同时,输入未命中缓存和输出的价格也分别实现了57%至86%的显著下调。

标准版MiMo-V2.5的降价力度同样可观。其输入缓存命中价格调整至0.020元/百万tokens,相比原价最高降幅达98%;输入未命中缓存和输出的价格,降幅区间也达到了64%到93%。对于广大中小开发者及初创企业而言,如此低廉的调用成本将极大降低AI应用的开发门槛与试错成本。
值得注意的是,本次调价主要聚焦于MiMo-V2.5核心系列。MiMo-V2.5-TTS系列仍维持限时免费接入政策,而更早发布的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型,其API价格保持不变。同时,旧系列的Token Plan套餐将不再调整并计划下线。这一系列举措意图明确:强力引导开发者生态全面转向更具性价比的V2.5系列。
小米的AI战略布局与人才引擎
MiMo-V2.5系列的快速迭代与市场攻势,离不开其背后的关键掌舵人——罗福莉。这位曾在DeepSeek担任要职的95后AI技术专家,于2025年11月正式加盟小米,出任MiMo大模型业务负责人。她所组建的研发团队平均年龄仅25岁,其中清华、北大毕业生占比超过60%。据市场消息,雷军以千万年薪的诚意,成功将这位年轻的技术领军者招入麾下。
在罗福莉的带领下,小米MiMo大模型实现了快速迭代。今年3月,小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后迅速演进至V2.5进阶版本,全面补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。目前,V2.5系列已成为小米大模型产品矩阵中,面向商用普惠市场的主力军。
如今,小米已构建起层次清晰的MiMo大模型产品矩阵:MiMo-V2.5-Pro主打高性能复杂推理,面向企业级智能体开发、深度业务分析等高阶需求;MiMo-V2.5聚焦轻量化通用任务,服务广大中小开发者;MiMo-V2.5-TTS则以免费策略主攻语音合成赛道,旨在抢占音频生态入口。此外,定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni,共同构成了技术探索的前沿阵地。
就在降价公告发布前夕,小米创始人雷军对外透露,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数与Agent指数上,已取得全球开源模型并列第一的成绩”。他同时宣布,未来三年小米在AI领域的投入计划将高达600亿元。这向市场释放了明确信号:小米已全力押注AI大模型赛道,志在必得。
降价潮背后的行业深层逻辑
小米并非此轮降价潮的发起者。此前,国内大模型头部厂商DeepSeek已率先开启“永久降价”模式,主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后,整体价格将调整为原定价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,整体降幅达75%。
DeepSeek-V4于今年4月下旬发布,凭借百万字超长上下文、卓越的Agent能力与推理性能,在国内外开源社区引发广泛关注。其远低于GPT-4o、Claude等国际主流模型的调用成本,通过高性价比策略快速吸引了大量开发者与企业用户,也为小米等厂商的跟进降价提供了现实的市场参照。
事实上,纵观国内大模型市场,一场“K型分化”格局正在形成。一方面,阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格,走“以价换量”的普及路线;另一方面,智谱GLM、腾讯混元等主打企业级深度定制与私有化部署服务的模型,则维持价格稳定甚至略有上浮,坚守“价值溢价”的高端市场。通用模型降价走量,高端模型溢价保值,已成为当前市场的新常态。
这一现象的背后,远非简单的价格竞争所能概括。它标志着整个行业正从初期的营销与规模竞争,转向深层次的技术效率与成本竞争。降价已成为底层算法持续优化、推理技术不断突破、算力成本稳步下行等多重技术红利共同驱动的必然结果。
AI聚合平台AI.cc发布的《2026年AI API基础设施报告》印证了这一趋势。报告显示,过去一年,企业级大模型的Token调用成本同比暴跌67%。同时,开源模型已占据企业Token调用量38%的份额。这些数据清晰地表明:在技术快速普及与商业化落地的关键阶段,性价比已成为决定市场份额与生态繁荣的核心要素。
可以预见,随着技术红利持续释放与规模效应进一步显现,大模型API的调用成本仍有下探空间。这场由头部厂商引领的降价潮,或许只是序幕。对于整个AI生态而言,更低的门槛将催生更广泛的创新与应用,最终推动整个产业迈向普惠与繁荣。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
修Bug被Gemini追删代码致宕机修复报告现编
最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修
Notion AI运营指南:自动归纳用户反馈
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
AI给出的答案为何总不符期望?原因解析
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4
2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解
如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

