小米API降价雷军建议这两类用户重点关注
5月27日,小米创始人雷军正式宣布,对旗下大模型服务进行重大价格与计费体系调整,在AI开发者社区引发了广泛关注。此次调整聚焦两大核心:MiMo-V2.5系列API价格大幅下调,以及Token Plan计费模式全面优化。这对于从事农业智能化、编程辅助工具开发等各类AI应用构建的开发者而言,意味着显著的成本降低与效率提升,是一个重要的利好消息。

Xiaomi MiMo
具体来看,本次价格调整力度空前。小米MiMo-V2.5系列API实行永久性降价,相较于原始定价,最高降幅达到了惊人的99%。更为关键的是,计费方式得到了极大简化:取消了依据上下文窗口长度进行差异化定价的复杂规则。这使得开发者在进行API调用成本预算时,逻辑更加清晰透明,易于预测。全新的价格体系已于北京时间5月27日0点起在全球范围内同步生效。

另一项核心变革在于Token Plan计费体系。全新的计费规则不仅设计得更加直观易懂,更重要的是,用户实际获得的等效使用量实现了跨越式增长,提升至原先的5到8倍。简而言之,开发者能够以相同的支出,完成数倍于从前的工作量,性价比大幅攀升。
对于现有用户,小米提供了极具诚意的权益保障。官方明确表示,所有当前仍在有效期内的Token Plan订阅用户——无论其原有套餐规格如何,也无论是普通付费用户、“百万亿Token创造者激励计划”参与者,还是Apache软件基金会专属福利用户——其账户内的Credits额度都将在北京时间5月27日0点被统一重置,并立即套用全新的、更优的计费规则进行计算。这相当于为所有忠实用户免费进行了一次大规模的额度升级,直接享受最新优惠。

当然,大幅降价的基础源于坚实的技术突破。此次调价的底气,来自小米技术团队在推理系统性能与效率上的深度优化。通过一系列技术创新“组合拳”,团队成功地将服务每个token的综合成本显著降低。
关键技术进展包括:通过优化存储架构,将KV Cache在GPU显存、CPU内存及SSD等多级存储间的数据调度量压缩至优化前的约七分之一;同时,可缓存的token数量提升至近5倍。此外,借助专家并行方案与输入长度分桶策略的优化,整个计算集群的输入吞吐能力也得到了进一步增强。这些技术改进,最终实现了在严格保障模型响应质量与服务水平的前提下,单位token服务成本的大幅下降,从而将技术红利切实让渡给广大开发者。
因此,本次调整绝非一次短期的市场促销行为。它清晰地昭示了小米AI的战略方向:通过持续不断的技术迭代与工程效能优化,切实降低大模型的接入与应用门槛,使得更多开发团队与企业能够以更经济的成本、更便捷的方式利用先进的AI能力,这才是驱动整个AI开发生态繁荣与创新的根本路径。对于开发者来说,当前正是重新评估项目成本、积极探索更多AI应用场景与商业化可能性的绝佳契机。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Qoder移动端开发环境搭建与手机版支持教程
移动端开发环境搭建指南:Qoder手机版实战操作 你是否希望在手机上实时查看Qoder CLI任务进展、远程审批高风险操作,甚至利用通勤时间快速分配新开发任务?许多用户初次使用时,常遇到界面布局错乱、弹窗无响应、扫码失败等问题。究其原因,大多是由于移动端未与本地CLI建立有效连接,或是触控适配层尚未
端到端数据验数Agent Skill实现方案详解
verify-data是一款端到端数据验证AgentSkill,旨在将传统繁琐的手工验数流程自动化。用户仅需提供研发表名,系统即可自动完成基准表发现、SQL生成与执行、结果分析并生成结构化评审报告。该工具内置10类标准化SQL模板,覆盖全面验证场景,并通过智能决策与降级策略确保结论可靠,显著提升验数效率与质量。
精研军力倍增器兴图新科助力中国信息化战争
兴图新科深耕军队视频指挥领域,其视频指挥控制系统是C4ISR重要组成部分,曾参与多项重大任务并获国家科技进步一等奖。公司持续高研发投入,正基于云联邦架构研发下一代视频系统,助力国防信息化升级。
QoderWake API密钥安全管理:防泄露与盗刷防护建议
如果您正在使用QoderWake平台调用外部API,那么API密钥的安全管理无疑是您的首要防线。一个疏于防护的密钥,极易成为恶意攻击的突破口——被窃取后用于高频盗刷、跨平台对敲,甚至导出敏感数据。其后果不仅会触发平台风控熔断和账户余额异常消耗,还可能导致账号被永久封禁,业务瞬间瘫痪。 这绝非危言耸听
RAG越用越慢的原因及反向调优方法
RAG系统随数据量增长性能下降,根源在于向量索引膨胀、检索策略低效、上下文冗余、缓存失效及基础设施限制。通过动态Top-K调整、分层检索、索引量化压缩、智能上下文选择及多层次缓存等反向调优策略,可在不牺牲准确率的前提下提升响应速度,并需持续监控迭代。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

