当前位置: 首页
AI资讯
小米API降价雷军建议这两类用户重点关注

小米API降价雷军建议这两类用户重点关注

热心网友 时间:2026-05-28
转载

5月27日,小米创始人雷军正式宣布,对旗下大模型服务进行重大价格与计费体系调整,在AI开发者社区引发了广泛关注。此次调整聚焦两大核心:MiMo-V2.5系列API价格大幅下调,以及Token Plan计费模式全面优化。这对于从事农业智能化、编程辅助工具开发等各类AI应用构建的开发者而言,意味着显著的成本降低与效率提升,是一个重要的利好消息。


Xiaomi MiMo

具体来看,本次价格调整力度空前。小米MiMo-V2.5系列API实行永久性降价,相较于原始定价,最高降幅达到了惊人的99%。更为关键的是,计费方式得到了极大简化:取消了依据上下文窗口长度进行差异化定价的复杂规则。这使得开发者在进行API调用成本预算时,逻辑更加清晰透明,易于预测。全新的价格体系已于北京时间5月27日0点起在全球范围内同步生效。


另一项核心变革在于Token Plan计费体系。全新的计费规则不仅设计得更加直观易懂,更重要的是,用户实际获得的等效使用量实现了跨越式增长,提升至原先的5到8倍。简而言之,开发者能够以相同的支出,完成数倍于从前的工作量,性价比大幅攀升。

对于现有用户,小米提供了极具诚意的权益保障。官方明确表示,所有当前仍在有效期内的Token Plan订阅用户——无论其原有套餐规格如何,也无论是普通付费用户、“百万亿Token创造者激励计划”参与者,还是Apache软件基金会专属福利用户——其账户内的Credits额度都将在北京时间5月27日0点被统一重置,并立即套用全新的、更优的计费规则进行计算。这相当于为所有忠实用户免费进行了一次大规模的额度升级,直接享受最新优惠。


当然,大幅降价的基础源于坚实的技术突破。此次调价的底气,来自小米技术团队在推理系统性能与效率上的深度优化。通过一系列技术创新“组合拳”,团队成功地将服务每个token的综合成本显著降低。

关键技术进展包括:通过优化存储架构,将KV Cache在GPU显存、CPU内存及SSD等多级存储间的数据调度量压缩至优化前的约七分之一;同时,可缓存的token数量提升至近5倍。此外,借助专家并行方案与输入长度分桶策略的优化,整个计算集群的输入吞吐能力也得到了进一步增强。这些技术改进,最终实现了在严格保障模型响应质量与服务水平的前提下,单位token服务成本的大幅下降,从而将技术红利切实让渡给广大开发者。

因此,本次调整绝非一次短期的市场促销行为。它清晰地昭示了小米AI的战略方向:通过持续不断的技术迭代与工程效能优化,切实降低大模型的接入与应用门槛,使得更多开发团队与企业能够以更经济的成本、更便捷的方式利用先进的AI能力,这才是驱动整个AI开发生态繁荣与创新的根本路径。对于开发者来说,当前正是重新评估项目成本、积极探索更多AI应用场景与商业化可能性的绝佳契机。

来源:https://ai.cnmo.com/news/809859.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Qoder移动端开发环境搭建与手机版支持教程

Qoder移动端开发环境搭建与手机版支持教程

移动端开发环境搭建指南:Qoder手机版实战操作 你是否希望在手机上实时查看Qoder CLI任务进展、远程审批高风险操作,甚至利用通勤时间快速分配新开发任务?许多用户初次使用时,常遇到界面布局错乱、弹窗无响应、扫码失败等问题。究其原因,大多是由于移动端未与本地CLI建立有效连接,或是触控适配层尚未

时间:2026-05-28 16:49
端到端数据验数Agent Skill实现方案详解

端到端数据验数Agent Skill实现方案详解

verify-data是一款端到端数据验证AgentSkill,旨在将传统繁琐的手工验数流程自动化。用户仅需提供研发表名,系统即可自动完成基准表发现、SQL生成与执行、结果分析并生成结构化评审报告。该工具内置10类标准化SQL模板,覆盖全面验证场景,并通过智能决策与降级策略确保结论可靠,显著提升验数效率与质量。

时间:2026-05-28 16:49
精研军力倍增器兴图新科助力中国信息化战争

精研军力倍增器兴图新科助力中国信息化战争

兴图新科深耕军队视频指挥领域,其视频指挥控制系统是C4ISR重要组成部分,曾参与多项重大任务并获国家科技进步一等奖。公司持续高研发投入,正基于云联邦架构研发下一代视频系统,助力国防信息化升级。

时间:2026-05-28 16:48
QoderWake API密钥安全管理:防泄露与盗刷防护建议

QoderWake API密钥安全管理:防泄露与盗刷防护建议

如果您正在使用QoderWake平台调用外部API,那么API密钥的安全管理无疑是您的首要防线。一个疏于防护的密钥,极易成为恶意攻击的突破口——被窃取后用于高频盗刷、跨平台对敲,甚至导出敏感数据。其后果不仅会触发平台风控熔断和账户余额异常消耗,还可能导致账号被永久封禁,业务瞬间瘫痪。 这绝非危言耸听

时间:2026-05-28 16:47
RAG越用越慢的原因及反向调优方法

RAG越用越慢的原因及反向调优方法

RAG系统随数据量增长性能下降,根源在于向量索引膨胀、检索策略低效、上下文冗余、缓存失效及基础设施限制。通过动态Top-K调整、分层检索、索引量化压缩、智能上下文选择及多层次缓存等反向调优策略,可在不牺牲准确率的前提下提升响应速度,并需持续监控迭代。

时间:2026-05-28 16:47
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程