当前位置: 首页
科技数码
小米MiMo V2 Flash架构解析:低成本高性能,媲美开源头部模型

小米MiMo V2 Flash架构解析:低成本高性能,媲美开源头部模型

热心网友 时间:2025-12-17
转载

小米近日正式发布并开源了全新大模型MiMo-V2-Flash。该模型拥有3090亿总参数与150亿活跃参数的规模配置,在核心评测中其性能表现已能和DeepSeek-V3.2、Kimi-K2等头部开源模型展开有力竞争。更关键的是,它采用业内领先的专家混合架构(MoE),并凭借架构层面的突破性创新,将推理速度大幅提升至每秒钟150个token,同时把输入成本压缩到每百万token仅需0.1美元,输出成本降至0.3美元,在性价比维度树立了新的行业标杆。

在权威基准测试中,MiMo-V2-Flash展现了多维度领先优势。它在AIME 2025数学竞赛与GPQA-Diamond科学知识测试中均位列开源模型前两名;其编程能力尤为出色,在SWE-bench Verified测试中获得73.4%的高分,超越了所有开源竞品,甚至逼近GPT-5-High的水平。这项测试要求AI模型真实修复软件代码缺陷,73.4%的成功率意味着它已具备解决大部分实际编程问题的能力。在多语言编程测试SWE-Bench Multilingual中,模型更以71.7%的解决率,进一步验证了其跨语言编程开发的强大实力。

针对智能体任务的测试数据显示,该模型在τ²-Bench分类任务评测中表现亮眼:通信类得分95.3、零售类79.5、航空类66.0。在BrowseComp搜索代理基准测试中,基础得分为45.4,而在启用上下文长期记忆功能后,得分跃升至58.3。这些成绩表明MiMo-V2-Flash不仅能处理代码生成等单一任务,更能理解复杂业务逻辑并执行多轮智能体交互。值得关注的是,其文本生成质量也已接近顶级闭源模型,具备了成为全能型日常助手的潜力。

支撑模型实现性能突破的,是两项核心技术。其一为混合滑动窗口注意力机制:它通过5层滑动窗口(每层128 token)与1层全局注意力的交替创新设计,使KV缓存的存储消耗降低了近6倍,同时成功维持了256k的超长上下文处理能力。其二为轻量级多Token预测模块:该模块能并行生成2.8至3.6个token,从而将推理速度提升2到2.6倍,并在训练阶段实现了采样效率的同步优化。研究团队特别指出,经过大量实验验证,128 token的窗口大小被证实是性能与效率之间的“最佳甜点”,盲目扩大窗口反而会导致整体性能下降。

在训练效率方面,模型采用FP8混合精度技术,在2.7万亿token的数据集上完成了预训练,并原生支持32k序列长度。后续训练阶段创新性地提出了“多教师在线策略蒸馏”方法,通过学生模型自主采样、多专家教师实时反馈的机制,仅需传统方法1/50的计算资源即可达到同等性能峰值。该框架还支持动态接入新的教师模型,由此形成“教学相长”的闭环进化系统。

针对开发者应用场景,MiMo-V2-Flash提供256k上下文窗口,可稳定支持数百轮智能体交互与工具调用,并能与Claude Code、Cursor等主流开发环境无缝兼容。技术团队基于真实的GitHub issue构建了超过10万个验证任务,并通过Kubernetes集群实现了10000+并发Pod部署,环境部署的成功率达到了70%。在网页开发任务中引入的多模态验证器,通过视频录制替代静态截图来验证代码执行结果,有效减少了因视觉幻觉导致的问题。

目前,小米已将完整模型细节、推理代码及基础权重,通过MIT许可协议在Hugging Face平台开源,并在LMSYS博客分享了详细的优化经验。该模型现已在API Platform开放限时免费调用,开发者可直接接入体验。

来源:https://www.itbear.com.cn/html/2025-12/1056555.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Nuu B40 5G手机发布 搭载天玑7025芯片与1.6英寸背屏

Nuu B40 5G手机发布 搭载天玑7025芯片与1.6英寸背屏

NuuB405G手机全球发布,配备1 6英寸AMOLED背屏与天玑7025芯片。背屏可显示通知、充当后置自拍取景器。正面为6 7英寸120Hz曲面屏,后置6400万像素主摄。手机搭载8GB+256GB存储,内置5000mAh电池,支持33W快充,运行Android15系统,售价约249 99美元。

时间:2026-05-23 21:42
倪飞回应豆包订餐厅被拒 手机App预约功能缺失问题解析

倪飞回应豆包订餐厅被拒 手机App预约功能缺失问题解析

用户通过豆包App预约餐厅被拒,店员称不支持该方式。豆包客服解释平台暂无实际预约功能,无法代传信息。倪飞回应称,独立App可能不支持预约,但集成豆包手机助手的“豆包手机”可实现该功能。演示显示手机能理解语音指令并直接调用服务完成预约,体现了“指令直达服务终点”的能力,有望简化操。

时间:2026-05-23 21:42
上海科技节开幕聚焦好问题 探索科学创新源头

上海科技节开幕聚焦好问题 探索科学创新源头

2026年上海科技节以“科技让生活更美好”为主题,开启为期一周的全民科技嘉年华。开幕式“智境红毯”汇聚院士、科研先锋与少年英才,展现科创活力。科学家强调培育科学精神与好奇心,并分享前沿成果。全市推出近2000场活动,开放大科学设施与科普基地,促进科技与公众深度互动,并通过“好问题开放麦。

时间:2026-05-23 21:42
联想 IdeaPad Slim 3i 17 英寸笔记本发布 搭载英特尔 Wildcat Lake 平台

联想 IdeaPad Slim 3i 17 英寸笔记本发布 搭载英特尔 Wildcat Lake 平台

联想在海外推出IdeaPadSlim3i17IWC11笔记本,配备17 3英寸1080P屏幕,主打大屏办公与影音娱乐。其提供酷睿5或酷睿7处理器选项,支持用户自行升级内存至32GB及存储至1TB。接口齐全,包含USB-C、HDMI等,电池续航宣称最长超18小时。该产品定价在不同市场有所差异,定位为实用型大屏办公本。

时间:2026-05-23 21:42
Epic诉苹果藐视法庭裁决 苹果提请最高法院复审

Epic诉苹果藐视法庭裁决 苹果提请最高法院复审

苹果就与Epic的反垄断诉讼向最高法院提出请求,核心争议在于法院是否应依据禁令“精神”认定苹果藐视法庭,以及禁令适用范围是否过宽。苹果援引判例称禁令应仅限Epic。此前法院认定苹果通过设置外部支付限制规避2021年禁令构成藐视,上诉法院维持认定但指出苹果有权收取合理费用,案件或发。

时间:2026-05-23 21:42
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程