当前位置: 首页
科技数码
小米罗福莉揭秘AI竞争核心:算力与数据如何塑造大模型未来

小米罗福莉揭秘AI竞争核心:算力与数据如何塑造大模型未来

热心网友 时间:2025-12-18
转载

12月17日,小米召开了2025年人车家全生态合作伙伴大会。然而实际上,聚光灯几乎都聚焦在了其中一位演讲者——Xiaomi Mimo大模型负责人罗福莉身上。

自从离开DeepSeek、低调加入小米后,这位被行业誉为“AI天才少女”的罗福莉,首次代表小米大模型团队公开亮相。而大会开始前不久,小米发布并开源了全新MoE大模型MiMo-V2-Flash,这构成了罗福莉此次演讲的核心内容。

罗福莉在开场时指出,下一代智能体系统的核心将围绕Agent执行与Omni(全能)感知展开,涵盖记忆、推理、自主规划、决策、执行等多个维度。AI应当从回答问题走向完成任务,并且应当统一多模态感知,为理解物理世界打下基础。

她由此表示,MiMo-V2-Flash在研发之初,主要围绕三个关键问题展开。

第一,当代智能体必须具备高效的沟通语言,即代码能力和工具调用能力;第二,“高带宽”是Agent协作的关键,因此需要围绕极致推理效率设计模型结构;第三,模型训练范式正逐步从预训练转向后训练,为了激发后训练的更多潜能,需要高效稳定的扩展强化学习训练。

\

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,总参数量309B,激活参数量15B,支持256k上下文窗口,整体针对推理、编码和Agent场景构建,支持混合思维模式,允许用户切换“思考”和即时回答模式。

在基准测试中,MiMo-V2-Flash的表现整体接近DeepSeek-V3.2,在SWE-Bench Verified/Multiligual、GPQA-Diamond等测试中略胜一筹,仅在HLE(人类最后的考试)以及Arena-Hard(创意写作评估)两项测试中不及后者。此外,该模型在AIME2025能力上接近GPT-5和Gemini 3.0 Pro。

作为首发成果,同时也是小米未来可能全面落地各个业务场景的智能体模型底座,罗福莉用了大量篇幅重点讲述MiMo-V2-Flash的性价比优势及其技术缘由。

目前,MiMo-V2-Flash推理吞吐速度为每秒150个token,定价0.7元/每百万输入token,2.1元/每百万输出token。

在一张价格与速度构成的坐标轴图标中,MiMo-V2-Flash的速度与Gemini-2.5 Pro齐平,但价格是其约二十分之一;其价格是DeepSeek V3.2的约一半,但速度是后者的近3倍。

这样的推理效率主要来自两项创新。其一是模型注意力机制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例是5:1。

罗福莉指出,相较于一些复杂的Linear Attention(线性注意力机制),SWA在兼顾长短文的推理、知识检索等方面更胜一筹。

一名AI大模型行业从业者对记者表示,SWA本质上是一种Sparse Attention(稀疏注意力机制),业界普遍利用它解决长上下文的推理效率问题,其最大优势是可以将KV Cache保持在一个固定最大值,而不会随着上下文扩大而无限增长,从而实现降本增效的目的。

他指出,这种机制核心要考虑的问题是在长文本任务中受到窗口策略限制可能表现不佳,这也是SWA会与Full Attention进行混合配比的原因之一。

MiMo-V2-Flash另一项重要创新在于MTP(Multi-Token Prediction)。罗福莉表示,团队在训练时加入了一层MTP层以提高基座模型能力,并在微调时也加入了更多MTP层,最终在推理时加入了3层MTP,以加速并行token验证的方式实现了2-2.6倍推理速度的提升。

此外,为了提高强化学习训练的稳定性,MiMo团队提出了一种叫做Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。相比较于传统SFT+RL(微调+强化学习)的后训练方式,它可以提供稠密的token level监督学习信号,以简单快速的方式获得各个专家模型的能力。

“我们还发现一个很意外的事情,当学生很快超越老师的时候,我们能不能把老师替换成学生继续自我迭代提升,这是一个正在进行中的工作。”罗福莉预告称。

\

从这场演讲可以看出的是,罗福莉在小米大模型团队不仅仅要担任一个科学家角色,她需要真正带领小米做出能够落地其人车家全生态产品的AI基座模型及应用能力——在汽车、手机、大家电、智能穿戴等硬件产品线全面开始跨越自己的阶段性门槛后,AI能力是小米撑起下一个十年技术叙事的核心底座。

罗福莉也几乎没有谈论自己,唯一涉及团队构成的表述是,一个“小而美,却充满创业精神极度好奇、追求真理”的年轻团队。此外,她认为在大模型的能力竞争中,算力和数据也并非最终的护城河,“而是科学的研究文化与方法,是将未知问题结合模型优势转化可用产品的能力”。

此外,在大会上,小米集团合伙人、集团总裁卢伟冰披露了小米“人车家全生态”的最新进展:用户规模方面,小米全球月活跃用户数达到7.42亿;硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家;软件生态方面,小米全球开发者规模达到120万,国内应用生态每月应用分发量突破11亿。

来源:https://www.jiemian.com/article/13773777.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
小米SU7双版本上市:GT版性能强劲,标准版性价比高,Model Y迎来新对手

小米SU7双版本上市:GT版性能强劲,标准版性价比高,Model Y迎来新对手

小米发布YU7系列两款车型,标准版23 35万元起主打高性价比,续航643公里;高性能GT版38 99万元起,拥有超千匹马力和赛道级底盘配置。两者形成“GT版立标杆、标准版抢市场”的双线策略,旨在同时提升品牌形象与冲击主流市场份额。

时间:2026-05-23 14:20
五菱星光L等六款SUV新车五月集中上市亮点解析

五菱星光L等六款SUV新车五月集中上市亮点解析

5月下旬多款SUV集中上市。问界M9优化细节提升科技感;蔚来ES9以超大尺寸与智能座舱定位旗舰;五菱星光L主打家用高性价比;猛士M817硬派外观侧重内在升级;途观LePro作为合资车型配置丰富;吉利牛仔则具越野风格。新车覆盖不同价位与动力类型,其中新能源车型占显著比例,反映市场转型趋势。

时间:2026-05-23 14:20
雷军称内存价格将持续上涨 小米手机承压建议尽早换机

雷军称内存价格将持续上涨 小米手机承压建议尽早换机

小米17Max起售价4799元,较前代上涨。雷军表示内存价格将持续上涨两年,建议消费者尽早换机。成本压力下,小米已对部分机型调价,同时通过内部优化和研发投入消化成本。新机涨价与旧款降价并行,体现了企业在成本传导与市场竞争力间的平衡策略。

时间:2026-05-23 14:20
三星 Galaxy Z Fold8 折叠屏手机钢化膜实物曝光

三星 Galaxy Z Fold8 折叠屏手机钢化膜实物曝光

知名爆料博主曝光了三星GalaxyZFold8Wide折叠手机的钢化膜照片,展示了新机可能的外屏轮廓。结合示意图生成的渲染图直观呈现了大致形态,但最终真机边框不会如渲染图般极致窄,且屏幕将保留前置摄像头挖孔。

时间:2026-05-23 14:20
2026年第一季度手机排行榜:iPhone持续领先,行业价值竞争成主流

2026年第一季度手机排行榜:iPhone持续领先,行业价值竞争成主流

2026年第一季度全球最畅销十款手机出货量占比达四分之一,创季度新高,行业加速向价值化转型。iPhone17系列包揽前三,标准版因关键配置升级而热销。安卓阵营中,三星多款A系列机型凭借新兴市场需求进入前十。高端市场韧性凸显,厂商需从“以量取胜”转向“以价值取胜”。

时间:2026-05-23 13:48
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程