面包屑图标 当前位置: 首页
AI资讯
热点详情

MiniMax模型从M2到M3迭代历程与进化亮点盘点

AI热点日报
AI热点日报时间:2026-06-07
热点解读

MiniMax从M2 5的稀疏架构与200K上下文出发,经M2 7实现模型自主训练闭环,再到M3重写架构,融合百万级上下文、原生多模态与顶尖Agent能力,并实现基础设施层自主调优,显著提升计算效率与任务表现。

如果你只想快速看清MiniMax从M2系列到M3的完整进化脉络,而不是被一堆“性能提升X%”的泛泛之谈淹没,那么这篇文章正好能帮你抓住每次迭代中真正改变能力边界的硬核动作——比如M2.7首次把模型自身塞进训练闭环,M3则直接让模型接管CUDA内核调优。先别急着跳到结论,咱们一步步拆开看。

从M2到M3:MiniMax模型迭代历程与进化亮点【盘点】

M2系列:从高性能通用走向Agent原生

MiniMax的M2系列发端于2025年12月,以M2.5为起点,在短短5个月内完成三代跃迁。核心目标非常明确:为Agent场景打好地基。具体怎么打的?三句话就能说清。

第一步:M2.5确立MoE稀疏架构与200K上下文。激活参数仅100亿,总参2300亿,首次在国产模型中实现了“小激活、大容量”的漂亮平衡。说白了,就是让模型在推理时只唤醒少数专家,既省算力又不牺牲表现。

第二步:M2.7(2026年3月18日发布)引入了全球首个将模型深度融入自身训练循环的机制。这可是个标志性动作——模型能自主完成“分析→修改→评测→优化”的完整闭环,人类只需要设定好目标,中间过程完全不用插手。从设计哲学上看,这已经跳出了“训完就跑”的老路子。

第三步:M2.7专为OpenClaw(龙虾)生态优化。工具调用响应延迟降低了42%,多智能体协作任务失败率从M2.5的19.7%猛降至6.3%。这个数字意味着什么?Agent之间的协作可靠性已经接近可商用水平。

M3:三大能力合一,定义Frontier三件套

M3不是M2的简单升级,而是架构级别的重写。它同时拿下了三项此前仅被GPT-5.5、Claude Opus 4.7、Gemini 3.1垄断的能力:百万级上下文、原生多模态、顶尖Agentic能力。三项合在一起,才算真正挤进了Frontier模型的门槛。

方法一:用MSA稀疏注意力替代全注意力。这是计算效率的质变:100万token上下文,单token计算量仅为M2的1/20,预填充加速超过9倍,解码加速超过15倍。也就是说,长上下文不再是沉重负担,反而成了轻量化操作。

方法二:多模态从预训练第一轮就混入图文视频数据。不再像以前那样把视觉模块当外设拼接,而是从一开始就让模型理解多模态信号。训练数据规模推到了100T+,结果OmniDocBench得分直接超越了Gemini 3.1 Pro。

方法三:Agent能力实测中,M3在Claw-Eval端到端评测中排名第一。更令人印象深刻的案例是:它能连续24小时自主优化CUDA内核,愣是把Hopper GPU上FP8矩阵乘法的硬件峰值利用率从7.6%拽到71.3%。这个数字几乎意味着,模型在替工程师写底层代码。

关键进化节点对比

M2.7的自我进化还停留在模型层闭环:给它一套数学题集,它能自己生成新题、筛选难度、重排训练顺序。本质上还是在“模型参数”的圈子里打转。

M3则直接冲破了这个边界,进入基础设施层自主调优。它不只改模型权重,还主动调用nvcc、nsys、cuobjdump等底层工具——一共调用了1959次,重写Triton kernel代码,最终提交了147版benchmark。整个过程没有人类介入,纯靠模型自己折腾。

在PostTrainBench测试中,M3用12小时无人干预训练出4个新模型,覆盖数学推理、代码生成等五项基础能力,得分0.37,仅次于Opus 4.7(0.42)和GPT-5.5(0.39)。虽然还没登顶,但考虑到这是国产模型第一次实现“基础设施层自主调优”,意义已经远远超出分数本身。

回头看整条进化路:从M2.5的稀疏架构筑基,到M2.7的训练闭环破局,再到M3的架构重写与底层自主调优——每一步都在重新定义“模型能做什么”的边界。而这条边界,显然还在快速外推。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:MiniMax模型从M2到M3迭代历程与进化亮点盘点要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.php.cn/faq/2604683.html?uid=1503042
MiniMax

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-01 10:26
一加16首发京东方极窄直屏边框缩至1毫米内

一加16旗舰手机即将发布,其最大亮点在于首发搭载京东方定制的超窄直屏,边框宽度成功控制在1毫米以内,堪称同档最窄。该屏幕采用6 78英寸1 5K分辨率设计,刷新率高达185Hz。为实现这一效果,手机应用了全新的LIPO封装工艺,在提升视觉沉浸感的同时也增强了结构强度。性能方面,一加16将首批搭载高通

AI热点2026-07-01 10:25
现代i20 N Shadow Edition官图发布 限量100台配置升级

现代汽车正式发布了i20NShadowEdition的官方图片,新车将在澳大利亚市场限量发售100台。作为特别版车型,其在外观上配备了专属运动套件、18英寸哑光青铜锻造轮圈以及红黑专属拉花,内饰则升级了Alcantara材质方向盘与挡杆,并镶嵌独立编号铭牌。动力方面,新车延续了1 6T发动机与

AI热点2026-07-01 10:25
中国移动任命陈扬帆为执行董事兼首席执行官2026年6月生效

中国移动近日通过港交所发布公告,宣布任命陈扬帆为公司执行董事兼首席执行官,并担任可持续发展委员会委员。该任命自2026年6月16日起生效。此项决定由公司提名委员会提议,并经董事会审议批准,预示着公司高层管理团队将迎来新的核心领导者。新任CEO将全面负责公司的运营管理与战略执行,其进入可持续发展委员会

AI热点2026-07-01 10:25
合百集团回应投资长鑫科技:间接持股比例低无业务往来

合百集团近日在互动平台回应市场关切,澄清其与长鑫科技的投资关系。公司表示,仅通过基金间接持有长鑫科技较低比例的股份,投资金额较小,因此无法对后者的决策产生影响。同时,合百集团明确指出,截至目前,双方不存在任何业务往来,保持了经营上的独立性。此次回应旨在厘清外界可能存在的误解,强调了两家公司之间有限的

延伸阅读