MiniMax M3大模型发布 首创MSA架构百万上下文开源对标海外
2026年6月1日,MiniMax正式发布了新一代大模型M3。此次发布有几个关键亮点:它不仅是国内首个将顶尖代码生成能力、1M超长上下文处理以及原生多模态理解与生成能力深度融合的开源大模型,更明确对标国际一线的闭源旗舰产品,目标直指行业顶尖水平。 先来看M3在底层技术上的核心突破。为了让智能体在复杂
2026年6月1日,MiniMax正式发布了新一代大模型M3。此次发布有几个关键亮点:它不仅是国内首个将顶尖代码生成能力、1M超长上下文处理以及原生多模态理解与生成能力深度融合的开源大模型,更明确对标国际一线的闭源旗舰产品,目标直指行业顶尖水平。

先来看M3在底层技术上的核心突破。为了让智能体在复杂任务中处理更长的上下文,M3专门构建了一套自研的稀疏注意力机制——MSA。该机制通过更精细的KV分块策略和深度算子级优化,在计算效率上实现了跨越式提升。结果非常直观:整体推理速度比主流开源方案提升了4倍以上;在1M超长上下文场景下,单Token的计算开销降到了前代模型的十分之一,预填充和自回归解码阶段分别快了9倍和15倍。

M3之所以能取得如此出色的表现,还得益于原生百亿亿级交错结构化数据的联合训练。这种方式让模型的语义表征达到了高度统一和泛化,反映在基准测试上则是实打实的成绩。在SWE-Bench Pro等权威软件工程和多模态基准测试中,M3的性能已经全面超越了GPT-5.5和Gemini 3.1 Pro。更有意思的是极限任务验证环节的表现:M3不仅连续运行12小时独立复现了ICLR顶会论文的全部实验流程,还在零参考代码的条件下稳定运行了24小时,累计调用外部工具近2000次。它成功将Hopper架构上FP8精度矩阵乘法的硬件利用率从7.6%大幅提升至71.3%,并在开放式PostTrainBench评测中,全程自主完成了“数据准备→模型训练→效果迭代”的闭环优化——完全是独立作战。
和M3一同发布的,还有面向长周期协同开发场景深度定制的MiniMax Code智能体平台,以及高性价比的Token订阅计划和API接入服务。官方承诺在发布后10日内全面开源模型权重。客观来说,M3的发布不仅意味着国内在前沿多模态和超长上下文技术上终于有了自己的扛鼎之作,更重要的是,它以全栈开源的形式,重新定义了国产大模型生态的价值尺度和落地边界。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:MiniMax M3大模型发布 首创MSA架构百万上下文开源对标海外要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点AI的永久记忆能力如同博尔赫斯笔下的富内斯,虽能记住一切却无法思考。这种永不遗忘的功能会固化用户过去的碎片信息,形成静态画像,阻碍自我更新,甚至引发心理问题。失去遗忘权,人类可能被记忆压制,失去呼吸与改变的权利。
成都市发布《关于加快建设全国先进制造业基地的意见》,推动人工智能、低空经济、绿色氢能加速成型成势,提升集成电路、新型显示、航空航天配套能力,加快智能网联汽车、轨道交通、生物医药提能升级,分类施策打造产业新地标。
要让Kimi真正读懂一份长文档,关键一步在于给它一个明确的身份约束。很多人上传行业白皮书、课程讲义或政策文件后,得到的却是“本文讨论了多个方面”这类泛泛而谈的无效总结。问题根源往往就在这里——模型缺乏清晰的身份标识,不知道自己该以谁的视角、用什么标准来判断什么是真正的“重点”。 设定角色是强制聚焦的
Kimi具备联网搜索、图表制作、图片分析、长文生成、长文档处理、PPT生成、常用语及自动编写提示词等八项高阶功能,显著提升工作效率,远超基础聊天用途,全面覆盖办公、创作等场景,是强大的高效智能助手。
- 日榜
- 周榜
- 月榜
热点快看
