面包屑图标 当前位置: 首页
AI资讯
热点详情

MiniMax-01开源大模型 新架构开启Agent时代

AI热点日报
AI热点日报时间:2026-06-29
热点解读

全新模型架构,性能比肩 GPT-4o 此次发布的 MiniMax-01 系列,在技术路线上做出了一项重大突破:首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿,每次推理时激活的参数量为 459 亿。综合性能方面,它已能

全新模型架构,性能比肩 GPT-4o

此次发布的 MiniMax-01 系列,在技术路线上做出了一项重大突破:首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿,每次推理时激活的参数量为 459 亿。综合性能方面,它已能与海外顶尖模型正面竞争,并且能够高效处理全球最长的 400 万 token 上下文窗口,这一长度是 GPT-4o 的 32 倍,是 Claude-3.5-Sonnet 的 20 倍。

MiniMax-01开源:新架构开启Agent时代

超长上下文,开启 Agent 时代

2025 年将成为智能体(Agent)高速发展的关键年份。无论是单 Agent 系统所需的持续记忆能力,还是多 Agent 系统之间频繁的交互通信,都对上下文长度提出了越来越高的要求。MiniMax-01 率先迈出了关键一步,其架构将持续为构建复杂 Agent 所需的基础能力奠定坚实基础。

极致性价比,创新的底气

架构创新、效率优化、集群训推一体化设计,加之内部大量并发的算力复用,使得 MiniMax 能够以业内最低的价格区间提供文本与多模态理解 API。标准定价为:输入 token 1 元/百万 token,输出 token 8 元/百万 token。

开源与评测

MiniMax-01 系列模型已在 GitHub 上完全开源,后续还将持续迭代更新。基于业界主流文本及多模态理解评测标准,结果如下图所示——在大多数任务上,它已达到与海外公认最先进的两个模型 GPT-4o-1120 和 Claude-3.5-Sonnet-1022 持平的水平。

在长文本任务方面,对比的是此前长上下文能力最强的 Google Gemini。如图(c)所示,随着输入长度持续增加,MiniMax-Text-01 成为性能衰减最慢的模型,明显优于 Google Gemini

得益于架构创新,该模型在处理长输入时效率极高,计算复杂度接近线性。与其他全球顶尖模型的对比情况如下:

在架构设计上,每 8 层中有 7 层采用了基于 Lightning Attention 的线性注意力机制,仅保留 1 层传统 SoftMax 注意力。这不仅是业内首次将线性注意力机制扩展至商用级别,同时在 Scaling Law、与 MoE 的结合、结构设计、训练优化以及推理优化等方面均进行了系统性考量。由于是首次实现如此大规模的线性注意力模型,几乎重构了全部训练与推理系统——包括更高效的 MoE All-to-all 通讯优化、更长序列的处理优化,以及推理层面线性注意力的高效 Kernel 实现。

在绝大多数学术评测集上,MiniMax-01 均取得了比肩海外第一梯队的成绩:

在长上下文评测集上,表现显著领先:

在 400 万 token 的 Needle-In-A-Haystack(大海捞针)检索任务上,结果全绿:

除学术数据集外,团队还构建了一个基于真实数据的助手场景测试集。在该场景中,MiniMax-Text-01 的表现明显优于竞品,具体对比如下:

在多模态理解测试集中,MiniMax-VL-01 同样保持了较为领先的地位:

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:MiniMax-01开源大模型 新架构开启Agent时代要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.53ai.com/news/OpenSourceLLM/2025011507365.html
ai 人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-03 20:42
AI驱动的员工英语口语教练Lucida

LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。

AI热点2026-07-03 20:42
Screenshot2Code:截图转代码工具

Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。

AI热点2026-07-03 20:42
SpeakStruct 语音转结构化数据 可自定义模板

SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。

AI热点2026-07-03 20:41
AI驱动语音治疗应用 IzzyAI

IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。

延伸阅读