当前位置: 首页
科技数码
MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

热心网友 时间:2026-02-14
转载

2月13日,MiniMax正式加入国产大模型春节档的“上新”阵营。其最新发布的M2.5模型显著提升了智能体任务处理速度,在性能上媲美海外头部模型,而调用价格却远低于同级产品。

最新数据显示,M2.5优化了模型对复杂任务的拆解能力和思考过程中的token消耗,相较上一版本M2.1完成任务的速度提升了37%,从平均31.3分钟缩短至22.8分钟。这一耗时表现与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。



MiniMax M2.5在多项大模型基准测试中的表现。

在第三方评测中,M2.5同样展现出竞争力。根据BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价格仅为Opus 4.6的八分之一。

MiniMax公布的价格显示,在每秒输出100个token的情况下,连续工作一小时仅需1美元,而在每秒输出50个token的情况下,只需0.3美元。也就是说,1万美元可以让4个智能体连续工作一年。“M2.5为经济上近乎无限地构建和运营智能体提供了可能。”MiniMax在正式公告中写道。

M2.5上线后,在AI模型API聚合平台OpenRouter上日调用量超过1000亿token,跻身榜单前十。

海外市场也迅速给予反馈。硅谷风投公司Menlo Ventures合伙人Deedy Das评价称:“MiniMax M2.5超便宜,非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道:“目前,在可通过API使用的模型中,本质上是两强争霸——Opus代表最高能力上限,M2.5则以更低成本提供较高能力。”OpenHands特别提到,M2.5在需要长时间运行的任务上表现尤为出色,例如从零开始构建应用程序。

除编程能力外,M2.5在Word、PPT、Excel金融建模等办公高阶场景中,也取得显著的能力提升。据介绍,MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作,由他们提出需求、反馈问题、参与标准定义,并直接构建数据,将行业的隐性知识带入到模型的训练流程之中。

过去100多天的时间里,MiniMax保持近乎“每月一更”的节奏,陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看,相比Claude、GPT和Gemini等模型系列的进步速度,M2系列模型的性能提升速度更为显著。

谈及模型能力持续跃升的关键因素,MiniMax将其归因于大规模强化学习。团队围绕着Agent RL的框架和算法,搭建起完整的技术体系。

M2.5的发布,也成为国产大模型公司春节前争先恐后“交卷”的最新一例。此前2月12日,字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦,智谱则上线了旗舰级新模型GLM-5,同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度,支持处理超长文本,进一步激发外界对传闻中DeepSeek V4的期待。

DeepSeek在上一个春节引发全球震撼,一年之后,国产大模型以集体“上新”的形式引爆“AI春节档”,无疑令全球AI竞赛更加白热化。

文/南都N视频记者 杨柳

来源:https://www.163.com/dy/article/KLOG6HEE05129QAF.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
诺奖得主迈克尔·莱维特分享科研乐趣

诺奖得主迈克尔·莱维特分享科研乐趣

近日,第七届上海创新创业青年50人论坛于上海中心成功举办,本届论坛主题紧扣“青年与城市共成长”。在论坛现场,2013年诺贝尔化学奖得主、斯坦福大学结构生物学教授迈克尔·莱维特分享了他真挚的体会:获得诺贝尔奖彻底改变了他的人生轨迹。他着重指出,包括他在内的诺奖获得者以及广大杰出科学家,肩负着一项重要使

时间:2026-05-18 06:20
曹操出行定制Robotaxi Eva Cab能否开启盈利新篇章

曹操出行定制Robotaxi Eva Cab能否开启盈利新篇章

2026年北京车展上,一个重磅消息吸引了全行业的注意:吉利集团旗下的曹操出行,正式发布了其首款专为无人驾驶场景设计的Robotaxi原型车——Eva Cab。这不仅仅是一款新车亮相,更标志着一家拥有十年运营经验的传统出行平台,开始向自动驾驶科技领域进行系统性、战略性的全面转型。与许多“改装派”不同,

时间:2026-05-18 06:20
数据中心次声波污染影响周边居民健康引发投诉

数据中心次声波污染影响周边居民健康引发投诉

数据中心项目因对电价的影响而常遭居民抵制,如今另一种投诉正变得越来越普遍——噪音污染。这其中,有一种特殊形式叫次声波:人耳听不见,身体却能感觉到,不少人都说它会引发头痛、失眠、恶心甚至焦虑。当然,普通的噪音问题也同样突出。 根据环境与能源研究研究所(EESI)的数据,这类工业场地产生的高频和低频声响

时间:2026-05-18 06:19
长三角新能源汽车产业链四小时高铁可达 一体化发展典范

长三角新能源汽车产业链四小时高铁可达 一体化发展典范

在“十五五”规划建议中,“优化区域经济布局,促进区域协调发展”被置于战略高度。这一部署深刻指向中国未来经济增长的核心动力源。近期,全国政协常委、上海公共外交协会会长周汉民在一次专题报告中,精准阐释了其内在逻辑与关键路径。 周汉民指出,京津冀、长三角和粤港澳大湾区这三大核心区域的经济总量已占据全国近半

时间:2026-05-18 06:19
太平洋深渊科考航次圆满收官 揭秘全球深海探索计划

太平洋深渊科考航次圆满收官 揭秘全球深海探索计划

历经156个日夜,总航程突破4万公里,一场横跨太平洋的深海科考壮举圆满落幕。5月10日,“探索一号”科考船携“奋斗者”号全海深载人潜水器成功返回广州母港,宣告了我国主导的“全球深渊探索计划”太平洋穿越航次取得全面成功。本次科考还同步完成了首次中国—智利阿塔卡马海沟联合深潜任务,成果丰硕。 本次深远海

时间:2026-05-18 06:19
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程