美团开源“重思考”模型，工具调用能力达SOTA水准

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

美团开源“重思考”模型，工具调用能力达SOTA水准

热心网友时间：2026-01-16

转载

1月16日，IT之家传出消息，美团LongCat团队正式发布了开源模型LongCat-Flash-Thinking-2601。

据美团介绍，作为LongCat-Flash-Thinking模型的升级版，LongCat-Flash-Thinking-2601在智能体搜索、工具调用、工具交互推理等核心评测基准上，均已达到开源模型的顶尖水平。

美团上线首个开源“重思考”模型，工具调用能力登顶开源SOTA

美团方面表示，该模型尤其在工具调用方面展现出卓越的泛化能力。在依赖工具调用的随机复杂任务中，其性能超越了Claude，可大幅降低真实场景下新工具的适配训练成本。同时，它是首个完整开源并支持在线免费体验“重思考模式”的模型，能启动多个大脑飞速运转，确保思考周全、决策可靠。

得益于全新升级的“重思考”模式，当遇到高难度问题时，模型会把思考过程拆分为并行思考和总结归纳两步来完成：

在并行思考阶段，模型会同时独立梳理出好几条推理路径，就像人面对难题时会琢磨不同解法一样，它还会特意保证思路的多样性，生怕漏掉最优解。

在总结归纳阶段，会对多条路径进行梳理、优化与合成，并将优化结果重新输入，形成闭环迭代推理，推动思考持续深化。

除此之外，我们还专门设计了额外的强化学习环节，针对性打磨模型的总结归纳能力，让LongCat-Flash-Thinking-2601真正做到“想清楚再行动”。

美团上线首个开源“重思考”模型，工具调用能力登顶开源SOTA

美团表示，经过全面严谨的评估显示，LongCat-Flash-Thinking-2601模型在编程、数学推理、智能体工具调用、智能体搜索等维度表现全面领先：

编程能力方面：LongCat-Flash-Thinking-2601在LCB评测中取得82.8分，OIBench EN评测获47.7分，成绩处于同类模型第一梯队，展现出扎实的代码基础能力。

数学推理能力：在开启重思考模式后表现突出，LongCat-Flash-Thinking-2601在AIME-25评测中获得100.0分，IMO-AnswerBench中以86.8分达到当前SOTA。

智能体工具调用能力：在τ²-Bench评测中拿到88.2分，VitaBench评测中获得29.3分，均获得开源SOTA水平，在多领域工具调用场景下表现优异，适配实际应用需求。

智能体搜索能力：在BrowseComp任务中取得73.1分，RW Search评测获79.5分，LongCat-Flash-Thinking-2601具备强劲的信息检索与场景适配能力，达到开源领先水平。

此外，为了更好地测试智能体模型的泛化能力，美团还提出了一种全新的评测方法——通过构建一套自动化任务合成流程，支持用户基于给定关键词，为任意场景随机生成复杂任务。每个生成的任务都配备了对应的工具集与可执行环境。

由于这类环境中的工具配置具有高度随机性，美团通过评估模型在该类环境中的性能表现，来衡量其泛化能力。实验结果表明，LongCat-Flash-Thinking-2601在绝大多数任务中保持领先性能，印证了其在智能体场景下强大的泛化能力。

IT之家附最新开源地址：

GitHub

Hugging Face

ModelScope

API开放平台

正式

来源:https://tech.ifeng.com/c/8pxaW8GuoCM

上一篇：张兴海40年造车路复盘：赛力斯上市首日破发的2000亿启示

下一篇：时隔9年重夺销冠，重庆再次问鼎中国汽车第一城

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

洛克王国绿色命运之钥获取攻略与详细步骤

洛克王国VIP扭蛋机具体位置与获取方法

光遇2026年520发布会爆料内容全解析

洛克王国S2赛季异色精灵盒子查看与使用指南

洛克王国城堡守护者具体位置与寻找攻略

星辰变归来神兽获取攻略新手快速入手指南

洛克王国宠物医院地址查询与位置导航指南

星辰变归来时装系统详解新手入门穿搭攻略

阴阳师2026年520兑换码领取方法与最新福利一览

星辰变归来境界系统详解与修炼攻略

漫蛙漫画防走失网页链接

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

深海迷航2抢先体验版全任务流程图文攻略发布于 2026-05-23

幻想生活i某处地图获取方法详解发布于 2026-05-23

烈焰觉醒游戏评测与新手入门技巧全解析发布于 2026-05-23

烈焰觉醒转职攻略：如何解锁与转换职业发布于 2026-05-23

最后生还者总监新作即将揭晓 TGA重磅预告首发发布于 2026-05-23

倩女幽魂暴富攻略与玩法详细指南发布于 2026-05-23

时光杂货店猪猪配种攻略与技巧详解发布于 2026-05-23

像素秘境唤灵师官网下载与正版安装地址获取指南发布于 2026-05-23

最强史莱姆团队养成攻略高效冲刺技巧全解析发布于 2026-05-23

Steam Controller 充电底座安全风险警示或致起火隐患发布于 2026-05-23

上古卷轴5重制版奥杜因克星主线任务通关全攻略发布于 2026-05-23

物华弥新人世丹心活动攻略开启时间与玩法全解析发布于 2026-05-23

新惊天动地手游公测时间确定正式开服日期与预约方法公布发布于 2026-05-23

斗罗大陆零朱竹青角色强度解析与技能评测发布于 2026-05-23

最终幻想7重生白金奖杯难度过高开发团队致歉发布于 2026-05-23

穿越火线枪战王者生化灵笼模式怎么玩新手进阶技巧攻略发布于 2026-05-23

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

美团开源“重思考”模型，工具调用能力达SOTA水准

Claude下一代模型训练细节公开性格调优成关键环节

深圳龙岗人工智能6S店焕新升级自研AI硬件新品首发亮相

腾讯元宝助力健身工作室会员营销方案与续卡话术撰写指南

豆包AI如何帮你快速审查合同关键条款

Trae代码重构指南：一键优化代码结构与最佳实践

美团开源“重思考”模型，工具调用能力达SOTA水准

Claude下一代模型训练细节公开 性格调优成关键环节

深圳龙岗人工智能6S店焕新升级 自研AI硬件新品首发亮相

腾讯元宝助力健身工作室会员营销方案与续卡话术撰写指南

豆包AI如何帮你快速审查合同关键条款

Trae代码重构指南：一键优化代码结构与最佳实践

Claude下一代模型训练细节公开性格调优成关键环节

深圳龙岗人工智能6S店焕新升级自研AI硬件新品首发亮相