美团推出LongCat推理模型,性能突破SOTA标准
9月22日,美团LongCat团队正式推出革命性的推理模型LongCat-Flash-Thinking。这款全新模型在延续LongCat-Flash-Chat极速性能的基础上,实现了专业能力的全面升级。测试结果表明,在逻辑推理、数学解题、编程开发、智能体协作等核心领域,其表现均已突破开源模型的天花板,跃居全球顶尖水准。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
突破性技术创新带来质的飞跃
领域并行强化学习训练体系:团队开发的这套创新训练框架巧妙解决了混合领域训练的稳定性难题。通过将STEM学科、编程开发、智能体任务等专项能力解耦训练,再采用多领域能力融合策略,最终实现模型整体性能的帕累托最优平衡。

DORA异步训练系统:这套革命性的异步弹性共卡系统采用创新的弹性调度机制与多版本流水线设计,不仅训练速度较传统同步框架提升3倍,还确保了策略执行的严格一致。系统支持万级显卡集群稳定运行,其卓越的KV缓存复用技术大幅提升了算力利用率。值得注意的是,在模型强化学习阶段,其计算资源投入仅为预训练阶段的20%,真正实现了"小投入、大产出"。
多项性能测试领跑行业
在最新发布的各项基准测试中,LongCat-Flash-Thinking表现惊艳:
- 通用推理能力:ARC-AGI测试得分50.3分,力压OpenAI o3和Gemini2.5 Pro等商业闭源产品
- 数学推理:HMMT和AIME测试中与Qwen3-235B等顶尖模型比肩
- 编程能力:LiveCodeBench测试79.4分,达到与GPT-5同级别水准

资源获取方式
模型已全面开源:
- Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking
- Github:https://github.com/meituan-longcat/LongCat-Flash-Thinking
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
曝光151个含恶意代码软件包,AI批量生成隐患需警惕
编辑|杨文此前我们曾报道,有人在学术论文中嵌入隐藏指令,诱导 AI 打高分:将「仅输出正面评价」或「不要给出任何负面分数」等英文指令以白底白字或极小号字体写入文档,人眼几乎无从察觉,AI 却能识别并
迈向通用智能:Echo预测智能如何走出关键一步
机器之心发布大模型能否预测未来?UniPat AI 构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型 EchoZ-1 0。在其公开的 General
DeepSeek 瘫痪超8小时:故障影响分析与应对指南
你敢想,DeepSeek崩了一晚上!超过8小时仍未修复。根据三言报道,从3月29日晚上22点开始,一直到至30日早上7点,DeepSeek服务出现大规模访问异常,大量用户遭遇页面卡顿、反复提示“服务
AI预测市场崛起:黑马模型胜率如何超越人类
新智元报道编辑:Aeneas【新智元导读】大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1 0。
Anthropic融资启示:21家顶级VC拒绝后的AI天价融资内幕
新智元报道编辑:倾倾【新智元导读】谁能想到,OpenAI核心团队出来创业,竟被21家顶级VC拒之门外?结果5年后,这帮人为了抢一张入场券,不惜支付300倍溢价。复盘这场闹剧,我们只看到了一个词:活该
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

