当前位置: 首页
AI
美团开源560B参数LongCat大模型,AI智能体任务表现优异

美团开源560B参数LongCat大模型,AI智能体任务表现优异

热心网友 时间:2025-09-02
转载

特别鸣谢网友蔡蔡Cai、小星_14、Domado、有鲫雪狐提供的线索资讯!

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

9月1日最新消息,美团今日正式推出LongCat-Flash-Chat模型并同步开放源代码。

\

LongCat-Flash采用创新的混合专家模型架构,总参数量达到560B,实际激活参数在18.6B至31.3B之间波动,平均值为27B,在计算效率与性能表现之间取得最优平衡。

该模型在架构设计上引入“零计算专家”机制,总参数量达560B,每个token根据上下文需求仅激活18.6B~31.3B参数,实现算力资源的精准调配。为有效控制整体算力消耗,训练过程中采用PID控制器动态调节专家偏置,将单token平均激活参数量稳定维持在27B左右。

\

▲ LongCat-Flash架构示意图

此外,模型在层级间构建跨层通信通道,使MoE的通信与计算流程实现高度并行,极大提升了训练与推理效率。配合深度定制的底层优化方案,LongCat-Flash仅用30天便完成训练,在H800硬件平台上实现单用户每秒100+ tokens的推理速度。该模型还对常规大模型组件与训练方法进行了多项改进,采用超参迁移与模型层叠加的训练策略,并结合多种技术手段确保训练过程的稳定性。

针对智能体功能优化,LongCat-Flash自主构建了Agentic评估体系以指导数据策略,并在全训练流程中实施全面优化,包括运用多智能体方法生成丰富多样的高质量轨迹数据,从而显著提升了智能体任务的处理能力。

通过算法与工程设计的深度融合,LongCat-Flash在理论成本与运行速度方面均显著超越同规模甚至更小规模的行业竞品;经过系统级优化,该模型在H800平台上达成每秒100 tokens的生成速度,在保持极致生成效率的同时,将输出成本控制在每百万token仅5元

综合多项基准测试评估,作为非思考型基础模型,LongCat-Flash-Chat在仅激活少量参数的情况下,性能表现已与当前主流领先模型持平,尤其在智能体任务领域展现出显著优势。得益于面向推理效率的专项设计与创新,LongCat-Flash-Chat具备更快的推理速度,特别适合处理耗时长、复杂度高的智能体应用场景。

  • 通用领域知识方面,LongCat-Flash在ArenaHard-V2基准测试中获得86.50分,位列所有参评模型第二名。在基础能力测试中,MMLU得分为89.71,CEval得分达90.44。这些成绩与国内顶尖模型表现相当,但其参数规模明显小于DeepSeek-V3.1、Kimi-K2等同类产品。
  • 智能体工具使用领域,LongCat-Flash展现出卓越性能:即使在面对参数规模更大的竞品时,其在τ2-Bench中的表现依然领先;在复杂场景处理能力方面,该模型于VitaBench测试中以24.30的得分高居榜首。
  • 编程能力测试中,LongCat-Flash在TerminalBench评估中以39.51分位列第二;在SWE-Bench-Verified测试中取得60.4分的优异成绩。
  • 指令遵循维度,LongCat-Flash在IFEval测试中以89.65分夺得第一;同时在COLLIE和Meeseeks-zh两项中文指令基准测试中分别获得57.10和43.03的最高分,彰显其在中英文不同语言环境及高难度指令集上的卓越适应能力。

目前,LongCat-Flash-Chat已在GitHub与Hugging Face平台同步开源。具体访问地址如下:

  • Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
  • GitHub:https://github.com/meituan-longcat/LongCat-Flash-Chat
  • 体验官网:https://longcat.ai/
来源:https://www.ithome.com/0/879/486.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
日均 120 万亿 Token,火山引擎两年前的赌注开始兑现

日均 120 万亿 Token,火山引擎两年前的赌注开始兑现

带着 Seedance 2 0 和 ArkClaw 两件新武器,火山引擎开始席卷 MaaS 市场。作者|郑玄两年前,火山引擎说要 All in Token 的时候,很多人觉得这是一句正确但空洞的口号

时间:2026-04-07 09:49
开盒Claude Code的原来是中国00后!曾怒怼Anthropic窃取用户代码

开盒Claude Code的原来是中国00后!曾怒怼Anthropic窃取用户代码

Jay 发自 凹非寺量子位 | 公众号 QbitAI扒光Anthropic底裤的人,究竟是谁?答案揭晓——一位年仅25岁的中国小伙,Chaofan Shou。仅凭一条帖子便引爆全网,从60MB的so

时间:2026-04-07 09:43
10万预算新选择!启源Q05大空间长续航 智驾配置卷出新高度

10万预算新选择!启源Q05大空间长续航 智驾配置卷出新高度

在预算10万元以内选购纯电汽车,消费者过去往往只能在小型轿车中做选择。然而,随着市场需求的演变,一款兼具SUV空间优势与高阶智能配置的全新车型——全新Q05,正以颠覆性姿态打破这一局限,为预算敏感型

时间:2026-04-07 09:37
极豆科技携手银联智谱岚图 全球首秀车载智能体支付场景 开启出行服务新体验

极豆科技携手银联智谱岚图 全球首秀车载智能体支付场景 开启出行服务新体验

中国银联近日在上海正式推出《智能体支付开放协议框架》(Agentic Payment Open Protocol,简称APOP框架),并顺利完成首批生产系统验证交易。这一创新举措标志着智能支付领域迈

时间:2026-04-07 09:31
上汽奥迪E5 Sportback智驾升级:Momenta大模型赋能,多场景辅助驾驶再进化

上汽奥迪E5 Sportback智驾升级:Momenta大模型赋能,多场景辅助驾驶再进化

上汽奥迪近日宣布,旗下AUDI品牌首款车型E5 Sportback迎来重大智驾升级,搭载Momenta全新强化学习大模型,全面优化全景辅助驾驶功能。此次升级覆盖环岛通行、ETC无感通行(OTA)、三

时间:2026-04-07 09:25
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程