业界首个:美团LongCat-2.0国产芯片万亿参数模型
6月30日,美团正式发布新一代万亿参数大模型LongCat-2 0,并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。 LongCat-2 0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1 6T,平均激活约48B,动态范围在33B至56B之间。
6月30日,美团正式发布新一代万亿参数大模型LongCat-2.0,并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。
LongCat-2.0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1.6T,平均激活约48B,动态范围在33B至56B之间。模型从零开始预训练,原生支持100万Token的超长上下文——这一规格直接将门槛拉升至行业高位。
在正式版发布前,LongCat-2.0的预览版已通过OpenRouter平台和longcat.ai向全球开发者开放调用。截至目前,该模型已跻身OpenRouter全球大模型调用量前三,月调用量仅次于Hermes、Claude Code和OpenClaw——这显然是开发者用行动投票的结果。
预训练数据量超过30T tokens,涵盖中文、英文、多语言及代码等多种类型。真正的挑战在于,如何在万卡级别的国产算力集群上,从头到尾稳定、高效地完成训练任务。
那么,它是怎么做到的?LongCat团队从稳定性、正确性和效率三个维度,攻克了国产算力训练中的一系列核心难题:
- 稳定性方面,通过HCCL异常处理、弹性扩缩卡和自动故障恢复机制,将月均日故障率降低70%以上;
- 正确性方面,自研确定性算子、Bitwise一致性验证和参数检测,确保训练结果可靠,并在此基础上改进关键模块的计算精度,优化Reduce逻辑;
- 效率方面,通过流水线调度、显存优化和算子级控核,训练MFU直接提升1.5倍。
最终,LongCat实现稳态日吞吐超过1T tokens/天,完成了万亿参数MoE模型在国产算力上的稳定训练——这一成就此前在国内尚无先例。
再来看看推理端。LongCat-2.0在推理端围绕模型、算子、框架进行了协同优化:
- 利用大规模专家并行聚合访存带宽,支撑万亿参数MoE模型的低延迟解码;
- 将“零计算专家”机制融入专家并行通信流程,使路由到零专家的token真正避免不必要的传输与计算;
- 重点优化通信、Attention、GEMM等核心算子的调度,结合提前下发与权重预取等框架机制,进一步降低推理链路中的等待开销。
另一个值得关注的技术点是LongCat Sparse Attention(LSA)——稀疏注意力机制。在处理长文本时,它不再逐字逐句地扫描,而是智能筛选关键信息,将计算量从平方级降至线性级。因此,即便在100万Token的超长上下文中,模型依然能保持精准的信息定位与理解能力,避免“读到后面忘了前面”的问题。
代码任务中,不同token的复杂度差异显著:定义变量名与推导递归算法所需的算力截然不同。LongCat-2.0通过零计算专家实现token级的动态激活(33B~56B),简单token不消耗算力,复杂token则自动获得更多计算资源——兼顾高效与精准。
更重要的是,LongCat-2.0采用MOPD架构,融合了Agent、Reasoning、Interaction三组专家能力——Agent Experts主攻工具调用与自主纠错,Reasoning Experts深耕数学与STEM推理,Interaction Experts优化指令遵循与交互体验。推理时,门控网络根据任务类型动态调度最擅长的专家,而非简单地将参数混合。这一设计直接决定了它在编程、推理、交互等多个维度上的出色表现。
综合评测结果印证了这一点——LongCat-2.0在Code和General Agent场景中表现亮眼:
在编程能力方面:
- SWE-bench Pro(考察深层工程能力)得分59.5,领先Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);
- SWE-bench Multilingual得分77.3,与Claude Opus 4.6(77.8)处于同一水平;
- 真实终端指令交互评测Terminal-Bench 2.1得分70.8,展现了在真实运维与开发终端任务中的稳定执行与纠错能力。
在真实办公场景的复杂任务处理方面:
- 搜索智能体评测集RWSearch得分78.8;
- 生产力场景评测集FORTE得分73.2;
- BrowseComp得分79.9——均达到或接近前沿闭源模型的水准,对企业级Agent落地而言,这已是实打实的可用级表现。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:业界首个:美团LongCat-2.0国产芯片万亿参数模型要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。
Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。
SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。
IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。
- 日榜
- 周榜
- 月榜
热点快看
