业界首个：美团LongCat-2.0国产芯片万亿参数模型

AI热点日报时间：2026-07-03

热点解读

6月30日，美团正式发布新一代万亿参数大模型LongCat-2 0，并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。 LongCat-2 0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1 6T，平均激活约48B，动态范围在33B至56B之间。

6月30日，美团正式发布新一代万亿参数大模型LongCat-2.0，并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。

LongCat-2.0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1.6T，平均激活约48B，动态范围在33B至56B之间。模型从零开始预训练，原生支持100万Token的超长上下文——这一规格直接将门槛拉升至行业高位。

在正式版发布前，LongCat-2.0的预览版已通过OpenRouter平台和longcat.ai向全球开发者开放调用。截至目前，该模型已跻身OpenRouter全球大模型调用量前三，月调用量仅次于Hermes、Claude Code和OpenClaw——这显然是开发者用行动投票的结果。

预训练数据量超过30T tokens，涵盖中文、英文、多语言及代码等多种类型。真正的挑战在于，如何在万卡级别的国产算力集群上，从头到尾稳定、高效地完成训练任务。

那么，它是怎么做到的？LongCat团队从稳定性、正确性和效率三个维度，攻克了国产算力训练中的一系列核心难题：
- 稳定性方面，通过HCCL异常处理、弹性扩缩卡和自动故障恢复机制，将月均日故障率降低70%以上；
- 正确性方面，自研确定性算子、Bitwise一致性验证和参数检测，确保训练结果可靠，并在此基础上改进关键模块的计算精度，优化Reduce逻辑；
- 效率方面，通过流水线调度、显存优化和算子级控核，训练MFU直接提升1.5倍。

最终，LongCat实现稳态日吞吐超过1T tokens/天，完成了万亿参数MoE模型在国产算力上的稳定训练——这一成就此前在国内尚无先例。

再来看看推理端。LongCat-2.0在推理端围绕模型、算子、框架进行了协同优化：
- 利用大规模专家并行聚合访存带宽，支撑万亿参数MoE模型的低延迟解码；
- 将“零计算专家”机制融入专家并行通信流程，使路由到零专家的token真正避免不必要的传输与计算；
- 重点优化通信、Attention、GEMM等核心算子的调度，结合提前下发与权重预取等框架机制，进一步降低推理链路中的等待开销。

另一个值得关注的技术点是LongCat Sparse Attention（LSA）——稀疏注意力机制。在处理长文本时，它不再逐字逐句地扫描，而是智能筛选关键信息，将计算量从平方级降至线性级。因此，即便在100万Token的超长上下文中，模型依然能保持精准的信息定位与理解能力，避免“读到后面忘了前面”的问题。

代码任务中，不同token的复杂度差异显著：定义变量名与推导递归算法所需的算力截然不同。LongCat-2.0通过零计算专家实现token级的动态激活（33B~56B），简单token不消耗算力，复杂token则自动获得更多计算资源——兼顾高效与精准。

更重要的是，LongCat-2.0采用MOPD架构，融合了Agent、Reasoning、Interaction三组专家能力——Agent Experts主攻工具调用与自主纠错，Reasoning Experts深耕数学与STEM推理，Interaction Experts优化指令遵循与交互体验。推理时，门控网络根据任务类型动态调度最擅长的专家，而非简单地将参数混合。这一设计直接决定了它在编程、推理、交互等多个维度上的出色表现。

综合评测结果印证了这一点——LongCat-2.0在Code和General Agent场景中表现亮眼：

在编程能力方面：
- SWE-bench Pro（考察深层工程能力）得分59.5，领先Gemini 3.1 Pro（54.2）、GPT-5.5（58.6）和Claude Opus 4.6（57.3）；
- SWE-bench Multilingual得分77.3，与Claude Opus 4.6（77.8）处于同一水平；
- 真实终端指令交互评测Terminal-Bench 2.1得分70.8，展现了在真实运维与开发终端任务中的稳定执行与纠错能力。

在真实办公场景的复杂任务处理方面：
- 搜索智能体评测集RWSearch得分78.8；
- 生产力场景评测集FORTE得分73.2；
- BrowseComp得分79.9——均达到或接近前沿闭源模型的水准，对企业级Agent落地而言，这已是实打实的可用级表现。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：业界首个：美团LongCat-2.0国产芯片万亿参数模型要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.ithome.com/0/970/320.htm

LongCat

上一篇：算力用电持续走高：AI生成5秒高清视频耗电等于充十部手机

下一篇：智元第15000台精灵G2具身机器人量产下线

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周AI驱动的员工英语口语教练Lucida 02 / 本周Screenshot2Code：截图转代码工具 03 / 本周SpeakStruct 语音转结构化数据可自定义模板 04 / 本周AI驱动语音治疗应用 IzzyAI 05 / 本周Grammar AI人工智能雅思备考工具

01 / 本月AI驱动的员工英语口语教练Lucida 02 / 本月Screenshot2Code：截图转代码工具 03 / 本月SpeakStruct 语音转结构化数据可自定义模板 04 / 本月AI驱动语音治疗应用 IzzyAI 05 / 本月Grammar AI人工智能雅思备考工具

热点快看

07-03 20:42AI驱动的员工英语口语教练Lucida 07-03 20:42Screenshot2Code：截图转代码工具 07-03 20:42SpeakStruct 语音转结构化数据可自定义模板 07-03 20:41AI驱动语音治疗应用 IzzyAI 07-03 20:41Grammar AI人工智能雅思备考工具

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别