数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

全球首款无英伟达万亿模型海外开发者疯抢

AI热点日报时间：2026-07-03

热点解读

美团LongCat-2 0模型总参数1 6万亿，采用自研MoE架构，从训练到推理完全基于国产芯片，未使用英伟达硬件。其在代码、工具调用等任务中表现优异，此前以OwlAlpha马甲在OpenRouter上成为全球开发者热门选择，月调用量位居前列。

国产算力能否支撑起万亿参数大模型的训练与推理？如今，这一问题有了明确答案——美团LongCat-2.0正式亮相。

该模型采用自研的MoE混合专家架构，总参数量高达1.6万亿，每token激活约48B参数，原生支持1M超长上下文处理能力。

值得关注的是：从训练到推理的整个流程，完全未使用任何英伟达硬件——

它也因此成为首个在国产算力平台上实现全链路训练与推理闭环的万亿参数级模型。

多项专业评测数据表明，LongCat-2.0在代码生成、工具调用以及多步逻辑推理等任务上，综合性能表现颇为出色。

不过，这款模型在开发者圈子里其实并非“新面孔”——它早已披着另一层身份，悄然成为全球Agent开发者的热门选择。

没错，近期在OpenRouter上备受瞩目的Owl Alpha，正是LongCat-2.0的“化名版本”。

其月度调用量在Hermes、Claude Code和OpenClaw中分别位居全球第一、第二和第三位，已经成为许多开发者首选的优质开源模型。

这意味着，它不仅是首个在国产芯片上完成万亿级训练与推理的模型，还已提前通过了真实市场流量的验证。这无疑让人充满期待。下面，我们直接进入实测环节。

将LongCat-2.0投入三项关键评估

既然它在Hermes榜单上稳居首位，那我们就通过Hermes平台来一探究竟。

首先，从长上下文处理能力开始。为了验证它是否真正理解了输入信息，我们并未使用公开的论文或技术白皮书。

而是手动拼凑了一份测试语料——将几份不同行业的研报与多篇不同领域的论文整合在一起，中英文混杂，总字数达数万字：

首先询问一个隐藏在文档前段的信息，源自一份跨境电商进出口报告。

回答完全正确，信息点精准命中。

此外，一份特意拆分处理的完整统计报告，LongCat-2.0也能准确找到，而且响应速度极快，大约1秒便输出结果。

它的分析推理能力同样清晰，数万字的语料挑战顺利通过。

接下来，我们大胆尝试一件程序员最头疼的事：接手老旧项目。

我们选取了一个开源代码仓库——GitHub上拥有13k星标的原版2048游戏，基于纯HTML+CSS+JavaScript架构构建。

将任务交给LongCat-2.0，并提出两个具体需求：

视觉修改：将整个游戏的配色方案改为赛博朋克风格，采用深色背景、霓虹色方块以及发光特效的数字。功能修改：将4×4棋盘扩展为5×5，同时在棋盘下方增设一个计步器，用于记录玩家累计的滑动次数。

接收任务后，它首先逐一审查了关键文件，自主制定出一个包含7个步骤的修改计划。

剩下的工作全部交由它自主执行。12分钟后，LongCat-2.0交付了一个完整的结果。

上手试玩后，效果一目了然：计步器与5×5方格均完好保留，配色方案也完全符合预期。

修改颜色和增加计步器或许不算太难，接着我们又增加了一道挑战——要求它将整个项目从原生JavaScript迁移至React框架。

最终运行的游戏视觉上保持一致，所有功能均被保留，但底层代码已彻底重写。

LongCat-2.0官宣后的这几天，不少用户反馈它和Claude Code搭配使用效果极佳。既然如此，我们便接入Claude Code再进行一轮测试。

这次我们指定一个研究主题，让它协助调研。虽然Claude Code自带deep-research功能，但我们先不启用，而是直接考察LongCat-2.0的自身实力。

凭借Agent原生能力自主联网搜索，LongCat-2.0独立完成了一整篇结构化的研究报告。

它的代码能力也不容忽视，我们让它开发一款“只有一道门”的魔性小游戏。

接到任务后，LongCat-2.0迅速发挥统筹能力，先列出项目架构，然后开始高效编写代码。架构设计、模块拆分、技术选型全部由其自主决定。关卡逻辑、交互细节、通关动画无一遗漏，甚至还主动加入了Web Audio音效。

随后，它顺势接入LongCat-2.0的API，化身代码分析师：输入任意GitHub仓库，即可定制一份专属分析报告。项目结构、核心模块、潜在接手问题、优化建议，全都被它一一解读。

测试过程中还发现了一个“彩蛋”：我们向LongCat-2.0、GPT5.5、Opus 4.6、Opus 4.8输入同一段提示词，让四个模型各自生成一套物理仿真代码。

从肉眼观察，各模型呈现的效果较为接近。但在Token用量上，LongCat明显最少——仅消耗9004个Token，按照美团的计费标准计算，成本不到1毛钱。

这或许正是官方所说的Cache命中不计费、Token Plan不算消耗带来的优势。论及“省钱”能力，美团确实堪称高手。

经过一圈体验，LongCat-2.0与主流编程工具的适配度确实相当高。支撑这些能力背后的，是其架构层面的一系列原创设计。而所有这些设计都诞生于一个特殊的背景之下：

LongCat-2.0从训练到推理，全程基于国产芯片完成。

那么问题来了：国产卡集群是如何支撑起万亿参数模型的？

5万张国产卡支撑起一个万亿模型

谈及国产芯片运行AI，推理环节已在行业内得到一定验证。过去几年，确实有一些大模型和线上服务能够稳定运行在国产算力平台上。而在训练方面，行业也陆续有模型完成了百亿甚至千亿级别的训练探索。

但仔细审视这些成果，本质上仍属于某一环节的单点能力验证。万亿参数级别、从预训练第一天起就跑在国产卡上、并实现训推全链路闭环的案例，在LongCat-2.0之前尚未出现。

如此大规模地跑完整个流程，考验的是整个系统工程能力。国产芯片的硬件条件让这项任务更加艰巨——单卡显存更小，1.6万亿参数只能被拆分到成千上万张卡上并行运行；通信带宽不如NVLink充裕，跨节点通信延迟更高；大规模并行训练中，计算与通信容易不对齐，从而拖慢整体吞吐。

除了硬件差距，软件生态也是一道难以逾越的坎。在英伟达平台上，许多算子、调试工具、确定性计算能力已经非常成熟；切换到国产芯片后，很多东西都需要重新编写和优化。例如，FlashAttention的反向梯度算子，国产原有的确定性实现只能单核串行，速度慢了20到70倍，无法用于实际生产。

因此，LongCat-2.0的意义不仅仅在于多了一个1.6万亿参数模型。对于国产AI生态而言，它首次证明了国产算力已经具备支撑先进大模型持续训练、持续部署和持续迭代的能力。

另一个值得关注的点，是针对Agent时代重新设计的LongCat Sparse Attention（LSA）。Agent意味着模型一次需要处理大量上下文，1M上下文带来的最大压力正集中在注意力计算上。

DeepSeek之前提出了一套稀疏注意力方案DSA，其核心思路是让模型只关注关键Token来降低计算量。但该方案在实际运行中存在一个问题：筛选关键Token的索引器本身成为了性能瓶颈，索引计算越来越慢，显存访问越来越碎片化，序列越长，效率下降得越明显。

LongCat-2.0从这一痛点接手，提出了LongCat稀疏注意力（LSA），对索引器进行了三项针对性优化：将零散访问整理为连续读取、让相邻层共享索引结果、通过两阶段筛选减少计算量。这三项优化相互独立，可按需组合，叠加效果使得1M上下文的处理速度显著提升，同时模型质量基本无损。

另一个非常有趣的设计是N-gram Embedding，它继承自LongCat-Flash-Lite并得到了进一步增强。许多MoE模型提升能力的方式是继续增加专家数量，但LongCat团队反而将一部分参数“前移”到了Embedding层，让模型在初始阶段就能识别更多高频词组和语言模式。

简单理解就是：以前许多事情需要模型思考几十层才能反应过来，现在一开始就能识别出来。这样既提高了代码、指令理解等任务上的准确率，也减少了专家之间频繁通信带来的额外开销。

除此之外，像ScMoE快捷连接、零计算专家等设计，也都围绕着同一个核心目标：让模型把算力花在真正值得计算的地方。

这套架构创新使得模型实现了更快、更省、效果更强的目标。但在5万张国产卡的大规模集群中落地，仍需攻克诸多工程难题——其中最现实的问题就是，硬件会出现故障。在这样的规模下，几乎每天都会发生硬件故障。LongCat团队专门搭建了一套自动化故障处理体系：从异常检测、链路切换到自动恢复几乎全部自动完成，将日均故障率从万分之15.7降低到了万分之4.4；同时支持训练任务从2560张卡一路扩展到5万多张卡，无需推倒重来。

另一方面，他们重写了一套完全适配国产芯片的算子和并行方案，将硬件利用率（MFU）从17.8%提升到了27.68%，单日Token处理能力从7170亿提升到了1.12万亿。

通过一系列架构和工程优化，美团将国产芯片的潜力一点点释放出来。而这些优化叠加在一起，还带来了一个特别实际的好处——显著节省成本。

零计算专家减少了无效计算，ScMoE减少了等待时间，N-gram Embedding降低了通信压力，再加上国产芯片本身的成本优势，LongCat-2.0的训练与推理成本比同等规模的英伟达路线低了不少。

3年等待的“国芯+国模”终登台前

从公开信息来看，美团布局国产算力至今已有三年时间。

2023年初，美团成立了LongCat基座团队，起步的第一件事就是搭建国产算力集群。众所周知，使用国产卡训练模型意味着每个环节都需要亲自攻克，研发周期更长，成本更高。但国产算力集群必然是未来的主流方向，美团的策略就是“用时间换空间”：接受短期的适配阵痛，提前吃透国产算力全链路，稳住大模型的长期迭代节奏。

如今看来，这一判断的价值正在逐步兑现。2023年搭建集群、跑通千亿参数训练流程；2024年在国产卡上验证MoE架构；2025年推出5600亿参数的LongCat-Flash；2026年落地1.6万亿参数的LongCat-2.0。

此外，在OpenRouter上匿名发布的Owl Alpha，用两个月时间证明了一个比纸面技术指标更关键的问题：国产芯片训练出的万亿规模模型，全球开发者同样愿意买单。

LongCat-2.0在完全匿名、无品牌背书的情况下，在多个场景中被当作首选——这说明模型交付的结果已获得了广泛认可。

今年3月，美团核心本地商业CEO王莆中在内部谈及AI时提到一个关键词：建设物理世界AI底座。他表示，美团将持续投入基础模型，打造有特色、低推理成本，同时能力紧跟SOTA的模型。

从这个角度再看LongCat-2.0，全流程训练和推理仅依赖国产算力，确实契合了“有特色”和“低推理成本”的逻辑；同时，它的出现像是为未来的物理世界AI打下地基——基础模型能力站稳了，向上搭建理解层和行动层才有了着力点。

那么问题来了，下一次冲击新SOTA的模型，会以什么样的新“马甲”出现呢？（doge）

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：全球首款无英伟达万亿模型海外开发者疯抢要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.qbitai.com/2026/07/442047.html

英伟达

上一篇：云上曲率ViiTorVoice AI语音合成模型

下一篇：预印本平台arXiv脱离康奈尔大学正式独立运营

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。