美团龙猫注意力机制升级:提速10倍,精准处理1M超长文本
文自 | 凹非寺
量子位 | 公众号 QbitAI
文本处理速度大幅提升超过50%,同时还解锁了多达1M的上下文处理能力。
美团龙猫LongCat系列在新年之际再出新招,正式发布了名为LoZA的全新稀疏注意力机制。
这项创新技术集中火力,旨在攻克长文本任务在理解与算力上的核心难题。
相比LongCat系列此前采用的全注意力机制MLA,新的LoZA仅对其一半的核心模块进行了改造。
但模型的长文本处理能力却从256K显著扩展至1M,解码速度也有了显著提升。
其表现甚至优于同类型的Qwen-3模型。
接下来,让我们一起看看它的具体实现方案。
如何实现“只算关键部分”?
全注意力机制的算力瓶颈在于其平方级的计算复杂度,这导致模型处理长文本任务时对硬件要求苛刻,并伴随着推理延迟问题。
LoZA的核心思路是让模型将算力资源聚焦于处理重要的内容,对于次要部分则减少计算开销。
作为LongCat系列的核心技术升级,LoZA主要是在原有的MLA机制基础上进行针对性改造。
具体分为两步走。
首先,对模型中的多头潜在注意力模块进行一次全局“筛查”,找出那些适合被改造的模块。
在原有的MLA架构中,每个模块都是处理注意力的核心单元。新方案为每个模块配备一个可学习的权重α。
α值越高,说明该模块进行全注意力计算越关键,一旦简化就容易丢失性能;α值越低则意味着模块的可替代性强,即便换成更轻量级的计算方式,对整体理解能力的影响也不大。
在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些稀疏化后不影响性能的MLA模块,作为后续的优化目标。
随后,将找出的50%低重要性模块替换成更轻巧的流式稀疏注意力SSA。
这样就形成了一种交错结构,团队将这种结构称为ZigZag。
SSA的计算复杂度是线性的,远低于全注意力的平方级复杂度。
所以这种交错结构让模型既不会因为过度简化而变“笨”,又能将计算复杂度降到线性级别,节省大量算力。
为了让模型在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个大小为1024 Token的稀疏窗口。
每个窗口包含1个负责抓取整体关联的“全局块”和7个负责紧盯附近内容的“局部块”,单块大小为128 Token。
这样的改造也无需从头训练,在中期训练阶段就能完成,成本也比较低。
从测试数据来看,LoZA的表现相当不错,主要是在“更快”的同时“没变笨”。
速度上,处理128K上下文时,解码速度直接比原来快10倍;
处理256K上下文时,模型预加载速度提升了50%,后续解码阶段生成内容时还能节省约30%的算力。这意味着同样的硬件,现在能同时处理两倍多的长文本任务。
这也让LongCat-Flash-Exp解锁了1M的上下文处理窗口。
性能上,LoZA也没有因为简化而“缩水”。
在处理问答、写代码这类日常任务时,和原版LongCat-Flash持平;处理长文本任务时,表现反而更好。
比如在MRCR测试里,超越了同样能处理1M长文本的Qwen-3模型,表现也更稳定。
接下来,团队还计划让LoZA支持动态稀疏比例。
短文本场景自动多用全注意力保证精度,长文本场景自动增加稀疏模块提升效率,甚至适配多模态模型处理长视频、长图文内容。
真是新年新气象!
论文地址已发布。
— 完 —
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
谷歌AI世界模型原型Project Genie技术解析与应用前景
Project Genie是什么 你是否曾幻想过,只需用一句话描述一个想法,或是随手上传一张图片,就能瞬间“进入”一个由人工智能实时生成、并可自由漫游的虚拟空间?这并非遥远的科幻情节,而是谷歌DeepMind实验室正在研发的突破性项目——“Project Genie”。 简而言之,Project G
月之暗面Kimi开源K2.5全能旗舰模型正式发布
Kimi K2 5是什么?月之暗面开源的全能旗舰AI模型详解 在人工智能技术飞速发展的当下,每一次重要模型的发布都牵动着业界的目光。月之暗面(Moonshot AI)最新开源推出的Kimi K2 5,正是这样一款定位为“全能旗舰”的重量级AI大模型。它基于高达约15T(万亿)Token的视觉与文本混
昆仑万维AI音乐模型Mureka V8功能详解
Mureka V8是什么 如果说过去的AI音乐生成技术还停留在“声音素材拼接”的初级阶段,那么昆仑万维最新发布的Mureka V8模型,则标志着AI音乐创作向“类人化思维创作”迈出了实质性的一步。这一突破的核心驱动力,在于其创新的MusiCoT(音乐思维链)技术架构。该模型在旋律的流畅性与完整性、人
企业引入AI智能体 IT与业务部门如何高效分工协作
一、 范式演进:从‘单一工具’到‘智能同事’的协同重构 当前,企业数字化转型已进入深水区,其核心远不止于部署新系统。随着AI智能体的广泛应用,一场深刻的组织协同变革正在发生。权威机构Gartner预测,到2026年,超过80%的企业将采用生成式AI技术。这标志着,传统的“IT建设、业务使用”的线性模
数据采集出错率如何降低 从手工到自动化实操指南
在数字化运营的核心战场上,数据是驱动决策的命脉。然而,许多企业的运营团队仍深陷“数据沼泽”:每日手动穿梭于数十个平台,搬运订单、流量与财务数据。这种低效且易错的操作模式成本高昂——据IDC研究,企业因数据质量问题导致的年均损失可达1500万美元。因此,提升数据采集的准确性,已从效率优化升级为关乎企业
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

