当前位置: 首页
AI资讯
美团龙猫注意力机制升级:提速10倍,精准处理1M超长文本

美团龙猫注意力机制升级:提速10倍,精准处理1M超长文本

热心网友 时间:2026-01-13
转载
文自 | 凹非寺
量子位 | 公众号 QbitAI

文本处理速度大幅提升超过50%,同时还解锁了多达1M的上下文处理能力。

美团龙猫LongCat系列在新年之际再出新招,正式发布了名为LoZA的全新稀疏注意力机制。

这项创新技术集中火力,旨在攻克长文本任务在理解与算力上的核心难题。

相比LongCat系列此前采用的全注意力机制MLA,新的LoZA仅对其一半的核心模块进行了改造。

但模型的长文本处理能力却从256K显著扩展至1M,解码速度也有了显著提升。

其表现甚至优于同类型的Qwen-3模型。

接下来,让我们一起看看它的具体实现方案。

如何实现“只算关键部分”?

全注意力机制的算力瓶颈在于其平方级的计算复杂度,这导致模型处理长文本任务时对硬件要求苛刻,并伴随着推理延迟问题。

LoZA的核心思路是让模型将算力资源聚焦于处理重要的内容,对于次要部分则减少计算开销。

作为LongCat系列的核心技术升级,LoZA主要是在原有的MLA机制基础上进行针对性改造。

具体分为两步走。

首先,对模型中的多头潜在注意力模块进行一次全局“筛查”,找出那些适合被改造的模块。

在原有的MLA架构中,每个模块都是处理注意力的核心单元。新方案为每个模块配备一个可学习的权重α。

α值越高,说明该模块进行全注意力计算越关键,一旦简化就容易丢失性能;α值越低则意味着模块的可替代性强,即便换成更轻量级的计算方式,对整体理解能力的影响也不大。

在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些稀疏化后不影响性能的MLA模块,作为后续的优化目标。

随后,将找出的50%低重要性模块替换成更轻巧的流式稀疏注意力SSA。

这样就形成了一种交错结构,团队将这种结构称为ZigZag。

SSA的计算复杂度是线性的,远低于全注意力的平方级复杂度。

所以这种交错结构让模型既不会因为过度简化而变“笨”,又能将计算复杂度降到线性级别,节省大量算力。

为了让模型在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个大小为1024 Token的稀疏窗口。

每个窗口包含1个负责抓取整体关联的“全局块”和7个负责紧盯附近内容的“局部块”,单块大小为128 Token。

这样的改造也无需从头训练,在中期训练阶段就能完成,成本也比较低。

从测试数据来看,LoZA的表现相当不错,主要是在“更快”的同时“没变笨”。

速度上,处理128K上下文时,解码速度直接比原来快10倍;

处理256K上下文时,模型预加载速度提升了50%,后续解码阶段生成内容时还能节省约30%的算力。这意味着同样的硬件,现在能同时处理两倍多的长文本任务。

这也让LongCat-Flash-Exp解锁了1M的上下文处理窗口。

性能上,LoZA也没有因为简化而“缩水”。

在处理问答、写代码这类日常任务时,和原版LongCat-Flash持平;处理长文本任务时,表现反而更好。

比如在MRCR测试里,超越了同样能处理1M长文本的Qwen-3模型,表现也更稳定。

接下来,团队还计划让LoZA支持动态稀疏比例。

短文本场景自动多用全注意力保证精度,长文本场景自动增加稀疏模块提升效率,甚至适配多模态模型处理长视频、长图文内容。

真是新年新气象!

论文地址已发布。

— 完 —

来源:https://www.163.com/dy/article/KJ5E1HHA0511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
谷歌AI世界模型原型Project Genie技术解析与应用前景

谷歌AI世界模型原型Project Genie技术解析与应用前景

Project Genie是什么 你是否曾幻想过,只需用一句话描述一个想法,或是随手上传一张图片,就能瞬间“进入”一个由人工智能实时生成、并可自由漫游的虚拟空间?这并非遥远的科幻情节,而是谷歌DeepMind实验室正在研发的突破性项目——“Project Genie”。 简而言之,Project G

时间:2026-05-23 21:16
月之暗面Kimi开源K2.5全能旗舰模型正式发布

月之暗面Kimi开源K2.5全能旗舰模型正式发布

Kimi K2 5是什么?月之暗面开源的全能旗舰AI模型详解 在人工智能技术飞速发展的当下,每一次重要模型的发布都牵动着业界的目光。月之暗面(Moonshot AI)最新开源推出的Kimi K2 5,正是这样一款定位为“全能旗舰”的重量级AI大模型。它基于高达约15T(万亿)Token的视觉与文本混

时间:2026-05-23 21:16
昆仑万维AI音乐模型Mureka V8功能详解

昆仑万维AI音乐模型Mureka V8功能详解

Mureka V8是什么 如果说过去的AI音乐生成技术还停留在“声音素材拼接”的初级阶段,那么昆仑万维最新发布的Mureka V8模型,则标志着AI音乐创作向“类人化思维创作”迈出了实质性的一步。这一突破的核心驱动力,在于其创新的MusiCoT(音乐思维链)技术架构。该模型在旋律的流畅性与完整性、人

时间:2026-05-23 21:16
企业引入AI智能体 IT与业务部门如何高效分工协作

企业引入AI智能体 IT与业务部门如何高效分工协作

一、 范式演进:从‘单一工具’到‘智能同事’的协同重构 当前,企业数字化转型已进入深水区,其核心远不止于部署新系统。随着AI智能体的广泛应用,一场深刻的组织协同变革正在发生。权威机构Gartner预测,到2026年,超过80%的企业将采用生成式AI技术。这标志着,传统的“IT建设、业务使用”的线性模

时间:2026-05-23 21:16
数据采集出错率如何降低 从手工到自动化实操指南

数据采集出错率如何降低 从手工到自动化实操指南

在数字化运营的核心战场上,数据是驱动决策的命脉。然而,许多企业的运营团队仍深陷“数据沼泽”:每日手动穿梭于数十个平台,搬运订单、流量与财务数据。这种低效且易错的操作模式成本高昂——据IDC研究,企业因数据质量问题导致的年均损失可达1500万美元。因此,提升数据采集的准确性,已从效率优化升级为关乎企业

时间:2026-05-23 21:15
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程