当前位置: 首页
AI
中国科学院瞬悉2.0类脑大模型发布 突破长序列与低耗部署瓶颈

中国科学院瞬悉2.0类脑大模型发布 突破长序列与低耗部署瓶颈

热心网友 时间:2026-05-17
转载

人工智能领域的长文本处理竞赛正进入白热化阶段。无论是深度解析代码仓库、构建智能体的长期记忆,还是处理复杂的多模态交互,都迫切需要模型能够高效处理数十万乃至上百万token的超长序列。

然而,一个根本性的技术瓶颈也随之凸显:基于传统Transformer架构的模型,其推理时的计算复杂度和显存消耗会随着序列长度呈平方级增长。这严重制约了大型语言模型在真实世界场景,特别是边缘计算和资源受限环境中的实际部署与应用。

如何破解这一效率与能耗的困局?近期,中国科学院自动化研究所李国齐、徐波团队带来了突破性解决方案——类脑脉冲大模型「瞬悉2.0」(SpikingBrain2.0-5B)。这项研究在前代「瞬悉1.0」的基础上,针对超长上下文理解与低功耗部署两大核心挑战,实现了从底层架构到上层应用的系统性革新。

研究背景:从规模驱动到效率驱动

当前,大模型的发展范式正在经历深刻变革。早期的“参数规模竞赛”逐渐转向对“上下文窗口能力”的极致追求。模型能够有效理解和记忆多长的信息,直接决定了其解决复杂推理、长文档分析等任务的实际能力上限。

但理想与现实之间存在巨大鸿沟。传统Transformer的自注意力机制在处理超长序列时,会产生难以承受的计算与存储开销。因此,整个产业界与学术界共同面临一个关键命题:能否以极低的计算成本,构建一个既能驾驭超长上下文,又能在多样硬件平台上高效、节能运行的基础模型?

「瞬悉1.0」率先将类脑脉冲神经网络机制引入大模型,迈出了第一步。而「瞬悉2.0」则实现了全面跃升,通过引入更精细的类脑稀疏记忆建模与双路径激活编码策略,旨在完成一次在性能、效率与通用性上的全方位突破。

架构设计:精准优化Transformer效率瓶颈

要设计高效的类脑大模型,必须精准识别传统架构的效能瓶颈。在短序列任务中,Transformer的计算负载主要集中于前馈网络;而在长序列场景下,注意力模块则成为主要的性能与能耗瓶颈。「瞬悉2.0」的架构创新,正是对这两大核心问题的针对性优化。

瞬悉2.0架构概览

双空间混合稀疏注意力

模型创新性地提出了“双空间稀疏注意力”(DSSA)机制。其核心思想并非在所有网络层使用统一的注意力模式,而是在不同层级间智能地混合两种稀疏注意力策略:一种是基于完整键值缓存的块级稀疏计算(MoBA),另一种则是对压缩后状态表征进行稀疏计算(SSE)。

这种设计灵感源于生物大脑的稀疏记忆与信息处理特性,其根本目标是在确保长序列建模性能的前提下,最大化计算效率,实现卓越的“性能-能效”平衡,为长文本大模型提供高效解决方案。

双路径激活值编码策略

注意力机制决定了计算方式,而激活值编码则决定了计算的数据形态。「瞬悉2.0」首创了双路径并行编码方案,以完美适配不同的硬件生态:

瞬悉2.0对偶编码路径

  • FP8低精度编码路径:面向主流高性能GPU(如NVIDIA H100)。利用新一代硬件的低比特张量核心加速矩阵运算,是追求极致推理吞吐量的理想选择。
  • INT8-Spiking脉冲事件编码路径:面向未来神经形态计算芯片。将密集的浮点激活转换为稀疏的脉冲事件流,从而将耗能的矩阵乘法替换为高效的事件驱动整数累加。此路径旨在革命性降低功耗,为AI在端侧、物联网等边缘设备的部署扫清障碍。

转换训练:低成本实现高性能模型迁移

从头训练一个全新架构的大模型成本极高。「瞬悉2.0」研发了一套高效的“Transformer-to-Hybrid”转换训练流程,仅需极少的开源数据和计算资源,即可将成熟的Transformer模型(如Qwen3系列)高性能地迁移为类脑脉冲混合模型。

瞬悉2.0转换训练Pipeline

该流程为语言模型和多模态模型设计了独立且高效的迁移路径。对于语言模型,通过短上下文知识蒸馏、渐进式长上下文能力扩展以及指令跟随微调等阶段,稳步提升模型各项能力。对于视觉语言模型,则融合了视觉-语言知识蒸馏与多模态指令调优技术。整个流程高效、可复现,为社区提供了宝贵的低功耗大模型训练实践经验。

性能表现:用数据验证突破

经过精心设计的「瞬悉2.0」,其实际效能究竟如何?多项基准测试给出了有力证明。

1. 长序列处理效率实现数量级提升

在超长文本处理能力上,其优势极为显著。在处理长达400万token的序列时,其首Token生成延迟相比强大的基线模型Qwen3加速超过10倍。更令人印象深刻的是,借助vLLM推理框架,仅需8张A100 GPU即可支持高达1000万token序列的推理,而基线模型在400万长度时便已因显存溢出而无法运行。

2. 模型训练成本大幅降低

高效不仅体现在推理,也贯穿于训练阶段。整个「瞬悉2.0」语言与多模态模型的转换训练,总计算开销被严格控制在7000 A100 GPU小时以内。具体而言,仅使用32张A100显卡,在9天内即可完成对Qwen3-4B及Qwen3-VL-4B模型的完整能力迁移。相比前代「瞬悉1.0」,训练所需数据量从1500亿Token大幅减少至140亿,训练成本降低了一个数量级。

3. 核心模型能力得到充分保持

在实现极高效率的同时,模型的核心能力是否受损?评测数据显示,其性能得到了完整保留。在MMLU、ARC-C等通用知识基准,以及GSM8K数学推理、HumanEval代码生成等专项任务上,「瞬悉2.0」的语言模型性能与原始Qwen3基线持平,并全面超越了前代模型。其多模态版本「瞬悉2.0-VL」也成功复现了Qwen3-VL的强大能力,在图表理解、视觉推理等任务上表现优异。

4. 卓越的跨平台部署适配能力

这正是「瞬悉2.0」最引人瞩目的特性之一,它真正实现了“一次训练,多端部署”。

  • FP8编码路径下,模型精度损失极小(仅0.24%),但在NVIDIA H100 GPU上实测,长序列推理速度相比其自身BF16版本提升超过2.5倍,充分释放了硬件潜力。
  • INT8-Spiking脉冲编码路径下,精度损失也控制在0.69%以内,同时激活稀疏度高达64.3%。后端仿真结果表明:与传统的INT8量化方案相比,该路径有望在专用神经形态硬件上实现芯片面积减少70.6%,功耗降低约46%-48%。这为彻底解决大模型在移动端、嵌入式设备上的功耗瓶颈,指明了一条极具前景的技术路径。

结语

「瞬悉2.0」的发布,不仅标志着一个高性能类脑脉冲模型的诞生,更清晰地描绘出一条通往高效人工智能的未来路径。它证明,通过深度借鉴生物大脑的稀疏性、事件驱动等高效计算原理,我们完全有能力构建出在保持强大性能的同时,兼具超长上下文处理能力和极致能效比的新一代基础模型。

这项研究为轻量化、多模态高效大模型的研发提供了坚实的技术验证,也为人工智能在边缘计算、物联网等资源严格受限场景的规模化落地,开启了新的可能性。这或许预示着,大模型的发展浪潮,正从单纯追求“参数更大”,转向更加注重“架构更巧”与“能效更绿”的新纪元。

来源:https://www.163.com/dy/article/KRU9IGJ40511ABV6.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
深光影像AF 35mm F2.2银色版镜头发布 全画幅多卡口739元起

深光影像AF 35mm F2.2银色版镜头发布 全画幅多卡口739元起

深光影像为其AF35mmF2 2全画幅自动对焦镜头推出了银色新版本。该镜头提供索尼E、尼康Z、佳能RF三种卡口选项,起售价739元,将于5月18日及25日分批次上市。镜头采用全金属机身,重约163克,具备自动对焦功能,最近对焦距离0 35米,采用5组7片光学结构,主打轻便与高性价比,适合摄影爱好

时间:2026-05-17 10:51
小米高管澄清AI助手传闻:miclaw与小爱同学将共存

小米高管澄清AI助手传闻:miclaw与小爱同学将共存

小米集团总裁卢伟冰近日公开回应了关于AI助手产品的传闻。他明确表示,基于MiMo大模型的测试产品miclaw不会取代用户熟悉的小爱同学,未来两者将走向技术融合。具体路径是将miclaw的能力赋能给小爱同学,从而打造一个更聪明、更能干的“超级小爱”。miclaw作为国内首款手机端AI智能体应用,已于3

时间:2026-05-17 10:51
小米耳夹耳机真机曝光 黑白金三色可选重量轻至5.5克

小米耳夹耳机真机曝光 黑白金三色可选重量轻至5.5克

小米首款耳夹式耳机真机正式亮相,现场展示了玄武岩黑、珍珠白、缎光金三款配色,另有一款神秘配色待公布。产品主打极致轻量化,单耳重量仅5 5克,采用仿生曲线与记忆钛丝设计。音质上搭载11mm驱动单元,支持LHDC5 0与Hi-Res金标认证。智能体验全面升级,集成“超级小爱”助手,支持21种语言翻译、

时间:2026-05-17 10:50
中国自主研发103号赛车燃油上市填补高性能燃油市场空白

中国自主研发103号赛车燃油上市填补高性能燃油市场空白

我国自主研发的爱跑103号赛级燃油正式发布,其研究法辛烷值(RON)达103以上,成为中国环塔国际拉力赛指定用油。该产品具备动力强劲、抗爆卓越、绿色清洁、安全可靠四大核心优势,成功打破了顶级赛事用油长期依赖进口的局面,填补了国产高性能赛车燃油的空白,标志着我国相关炼油技术达到了世界一流水平。

时间:2026-05-17 10:50
酷态科55W快充充电宝上市:20000mAh大容量自带双C线

酷态科55W快充充电宝上市:20000mAh大容量自带双C线

酷态科一款型号为LPB200NC的20000mAh充电宝已通过国家3C认证。产品采用双Type-C自带线设计,支持最高55W的输出功率,能够为笔记本电脑、手机等设备快速充电。同时,它支持45W自充,能较快恢复自身电量。多接口配置兼顾了不同设备的充电需求,适合经常外出、需要为多设备补电的用户。

时间:2026-05-17 10:50
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程