当前位置: 首页
AI教程
ICML 2026 SVL 脉冲神经网络高效3D开放世界理解

ICML 2026 SVL 脉冲神经网络高效3D开放世界理解

热心网友 时间:2026-07-01
转载

论文题目:SVL: Empowering Spiking Neural Networks for Efficient 3D Open-World Understanding

论文:https://arxiv.org/abs/2505.17674
代码:https://github.com/bollossom/SVL

\

图1

一、背景

受大脑启发的脉冲神经网络(SNN)凭借其独特的脉冲驱动特性与时空处理能力,在处理稀疏3D几何数据(如事件流与点云)时,天然具备极高的能效优势。以Speck等神经形态芯片为例,事件驱动的稀疏处理可将功耗降低至毫瓦级别。

然而,现有SNN在性能上与人工神经网络(ANN)仍有较大差距,且多数模型仅针对特定任务设计,泛化表示能力不足,更难以实现3D开放世界下的多模态理解。在实际应用场景中,SNN往往难以泛化到训练集之外的新类别。当前主流的SNN预训练方法——如基于STDP的初始化、知识蒸馏、掩码图像建模——在复杂数据集上效果欠佳,计算资源消耗过高,或缺乏多模态(尤其是语言)的有效引导。

另一方面,视觉-语言模型(VLM,如CLIP)通过将2D图像知识迁移至3D领域实现了开放世界理解,但其推理时严重依赖庞大的文本编码器,给资源受限的神经形态硬件部署带来了巨大挑战。为解决上述难题,我们提出了SVL(Spike-based Vision-Language pretraining framework),旨在增强SNN的开放世界多模态3D理解能力,同时保留高效的脉冲驱动推理特性。

二、本文主要贡献

1. 多尺度三元对齐(MTA)

为了捕捉3D数据的几何特性并实现开放世界理解,我们设计了多尺度三元对齐机制。MTA通过无标签的三元组对比学习,联合优化文本、图像和3D输入之间的相关性对齐。具体而言,MTA不仅包含语义层面的脉冲-文本对齐——将3D实例特征与CLIP提取的文本提示特征在嵌入空间中拉近;还引入了细粒度的脉冲-图像对齐,通过InfoNCE与MSE损失的联合约束,进一步捕捉图像与3D数据之间紧密耦合的细粒度语义信息。

2. 可重参数化视觉-语言集成(Rep-VLI)

传统视觉-语言模型在推理时离不开庞大的文本编码器,这成为SNN高效部署的主要障碍。为此,我们提出了可重参数化视觉-语言集成模块。Rep-VLI的核心创新在于:将离线文本嵌入直接转换为轻量级分类层的权重。在推理阶段,文本编码器被完全移除,改用硬件友好的脉冲计数决策规则替代传统的Softmax操作。如此一来,模型既保持了全脉冲驱动和硬件兼容性,又实现了无文本编码器的轻量级推理。

3. 首个全脉冲驱动点云Transformer(Spike-driven PointFormer)

除SVL框架外,我们还提出了首个全脉冲驱动的点云Transformer架构——Spike-driven PointFormer。它采用3D脉冲驱动自注意力机制,将传统的矩阵乘法交互简化为纯加法操作。该设计不仅保留了端到端的脉冲计算特性,还大幅降低了训练与推理阶段的内存及时间开销,使其能够支撑大规模预训练,并在各类3D任务中展现出广泛的泛化能力。

三、实验结果

1. 3D零样本分类

在ModelNet40以及更具挑战性的大规模Obja verse-LVIS数据集上,SVL展现了卓越的零样本分类性能。例如,基于SVL预训练的E-3DSNN在ModelNet40上达到了85.4%的准确率,超越了众多ANN(如OpenShape、ULIP)及SNN基线模型,同时仅消耗0.79 mJ能量,参数量仅为17.7M。在Obja verse-LVIS上,我们的模型性能与ULIP-2相当,但能效提升了204倍。这充分证明了Rep-VLI模块在高效零样本推理方面的突出优势。

\

表1

2. 3D对象字幕生成与开放世界问答

我们将SVL训练的Spike-driven PointFormer与大语言模型结合,构建了SVL-13B模型。在3D对象字幕生成任务中,SVL-13B达到了与最先进ANN方法(如PointLLM)旗鼓相当的性能,这也是SNN首次应用于3D字幕生成。在开放世界3D问答中,模型能够准确理解物体的形状、材质、功能及上下文,展现出强大的常识推理与多模态对齐能力。

\

表2

3. 3D下游任务(分类、分割、检测与动作识别)

我们将SVL预训练的脉冲编码器在多个下游任务上进行了微调:

  • 3D分类:在ModelNet40和ScanObjectNN上,SVL预训练显著提升了准确率。例如,Spike PointNet在ScanObjectNN上的准确率从70.0%大幅提升至76.1%,提升了6.1%。
  • 3D分割与检测:在Semantic KITTI和KITTI数据集上,SVL预训练分别带来了1.2%和1.1%的性能提升。
  • 神经形态动作识别:在DVS Action和DVS128 Gesture数据集上,模型准确率分别提升了2.1%和1.6%,证明了SVL在时空特征提取方面的强劲能力。

\

表3

\

表4

4. 架构效率对比

与现有的脉冲点云Transformer相比,我们的Spike-driven PointFormer-S在训练速度上提升了最高达4.3倍,训练内存降低了4.1倍,同时在ModelNet40上取得了92.6%的高准确率,推理能耗仅为5.1 mJ,完美平衡了ANN级别的识别性能与SNN的能效优势。

图2

四、讨论与总结

本文提出了SVL,一种新颖的基于脉冲的视觉-语言预训练框架,赋予脉冲神经网络强大的开放世界3D理解能力,同时保留了其固有的高能效优势。通过多尺度三元对齐与可重参数化视觉-语言集成,SVL成功弥合了SNN低功耗与先进视觉-语言模型强泛化能力之间的鸿沟。

此外,我们提出的Spike-driven PointFormer作为首个全脉冲驱动的点云Transformer,进一步推动了SNN在复杂3D任务中的应用。SVL不仅在多项基准测试中刷新了SNN的SOTA成绩,更首次实现了SNN的开放世界3D问答,标志着脉冲系统在多模态表示学习领域迈出了重要一步。

来源:https://cloud.tencent.com.cn/developer/article/2700712

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
刚刚,OpenClaw和Cursor杀入手机!

刚刚,OpenClaw和Cursor杀入手机!

AI Agent,真的开始从电脑里“跑出来”了。以前我们用 Agent,基本离不开网页、IDE、终端、云环境。你想让它写代码、查资料、改项目、跑任务,很多时候还得坐在工位前盯着。但现在不一样了。OpenClaw 推出了 iOS 和安卓原生 App,手机可以变成私有 Agent 网络里的一个移动节点。

时间:2026-07-01 16:26
幻灯片排版优化AI智能助手,节省时间与精力

幻灯片排版优化AI智能助手,节省时间与精力

说起来,今天想和大家聊聊一个特别实在的话题:怎么用AI工具把PPT排版效率提上去,真正省下时间和精力。谁不想在忙忙碌碌的工作里找到点儿省事的诀窍呢?我有个朋友,为了准备一次重要汇报,连着熬了三个晚上折腾PPT,最后出来的效果也就是勉强及格。要是当时他能用上AI工具,结果会不会完全不一样?PPT排版优

时间:2026-07-01 16:23
AI排版软件让文档制作轻松又高效

AI排版软件让文档制作轻松又高效

AI智能排版工具通过自动识别文档结构、调整格式,显著提升排版效率。实际案例显示,文档处理时间可缩短约50%,项目交付效率提高40%。其功能涵盖自动排版、模板库、智能校对等,重构了文档制作流程,使用户专注内容创作,提升专业形象与市场竞争力。

时间:2026-07-01 16:23
Karpathy晒邮件曝光注意力机制真正起源:10年前三项独立研究

Karpathy晒邮件曝光注意力机制真正起源:10年前三项独立研究

2014年,三项研究几乎同时独立提出注意力机制:DzmitryBahdanau在YoshuaBengio实验室开发出RNNSearch(后称注意力),AlexGraves和JasonWeston团队也发表了类似机制。该思想源于解决循环神经网络信息瓶颈的需求,采用可微加权平均,成为深度学习核心算法。

时间:2026-07-01 16:23
如何选择AI排版工具与技巧提升内容创作效率

如何选择AI排版工具与技巧提升内容创作效率

AI排版工具推荐与技巧:如何提升内容创作效率与视觉设计效果其实,AI排版早已成为内容创作领域的热门话题。在信息爆炸的时代,大家都想知道如何让内容在海量信息中脱颖而出。简单来说,AI排版就是借助人工智能技术自动化处理文本、图像等内容的布局与设计。不妨想象一下:星巴克菜单上那些赏心悦目的排版,背后可能就

时间:2026-07-01 16:22
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜