当前位置: 首页
业界动态
ICRA 2026机器人控制KAN We Flow?

ICRA 2026机器人控制KAN We Flow?

热心网友 时间:2026-05-29
转载

先给出几个核心判断:在机器人三维操作领域,扩散策略虽然具备较强的建模能力,但推理速度慢、模型体积大,落地难度几乎是行业共识。流匹配策略虽然已经取得一定进展,但大多数方法仍然死守UNet骨干架构,计算负担和推理延迟依然居高不下。

那么,有没有可能在保持性能的同时,把模型做得更小、跑得更快?

ICRA 2026|KAN We Flow?(机器人控制)

一、整体概述

本文要介绍的KAN-We-Flow,正是针对这一问题提出的解决方案。它的思路非常直接:用RWKV加KAN替代传统的大规模UNet骨干网络。结果如何?参数量削减了约86.8%,推理延迟压缩到毫秒级,关键在于——成功率不仅没有下降,反而在Adroit、Meta-World、DexArt三个主流基准上取得了当前最优或并列最优的成绩。

可以这样理解:在保持甚至提升操作精度的前提下,将模型从“重型卡车”换成了“跑车”,并且真正实现了实时控制。

ICRA 2026|KAN We Flow?(机器人控制)

二、研究背景

先来看一下这个领域目前面临的主要瓶颈。

扩散式策略的优点在于动作分布建模能力强,生成的动作更加平滑自然。但代价也很明显:多步去噪、推理慢、模型重,一旦部署到真实机器人上,延迟根本无法承受。

流匹配策略算是一个改进方向,它通过学习一步向量场实现快速生成。然而,现有的流匹配方法依然普遍依赖UNet这类庞大结构,计算和存储开销仍然不小。

因此核心问题其实非常明确:如何在保证精度的前提下,进一步压缩模型大小,同时提升实时性?

ICRA 2026|KAN We Flow?(机器人控制)

三、动机直觉

讲完问题,再看驱动这个方案的直觉。其实并不复杂:

RWKV的线性复杂度时序建模能力,天然适合机器人的长时序动作预测;而KAN通过可学习的一维函数逼近,可以用更少的参数表达更复杂的非线性映射。将两者结合,目标就是同时解决“长时序依赖”和“参数效率”这两个痛点。

换句话说,与其在UNet的大框架下修修补补,不如直接换一个更轻量、更高效的骨干架构。

ICRA 2026|KAN We Flow?(机器人控制)

四、技术路线

整体框架遵循“一致性流匹配”路线,目标是实现一步动作生成。输入包括点云感知信息、机器人当前状态以及时间编码。

核心网络部分采用RWKV-KAN骨干架构。其中,RWKV负责时间与通道混合,专门建模动作序列的上下文;GroupKAN则对特征通道进行分组,做非线性的函数校准,直接替代传统MLP。

值得特别提及的是Action Consistency Regularization(ACR)。它通过欧拉外推,让一步预测的动作在末端与专家轨迹对齐。这相当于在训练阶段提供了一层额外的监督,能稳定训练,关键是——推理阶段完全没有任何额外开销。

最终的学习目标也很清晰:把一致性流匹配损失与ACR正则项联合起来进行端到端训练。

ICRA 2026|KAN We Flow?(机器人控制)

五、实验结果

从性能来看,在Adroit、Meta-World、DexArt三个基准上,KAN-We-Flow的整体成功率均优于FlowPolicy和DP3。尤其在高难度、长时序的任务上,优势更为明显。

效率方面的数字更直观:参数量约33.6M,相比DP3减少86.8%;推理时间仅8到11毫秒,足以支撑100Hz的实时控制。

消融实验的结果也符合预期:RWKV、GroupKAN和ACR三个组件对性能都有稳定的正向增益。其中,ACR在长预测窗口下能够明显抑制动作漂移问题。

来源:https://www.leiphone.com/category/robot/LO83pDQxVKyCGICF.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
苹果人工智能服务器芯片Baltra或将用于执行推理任务

苹果人工智能服务器芯片Baltra或将用于执行推理任务

苹果一贯的策略是:只要技术条件允许,就会将关键环节牢牢掌握在自己手中。早在2024年,业内就多次传出消息称,苹果正与博通合作开发一款AI服务器芯片,内部代号为Baltra。根据当时的报道,这款芯片将采用台积电的3纳米N3E工艺,整个设计周期预计在12个月内完成。如今,Baltra已不再是传闻中的概念

时间:2026-07-03 14:00
蝉联全球AR智能眼镜第一 雷鸟创新Q3海外增长近四倍

蝉联全球AR智能眼镜第一 雷鸟创新Q3海外增长近四倍

2025年12月15日,Counterpoint Research发布的季度报告为全球AR眼镜市场竞争格局增添了全新注脚。数据显示,中国品牌雷鸟创新(RayNeo)以24%的市场份额,连续两个季度稳居全球AR智能眼镜榜首。与此同时,IDC、CINNO Research等多家权威机构的报告均指向同一结

时间:2026-07-03 13:59
当虹科技打造可落地机器人学长逛校园教育场景

当虹科技打造可落地机器人学长逛校园教育场景

12月10日至11日,杭州第二中学2025学术节上,一位特殊的“学长”成为全校师生争相围观的焦点。这台搭载当虹科技“机器人+教育”场景解决方案的人形机器人,不仅能在校园内自主行走、与人流畅对话,更自带一股亲切的“学霸”气质——师生们热情地称它为“二中智兔”。说实话,当一台机器人站在校门口主动向你问好

时间:2026-07-03 13:59
晶科电子荣获多项权威奖项技术引领全球加速彰显LED+智能视觉成长价值

晶科电子荣获多项权威奖项技术引领全球加速彰显LED+智能视觉成长价值

先说说核心判断:晶科电子这一轮接连荣获四项重磅奖项,覆盖权威媒体、产业机构与资本市场,这背后不仅仅体现了公司在技术与布局上的深厚积累,更反映出港股市场对硬科技制造赛道价值认知的一次系统性修复。 近一个月内,广东晶科电子股份有限公司(简称:晶科电子,股票代码:2551 HK)连续斩获四个具有分量的荣誉

时间:2026-07-03 13:59
上海海思谛听筑芯 智能穿戴腕上革命新标杆

上海海思谛听筑芯 智能穿戴腕上革命新标杆

智能穿戴领域的竞争发展到今天,早已不再单纯比拼硬件参数。真正的较量,在于生态融合的能力和系统整体的体验。 不妨听听当下消费者在追问什么——我的手表能不能更懂我?它的健康监测是否真正可靠?脱离手机后,它还能独立、智能地替我处理事务吗?这些问题的答案,其实并不取决于某一颗传感器有多强,或者某一块屏幕有多

时间:2026-07-03 13:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜