数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

浙江大学ScoreLiDAR技术实现激光雷达场景补全提速5倍

AI热点日报时间：2026-05-13

热点解读

自动驾驶汽车的安全行驶，高度依赖于对周围环境的精准感知。激光雷达（LiDAR）作为核心传感器，通过扫描生成描述环境的三维点云。然而，原始点云数据往往存在稀疏性问题，如同视野中存在大量空洞，限制了环境信息的完整性。为了解决这一问题，激光雷达场景补全技术应运而生，其目标是通过算法“推理”出缺失的部分，

自动驾驶汽车的安全行驶，高度依赖于对周围环境的精准感知。激光雷达（LiDAR）作为核心传感器，通过扫描生成描述环境的三维点云。然而，原始点云数据往往存在稀疏性问题，如同视野中存在大量空洞，限制了环境信息的完整性。

浙江大学团队让激光雷达场景补全提速5倍：ScoreLiDAR让自动驾驶

为了解决这一问题，激光雷达场景补全技术应运而生，其目标是通过算法“推理”出缺失的部分，为车辆决策提供更完整、清晰的三维世界模型。近期，该领域取得显著进展。由浙江大学计算机科学与技术学院主导，联合北京大学等机构的研究团队，提出了一种名为ScoreLiDAR的创新方法。该方法不仅能生成高质量的完整场景，更关键的是，其处理效率相比当前最优技术提升了5倍以上。这项重要研究成果已被2025年的ICLR会议收录。

一、当扩散模型遭遇效率挑战

目前，基于扩散模型的方案（如LiDiff）是激光雷达场景补全的主流方法。这类模型的工作原理类似于一位精雕细琢的画家：从一张充满噪声的草图开始，经过数十次甚至上百次的迭代去噪与细化，最终得到一幅精细的完整画面。虽然生成质量高，但耗时巨大——处理单帧数据常需30秒以上。这对于需要毫秒级响应的自动驾驶实时感知系统而言，速度瓶颈十分突出。

那么，能否训练出一个既能保持高质量，又能实现快速生成的“高效模型”呢？ScoreLiDAR的核心思路正是基于此：通过知识蒸馏技术，将庞大、缓慢的扩散模型（教师模型）所具备的复杂生成能力，高效地迁移到一个轻量、快速的学生网络中。

二、双向指导：协同优化的教学范式

ScoreLiDAR的首要创新在于其“双向梯度指导机制”。可以想象，学生模型在学习过程中，同时接受两位“老师”从不同维度的指导。

第一位是“正向教师”，即预训练好的高性能扩散模型。它拥有对真实世界数据分布的深刻理解，能够指导学生当前的输出应向哪个方向优化，以更贴近真实场景。

第二位是“反向教师”，或称辅助扩散模型。它专门针对学生模型自身的输出特性进行训练，能够敏锐地识别出生成结果中不自然或不合理的部分，并提供针对性反馈。

学生模型通过综合这两位老师的梯度反馈，获得了更稳定、更精准的优化方向。这种双向指导机制有效避免了单一教师可能存在的偏差，使学生模型能够更高效地掌握场景补全的核心能力，从而绕过了原始扩散模型耗时的多步迭代去噪过程。

三、结构化损失：守护三维几何本质

然而，仅仅引入知识蒸馏并不足够。研究团队发现，直接将为二维图像设计的蒸馏方法应用于三维点云，效果会显著下降——补全的场景容易丢失细节，显得模糊或结构松散。

问题的根源在于，三维点云蕴含着复杂的空间几何关系，而通用的蒸馏损失函数难以有效捕捉这种结构信息。为此，团队专门设计了一个“结构化损失函数”，它如同一位严谨的工程师，同时把控宏观布局与微观特征。

该损失函数包含两个关键层次：

场景级损失：确保整体结构的正确性。它通过计算生成场景中每个点到真实场景最近邻点的距离，保证补全后的大体轮廓和物体位置基本准确。这类似于确保建筑的主体框架正确无误。

点级损失：确保关键几何特征的保真度。团队采用了一种基于曲率的关键点筛选策略。简单来说，曲率高的点通常位于物体的边缘、拐角等特征显著区域。损失函数会重点约束这些关键点之间的相对位置关系，从而确保补全后，车辆的棱角、建筑物的轮廓等细节特征得以清晰保留。

这种双重约束机制，使得学生模型在追求推理速度的同时，牢牢守住了三维场景的几何结构真实性。

四、训练与性能：效率与质量兼得

ScoreLiDAR采用了一种巧妙的交替优化训练策略：辅助模型学习评估学生模型的输出质量；学生模型则根据双向梯度指导和结构化损失进行更新。两者相互促进，训练过程收敛迅速，在单张A40 GPU上仅需约10分钟即可完成。

在SemanticKITTI和KITTI-360这两个自动驾驶领域权威数据集上的评测结果，充分验证了其卓越性能：

速度飞跃：场景补全耗时从约30秒大幅缩短至约5秒，实现了超过5倍的加速。
质量领先：在衡量生成质量的Chamfer Distance和Jensen-Shannon Divergence关键指标上，ScoreLiDAR均超越了之前的标杆方法LiDiff。这意味着它在显著提速的同时，生成了更接近真实分布的高质量点云。
主观优评：在用户研究中，65%的参与者认为ScoreLiDAR的补全结果比LiDiff的更加真实可信。

一个典型的案例是，在某个测试场景中，原始稀疏点云仅显示了一辆车的部分点，而ScoreLiDAR成功推理并补全了被严重遮挡的第二辆车的完整形态，与真实情况高度一致。这种对遮挡物体的恢复能力，对于提升自动驾驶系统的安全冗余至关重要。

五、优势、局限与未来展望

ScoreLiDAR的成功，关键在于其针对三维点云数据的特性进行了专门化设计。与那些仅追求加速的通用蒸馏方法相比，其结构化损失函数有效保障了几何信息的完整性。相较于传统的非扩散模型方法（如某些基于体素的方法），它在生成质量上又具备明显优势。

当然，技术仍在发展。ScoreLiDAR的性能在一定程度上依赖于教师模型的质量。此外，在点云极度稀疏或场景异常复杂的极端情况下，偶尔可能出现“过度补全”（即在空白区域生成少量多余点）的现象。当前工作主要聚焦于几何结构的补全，未来可进一步探索结合语义信息的补全（即同时知道补全的物体是车辆、行人还是建筑）。

尽管如此，这项研究为激光雷达场景补全技术的实际应用落地开辟了新的路径。将处理时间从“数十秒级”推进到“数秒级”，使其能够更好地与自动驾驶系统的规划、控制等模块进行实时协同。研究团队已公开相关代码，这将有力推动该技术在学术界与工业界的进一步验证、优化与应用。

自动驾驶的“感知之眼”正变得更加迅捷与敏锐。当生成一幅高精度三维环境地图仅需数秒时，车辆应对复杂、动态和存在遮挡的行车环境，将拥有更强大的感知保障与安全底气。

Q&A

Q1：ScoreLiDAR相比现有技术快多少？
A：实现了超过5倍的性能加速。例如在SemanticKITTI数据集上，单帧点云补全时间从30.55秒大幅降低至5.37秒。

Q2：ScoreLiDAR的核心技术原理是什么？
A：其核心技术是“双向梯度指导机制”与“结构化损失函数”。前者通过教师模型与辅助模型协同指导学生模型优化；后者通过场景级和点级双重几何约束，确保补全结果的真实性与结构准确性。

Q3：ScoreLiDAR在自动驾驶中有什么实际应用价值？
A：它能显著提升自动驾驶系统处理稀疏激光雷达点云的效率与精度。更快的补全速度有利于实现实时环境感知与决策；更准确的补全结果能帮助系统有效识别被部分遮挡的障碍物（如车辆、行人），从而增强行车安全性，降低感知盲区风险。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：浙江大学ScoreLiDAR技术实现激光雷达场景补全提速5倍要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.techwalker.com/2026/0305/3180295.shtml

Core

上一篇：KAIST团队突破AI推理瓶颈：让机器学会反思与纠错

下一篇：小红书AI团队研发2B参数模型实现文档OCR技术突破

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。