深度学习LiDAR定位:L3-Net
深度学习LiDAR定位:L3-Net
摘要
本文提出L3-Net——一种新颖的基于学习的LiDAR定位系统,可实现厘米级的定位,与现有最高水平的传统定位算法相媲美。与传统定位算法不同,本文创新地实现了使用各种深度神经网络结构来建立基于学习的定位算法。首先,L3-Net会学习专门针对不同现实驾驶场景中的匹配而优化的局部描述,在解决方案空间中建立的成本量上的3D卷积显著提高了定位精度。其次,使用RNN对车辆动力学进行建模,从而获得更好的时间平滑度和准确性。然后,本文使用新收集的数据集全面验证了L3-Net的有效性。最后,本文使用了具有挑战的SunnyvaleBigLoop序列(在采集的地图和测试数据之间间隔了一年时间的序列)进行测试,测试结果表明,L3-Net在这些数据集中具有很低的定位误差,证明了其在实际工业实现中的成熟度。

背景及问题描述
传统LiDAR定位算法流程与基于学习的定位算法流程对比如图1所示。其中,传统算法的步骤通常是:特征描述(如点、平面、杆、2D栅格上基于高度的高斯特征等)、地图匹配、匹配误差的计算、空间搜索或优化(如全搜索或由粗到精的搜索,蒙特卡洛采样或迭代梯度下降最小化)。这些传统算法中,通常需要利用点云的几何特征、反射强度特征来进行配准或滤波,实现定位。常见的有基于ICP、NDT、直方图滤波、卡尔曼滤波等的定位算法。尽管其中一些算法具有不同场景下出色的准确性和鲁棒性,但通常需要大量的工程工作来调优流程中的每个模块,并设计硬编码的特征和匹配方法。此外,这些传统定位算法的系统类型对运行场景有很强的偏好。要使一个通用的定位系统能够适应所有具有挑战性的场景需要巨大的工程努力,这通常是极其困难的。

图 1 传统与基于学习的定位算法流程图
而基于学习的方法以数据驱动的方式为上述问题的解决开辟了一条全新的道路。
主要贡献
(1)根据作者了解,这是当时第一个基于学习的,用于自动驾驶的LiDAR定位框架,可直接处理点云并准确估计车辆的位置和方向,并能得到与当时最好的算法相媲美的效果。
(2)创新性的使用3D卷积学习如何调整x,y,yaw这三个维度上的匹配代价以提高定位精度
(3)将提出的算法在同一条道路上在不同时间进行了多次试验,并在各种城市道路上进行严格的测试;发布数据集,数据集包含超过380公里的真实交通驾驶场景的数据,适合定位任务。
主要原理及思路
L3-Net主要由Keypoint Selection、Descriptor Extraction、Cost Volume and 3D CNNs、Probability Offset Volume、以及Temporal Smoothness五个部分组成。输入为已构建的点云地图和行驶时的LiDAR观测数据。接下来分五个部分分别描述L3-Net的细节。L3-Net网络架构如图2所示:

图2 L3-Net的架构图
1、Keypoint Selection
3-Net中关键点选择方法是:
(1)选取邻域内满足一定密度的点。
(2)估算邻域内的点的线性度和散度,挑出具有强线性和散度的点作为候选关键点。
(3)根据组合的几何特性排序,并由高到低,选取最少数量的候选点作为关键点,同时确保这些新选出来的点各自与其它点保持一定空间距离。
2、Descriptor Extraction
描述子提取的方法为:
(1)为每一个关键点选取邻域内64个点,每个点包含x,y,z,r(reflection)四维数据,故一个关键点描述子的提取输入为64x4的张量。
(2)使用mini-PointNet对关键点特征进行提取,输出得到32维的描述子。
(3)使用参数共享机制为地图和实时点云数据提取特征。其中,mini-PointNet主要包含由3个堆叠的全连接层和一个最大池化层组成的多层感知机(MLP)。
3、Cost Volume and 3D CNNs
3.1、Cost Volume
匹配代价描述的是实时点云帧与地图之间的匹配误差。对于某一个关键点,计算匹配代价的方法为:
(1)给定一个预测的位姿,将局部的实时点云帧中的所有关键点变换到地图的全局坐标中。
(2)将预测位姿周围的空间分别按照x,y,yaw三个维度划分,得到以下解空间的采样:

(3)将关键点根据下式进行变换,并提取其在地图中的特征描述子。

(4)计算实时关键点的描述子与地图中的描述子之间的欧氏距离,将该距离作为匹配代价。
3.2、Regularization
正则化步骤通过构建3D卷积网络实现,这一步骤是为了提高收敛速度并避免过拟合问题。3D卷积网络由三个3D卷积层组成,前两个卷积层使用ReLU激活函数和批处理正则化,其中批处理包含来自单个帧的所有关键点。最后一个卷积层则直接输出解空间的匹配代价。
4、Probability Offset Volume
此部分作者引入概率偏移量来表述解空间所有关键点的一致性,也就是实时点云与地图在给定偏移量情况下的匹配代价量。计算概率偏移量的步骤是
(1)假设所有关键点是独立的,则在某一偏移下的匹配概率为:

(2)将所有关键点的偏移匹配概率累乘并取对数,得到在偏移为delta_T情况下实时点云与地图的整体匹配概率:

(3)通过reduce average操作将其边缘化为pasi的成本量。(4)接着通过softmax将上述成本量归一化,并作为整体的匹配概率。
(5)通过reduce sum操做分别提取x方向,y方向以及航向角pasi的偏移概率向量作为最终输出。
5、Temporal Smoothness
在传统算法中,直方图滤波可以通过历史的定位分布来推测当前的匹配定位分布,保证了时间平滑性。在本文中,作者引入RNNs来获得这一事件平滑效果,更具体的来说,是通过LSTM网络实现。
实验结果
从表1中的定位结果对比来看,L3-Net在各种场景下的定位精度都达到很高的水平,实现了厘米级定位。在小于0.1m的准确率上,均高于90%,性能稳定。通过是否使用RNN进行时间平滑来的对比看,经过RNN网络进行时间平滑后的定位精度有更大的提高。
表1 L3-Net点云定位算法与其他算法的对比

图3展示的是成本量、概率偏移量在固定偏航和选定关键点的(x,y)轴上可视化结果。可以看到,在使用概率偏移量表达定位匹配度后,匹配结果更加清晰明了。最右侧一栏是最终估计的偏移量(0.538m,0.993m,1.001°)及ground truth(0.524m,0.994m,1.044°)的对比。

图3 网络不同步骤的输出可视化
结论
作者提出了一种专为自动驾驶应用而设计的新颖的基于学习的LiDAR定位框架。该框架将传统定位流程中需要手动调整算法的模块替换为基于学习的深度神经网络,使得定位系统能够更具鲁棒性,定位精度也可以达到现有(2019)最高水平。
深度学习LiDAR定位:L3-Net的更多相关文章
- 2020厦门大学综述翻译:3D点云深度学习(Remote Sensiong期刊)
目录 摘要 1.引言: 2.点云深度学习的挑战 3.基于结构化网格的学习 3.1 基于体素 3.2 基于多视图 3.3 高维晶格 4.直接在点云上进行的深度学习 4.1 PointNet 4.2 局部 ...
- 【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
- [深度学习大讲堂]从NNVM看2016年深度学习框架发展趋势
本文为微信公众号[深度学习大讲堂]特约稿,转载请注明出处 虚拟框架杀入 从发现问题到解决问题 半年前的这时候,暑假,我在SIAT MMLAB实习. 看着同事一会儿跑Torch,一会儿跑MXNet,一会 ...
- 【腾讯Bugly干货分享】深度学习在OCR中的应用
本文来自于腾讯bugly开发者社区,未经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/5809bb47cc5e52161640c5c8 Dev Club 是一个交流移动 ...
- #Deep Learning回顾#之基于深度学习的目标检测(阅读小结)
原文链接:https://www.52ml.net/20287.html 这篇博文主要讲了深度学习在目标检测中的发展. 博文首先介绍了传统的目标检测算法过程: 传统的目标检测一般使用滑动窗口的框架,主 ...
- (转)神经网络和深度学习简史(第一部分):从感知机到BP算法
深度|神经网络和深度学习简史(第一部分):从感知机到BP算法 2016-01-23 机器之心 来自Andrey Kurenkov 作者:Andrey Kurenkov 机器之心编译出品 参与:chen ...
- 【转】贾扬清:希望Caffe成为深度学习领域的Hadoop
[转:http://www.csdn.net/article/2015-07-07/2825150] 在深度学习(Deep Learning)的热潮下,Caffe作为一个高效.实用的深度学习框架受到了 ...
- paper 53 :深度学习(转载)
转载来源:http://blog.csdn.net/fengbingchun/article/details/50087005 这篇文章主要是为了对深度学习(DeepLearning)有个初步了解,算 ...
- 从Image Caption Generation理解深度学习
0. 前面的话 建丁让我写一篇深度学习相关小文章,目标读者是国内的开发者.刚接到这个任务时我是颇为忐忑的,写文章要讲究厚积薄发,如果“水之积也不厚”,“则其负大舟也无力”.因为我自知水平很有限,又不是 ...
随机推荐
- python中实现打印特定字符变换
首先需要将 lib文件 放在该文件同一目录 使用的时候,先导入 from lib.common import print_msg ,然后调用里面的 print_msg() 方法即可! lib文件地址: ...
- Win64 驱动内核编程-6.内核里操作注册表
内核里操作注册表 RING0 操作注册表和 RING3 的区别也不大,同样是"获得句柄->执行操作->关闭句柄"的模式,同样也只能使用内核 API 不能使用 WIN32 ...
- Linux提权之利用 /etc/passwd 文件
当我们获得了某个Linux服务器的低权限之后,我们想要对该低权限账号进行提权,以执行更多的操作. 接下来我们的提权是利用 /etc/passwd 文件的可写入权限,导致我们写入一个其他用户进去. 首先 ...
- jquery中定义数组并给数组赋值后转为json格式为[]问题的解决
一.问题描述:jquery定义一个空数组,并赋值,结果转为json格式后打印值为空 我原本是这样写的,但是show_data值一直为[] var export_data = [];export_dat ...
- 2021/5/11 docker的应用
很快一天过去了,今天虽然没有加班,但是依旧感觉疲惫,弄了一天的docker镜像的问题.作为一名前端开发工程师从以前从未听说过docker到现在懂得了如何运用,也是不容易啊.之前也说过,我们项目结构是前 ...
- KMP板子(其实还没完全懂...)
KMP模板 1.next数组的实际含义 next数组从-1开始,主串a,子串b,next[j]=k,满足b[0,k-1]==b[j-k,j-1],k同时也为b子串前缀的下标,j为b子串后缀的下标 ge ...
- [在学习Django框架之前所需要了解的知识点]
[在学习Django框架之前所需要了解的知识点] Web框架本质 我们可以这样理解:所有的Web应用本质上就是一个socket服务端,而用户的浏览器就是一个socket客户端. 这样我们就可以自己实现 ...
- 简单聊聊内存逃逸 | 剑指offer - golang
问题 简单讲讲golang的内存逃逸吗? 解析 什么是内存逃逸 在程序中,每个函数块都会有自己的内存区域用来存自己的局部变量(内存占用少).返回地址.返回值之类的数据,这一块内存区域有特定的结构和寻址 ...
- Linux命令nohup实现命令后台运行并输出到或记录到日志文件
Linux命令nohup实现命令后台运行并输出到或记录到日志文件 导读 我们在调试程序的时候,免不了要去抓一些 log ,然后进行分析.如果 log 量不是很大的话,那很简单,只需简单的复制粘贴就好. ...
- iozone测试方法-20191008
iozone 一.简介 磁盘设备之上是文件系统,测试磁盘的工具往往就是调用驱动块设备驱动的接口进行读写测试.而文件系统的测试软件就是,针对文件系统层提供的功能进行测试,包括文件的打开关闭速度以及顺 ...