ORBSLAM2单目初始化过程
ORBSLAM2单目初始化过程
转自博客:https://blog.csdn.net/zhubaohua_bupt/article/details/78560966
ORB单目模式的初始化过程可以分为以下四个阶段:
1 通过匹配选取两个可以作为起始两帧的初始帧
2 根据匹配计算两帧之间的位姿
3 三角化测量初始的特征点云深度,进而获得点云地图。
4 BA优化初始点云
在初始化后,单目模式和双目及RGBD模式一样,都是通过PNP来计算位姿。
下面,说一下初始化算法的步骤:
第一阶段:选取两个可以作为起始两帧的初始帧
这一阶段做的工作是,选取是两个特征点数目大于100的两个连续帧,并进行匹配,
只有当前后帧匹配点对比较多时(代码>100),才认为这两帧可以进行初始化并记录下来两帧的匹配关系,
接下来开始尝试求取两帧之间的位姿。
否则从头开始,重新开始尝试初始化。
第二阶段:根据匹配计算两帧之间的位姿
ORB实现的是自动初始化,也就是,无论场景平面,还是普通场景,都能完成初始化工作。
其做法是同时计算适用于平面场景的单应性矩阵(H)和适用于普通场景的基础矩阵(F),
方法是:
首先,由抽样点对,计算出单次抽样的H和F矩阵(DLT,八点法);通过若干次RANSAC抽样,
计算出最优的H和F矩阵;
然后,通过一定机制比较H和F矩阵,选择最优的矩阵,恢复出来帧间位姿。
并行计算两个模型:
在两个线程上并行计算单映射矩阵模型和基础矩阵模型 :
为了使两个模型的计算流程尽量一样,用于计算H和F矩阵的迭代循环次数预先设置成一样(代码中为200次),
每次用迭代计算的匹配特征点对也是一样的。基础矩阵是8个特征点对,单映矩阵是其中的4个特征点对。
从若干次RANSAC中,计算出最优的H和F矩阵:
每次迭代中,给每个模型M(H表示单映射,F表示基本矩阵)计算一个分值SM:
其中
TM是无效数据的排除阈值,
它的依据是卡方测试的95%(TH=5.99, TF=3.84,假设在测量误差上有1个像素的标准偏差)。
TM等于TH,这样,对于同一个重投影误差d,两个模型求取的分值相同。
模型M越准,所有匹配点对的重投影误差越小,SM的值就越大。
因此SM的值反映了一个这样的问题,当其越大时,模型M越准确。
我们从单映射矩阵和基本矩阵的计算中选择分值最高的,分别记作为SH和SF,
但如果两个模型分值都不高(意味着没有足够的局内点),就重新选择第二帧,重新匹配并尝试初始化。
模型选择(用基础矩阵还是用单应性矩阵?)
如果场景是平面,近平面或存在低视差的情况,则可以通过单映矩阵来求解。
同样地,我们也可以找到一个基础矩阵,但问题是基础矩阵不能够很好的约束该问题,而且从基础矩阵中计算得到的运动结果是错误的。在这种情况下,我们应该选择单映矩阵才能保证地图初始的正确性,或者如果检测到低视差的情况则不进行初始化工作。
另一方面,对于非平面场景且有足够的视差的情况则可以通过基础矩阵来计算,
而在这种情况下单映矩阵只有基于平面点或者低视差的匹配点才能找到。因此,
在这种情况下我们应该选择基础矩阵。我们利用如下强大的启发式进行计算:
如果RH>0.45 ,这表示二维平面和低视差的情况,我们将选择计算单应矩阵。其他的情况,我们选择基础矩阵。
从模型恢复位姿
一旦选择好模型,我们就可以获得相应的运动状态。如果选择单映矩阵,我们按照Faugeras等人发表的论文中提到的方法,提取8种运动假设,该方法提出用cheriality测试来选择有效解。
然而,如果在低视差的情况下,这些测试就会失效,因为云点很容易在相机的前面或后面移动,会导致选解错误。我们提出的方法是直接按这8种解将二维点三角化,然后检查是否有一种解可以使得所有的云点都位于两个相机的前面,且重投影误差较小。如果没有一个最优的解,我们就不执行初始化,否则重新选择第二帧,重新匹配并尝试初始化。
这种方法使初始化程序在低视差和两个交叉的视图情况下更具鲁棒性,这也是我们整个算法体现鲁棒性的关键所在。
在基本矩阵的情况下,我们使用标定矩阵K用下式将其转换为本证矩阵:
然后奇异值分解方法计算4个运动解,然后就像上文中叙述的一样,我们将四个解用于三角化特征点,以选择正解。
第三阶段:三角化测量初始的特征点云深度,进而获得点云地图。
一旦恢复出两帧之间位姿(单目无尺度),就可以求解匹配点对的深度(无尺度),求解时可以以任意一帧为基坐标系,由于这里是要以做SLAM,所以以第一帧为世界坐标系。代码中采用多视图几何书中11.2线性三角形法中的齐次方法(DLT)进行三角测量恢复匹配点对应的三维信息。
基本原理如下,已知一组匹配点分别在两幅图像中的二维坐标,利用叉乘为0可以代表共线的几何属性和帧间位姿,构建一个AX=0的方程,其中X是大小4x1向量,是该匹配点对所对应的三维点的齐次表示。然后通过SVD分解来求方程AX=0,对此方程SVD分解本身具有最小二乘效果,可以解决在解方程时,由位姿噪声带来的问题。其基本思想和http://blog.csdn.net/zhubaohua_bupt/article/details/74926111一致。
第四阶段: 对以上恢复的点云和位姿做 Bundleadjustment
最后执行一个全局BA,以优化初始重构得到的点云地图。
以上内容来自于ORBSLAM论文和源码。
ORBSLAM2单目初始化过程的更多相关文章
- ORB-SLAM3 细读单目初始化过程(上)
作者:乔不思 来源:微信公众号|3D视觉工坊(系投稿) 3D视觉精品文章汇总:https://github.com/qxiaofan/awesome-3D-Vision-Papers/ 点击上方&qu ...
- ORB-SLAM2 论文&代码学习 —— 单目初始化
转载请注明出处,谢谢 原创作者:Mingrui 原创链接:https://www.cnblogs.com/MingruiYu/p/12358458.html 本文要点: ORB-SLAM2 单目初始化 ...
- ORB-SLAM (四)tracking单目初始化
单目初始化以及通过三角化恢复出地图点 单目的初始化有专门的初始化器,只有连续的两帧特征点均>100个才能够成功构建初始化器. ); 若成功获取满足特征点匹配条件的连续两帧,并行计算分解基础矩阵和 ...
- ORB-SLAM (四)Initializer单目初始化
一. 通过对极约束并行计算F和H矩阵初始化 VO初始化目的是为了获得准确的帧间相对位姿,并通过三角化恢复出初始地图点.初始化方法要求适用于不同的场景(特别是平面场景),并且不要进行人为的干涉,例如选取 ...
- 单目、双目和RGB-D视觉SLAM初始化比较
无论单目.双目还是RGB-D,首先是将从摄像头或者数据集中读入的图像封装成Frame类型对象: 首先都需要将彩色图像处理成灰度图像,继而将图片封装成帧. (1) 单目 mCurrentFrame = ...
- 【Spring源码分析】非懒加载的单例Bean初始化过程(下篇)
doCreateBean方法 上文[Spring源码分析]非懒加载的单例Bean初始化过程(上篇),分析了单例的Bean初始化流程,并跟踪代码进入了主流程,看到了Bean是如何被实例化出来的.先贴一下 ...
- 基于OpenCV单目相机的快速标定--源码、工程、实现过程
相机的标定是所有人走进视觉世界需要做的第一件事,辣么多的视觉标定原理解释你可以随便在网上找到,这里只讲到底如何去实现,也算是给刚入门的朋友做个简单的分享. 1.单目相机标定的工程源码 首先请到同性交友 ...
- Spring源码分析:非懒加载的单例Bean初始化过程(下)
上文Spring源码分析:非懒加载的单例Bean初始化过程(上),分析了单例的Bean初始化流程,并跟踪代码进入了主流程,看到了Bean是如何被实例化出来的.先贴一下AbstractAutowireC ...
- Ubuntu16.04下编译安装及运行单目ORBSLAM2
官网有源代码和配置教程,地址是 https://github.com/raulmur/ORB_SLAM2 1 安装必要工具 首先,有两个工具是需要提前安装的.即cmake和Git. sudo apt- ...
随机推荐
- git push error. ! [rejected] master -> master (non-fast-forward)
错误提示: Cheetah@xxxx MINGW64 /e/Projs/enft/data/cv_key_frame (master) $ git push To github.com:Anthony ...
- shim和polyfill 区别解释
polyfill 是 shim 的一种.shim 是将不同 api 封装成一种,比如 jQuery 的 $.ajax 封装了 XMLHttpRequest 和 IE 用 ActiveXObject 方 ...
- bootstrap环境搭建
Bootstrap 是stwitter公司的两名前端设计师设计的基于html css javascript的超强的前端框架. Bootstrap 是一移动设备为优先,pc机,平板,手机皆适用的框架. ...
- ReactNative使用 react-navigation 详解
react-navigation是官方主推的导航组件,致力于解决导航卡顿,数据传递,Tabbar和navigator布局,支持redux. 最新版本为3.x,大多文档介绍的是 1.x 或 2.x 的用 ...
- PHP原生EXCEL导出带样式无插件无乱码实现
PHP原生EXCEL导出 经测试 带样式 无插件 无乱码,不需要引入任何插件,不需要修改任何编码 (使用时只需要修改引入php数据库配置文件.修改thead tbody中的数据即可.根据自己的需要去接 ...
- day14-python之集合函数字符串格式化
1.集合 #!/usr/bin/env python # -*- coding:utf-8 -*- # s=set(['alex','alex','sb']) # print(s) # s=set(' ...
- flutter入门之常见的flutter问题汇总(转)
1. 使用AppBar后如何去掉左边的返回箭头.左边的图标对应的是leading,源代码如下(吐槽一下,CSDN暂不支持dart语言): Widget leading = widget.leading ...
- reinterpret
reinterpret意为“重新解释” reinterpret_cast是C++中与C风格类型转换最接近的类型转换运算符.它让程序员能够将一种对象类型转换为另一种,不管它们是否相关. reinterp ...
- code first从入门到伪精通
新入职一家公司,虽然之前也用ef,但是方式不一样,之前用的db,现在用代码先行的code,基于现有公司基本项目框架都是用的code,所以一步登顶,从最实战的角度去操作code,心颤的很,废话不多说,开 ...
- Flink原理(一)——基础架构
Flink系列博客,基于Flink1.6,打算分为三部分:原理.源码.实例以及API使用分析,后期等系列博客完成后再弄一个目录. 该系列博客是我自己学习过程中的一些理解,若有不正确.不准确的地方欢迎大 ...