一起做RGB-D SLAM 第二季 (二)
本节目标
我们要实现一个基本的文件IO,用于读取TUM数据集中的图像。顺带的,还要做一个参数文件的读取。
设计参数文件读取的类:ParameterReader
首先,我们来做一个参数读取的类。该类读取一个记录各种参数文本文件,例如数据集所在目录等。程序其他部分要用到参数时,可以从此类获得。这样,以后调参数时只需调整参数文件,而不用重新编译整个程序,可以节省调试时间。
这种事情有点像在造轮子。但是既然咱们自己做slam本身就是在造轮子,那就索性造个痛快吧!
参数文件一般是用yaml或xml来写的。不过为了保持简洁,我们就自己来设计这个文件的简单语法吧。一个参数文件大概长这样:
# 这是一个参数文件
# 这虽然只是个参数文件,但是是很厉害的呢!
# 去你妹的yaml! 我再也不用yaml了!简简单单多好! # 数据相关
# 起始索引
start_index=1
# 数据所在目录
data_source=/home/xiang/Documents/data/rgbd_dataset_freiburg1_room/ # 相机内参 camera.cx=318.6
camera.cy=255.3
camera.fx=517.3
camera.fy=516.5
camera.scale=5000.0
camera.d0=0.2624
camera.d1=-0.9531
camera.d2=-0.0054
camera.d3=0.0026
camera.d4=1.1633
parameters.txt
语法很简单,以行为单位,以#开头至末尾的都是注释。参数的名称与值用等号相连,即 名称=值 ,很容易吧!下面我们做一个ParameterReader类,来读取这个文件。
在此之前,先新建一个 include/common.h 文件,把一些常用的头文件和结构体放到此文件中,省得以后写代码前面100行都是#include:
include/common.h:
#ifndef COMMON_H
#define COMMON_H /**
* common.h
* 定义一些常用的结构体
* 以及各种可能用到的头文件,放在一起方便include
*/ // C++标准库
#include <iostream>
#include <fstream>
#include <vector>
#include <map>
#include <string>
using namespace std; // Eigen
#include <Eigen/Core>
#include <Eigen/Geometry> // OpenCV
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/calib3d/calib3d.hpp> // boost
#include <boost/format.hpp>
#include <boost/timer.hpp>
#include <boost/lexical_cast.hpp> namespace rgbd_tutor
{ // 相机内参模型
// 增加了畸变参数,虽然可能不会用到
struct CAMERA_INTRINSIC_PARAMETERS
{
// 标准内参
double cx=, cy=, fx=, fy=, scale=;
// 畸变因子
double d0=, d1=, d2=, d3=, d4=;
}; // linux终端的颜色输出
#define RESET "\033[0m"
#define BLACK "\033[30m" /* Black */
#define RED "\033[31m" /* Red */
#define GREEN "\033[32m" /* Green */
#define YELLOW "\033[33m" /* Yellow */
#define BLUE "\033[34m" /* Blue */
#define MAGENTA "\033[35m" /* Magenta */
#define CYAN "\033[36m" /* Cyan */
#define WHITE "\033[37m" /* White */
#define BOLDBLACK "\033[1m\033[30m" /* Bold Black */
#define BOLDRED "\033[1m\033[31m" /* Bold Red */
#define BOLDGREEN "\033[1m\033[32m" /* Bold Green */
#define BOLDYELLOW "\033[1m\033[33m" /* Bold Yellow */
#define BOLDBLUE "\033[1m\033[34m" /* Bold Blue */
#define BOLDMAGENTA "\033[1m\033[35m" /* Bold Magenta */
#define BOLDCYAN "\033[1m\033[36m" /* Bold Cyan */
#define BOLDWHITE "\033[1m\033[37m" /* Bold White */ } #endif // COMMON_H
common.h
嗯,请注意我们使用rgbd_tutor作为命名空间,以后所有类都位于这个空间里。然后,文件里还定义了相机内参的结构,这个结构我们之后会用到,先放在这儿。接下来是include/parameter_reader.h:
#ifndef PARAMETER_READER_H
#define PARAMETER_READER_H #include "common.h" namespace rgbd_tutor
{ class ParameterReader
{
public:
// 构造函数:传入参数文件的路径
ParameterReader( const string& filename = "./parameters.txt" )
{
ifstream fin( filename.c_str() );
if (!fin)
{
// 看看上级目录是否有这个文件 ../parameter.txt
fin.open("."+filename);
if (!fin)
{
cerr<<"没有找到对应的参数文件:"<<filename<<endl;
return;
}
} // 从参数文件中读取信息
while(!fin.eof())
{
string str;
getline( fin, str );
if (str[] == '#')
{
// 以‘#’开头的是注释
continue;
}
int pos = str.find('#');
if (pos != -)
{
//从井号到末尾的都是注释
str = str.substr(, pos);
} // 查找等号
pos = str.find("=");
if (pos == -)
continue;
// 等号左边是key,右边是value
string key = str.substr( , pos );
string value = str.substr( pos+, str.length() );
data[key] = value; if ( !fin.good() )
break;
}
} // 获取数据
// 由于数据类型不确定,写成模板
template< class T >
T getData( const string& key ) const
{
auto iter = data.find(key);
if (iter == data.end())
{
cerr<<"Parameter name "<<key<<" not found!"<<endl;
return boost::lexical_cast<T>( "" );
}
// boost 的 lexical_cast 能把字符串转成各种 c++ 内置类型
return boost::lexical_cast<T>( iter->second );
} // 直接返回读取到的相机内参
rgbd_tutor::CAMERA_INTRINSIC_PARAMETERS getCamera() const
{
static rgbd_tutor::CAMERA_INTRINSIC_PARAMETERS camera;
camera.fx = this->getData<double>("camera.fx");
camera.fy = this->getData<double>("camera.fy");
camera.cx = this->getData<double>("camera.cx");
camera.cy = this->getData<double>("camera.cy");
camera.d0 = this->getData<double>("camera.d0");
camera.d1 = this->getData<double>("camera.d1");
camera.d2 = this->getData<double>("camera.d2");
camera.d3 = this->getData<double>("camera.d3");
camera.d4 = this->getData<double>("camera.d4");
camera.scale = this->getData<double>("camera.scale");
return camera;
} protected:
map<string, string> data;
}; }; #endif // PARAMETER_READER_H
parameter_reader.h
为保持简单,我把实现也放到了类中。该类的构造函数里,传入参数文件所在的路径。在我们的代码里,parameters.txt位于代码根目录下。不过,如果找不到文件,我们也会在上一级目录中寻找一下,这是由于qtcreator在运行程序时默认使用程序所在的目录(./bin)而造成的。
ParameterReader 实际存储的数据都是std::string类型(字符串),在需要转换为其他类型时,我们用 boost::lexical_cast 进行转换。
ParameterReader::getData 函数返回一个参数的值。它有一个模板参数,你可以这样使用它:
double d = parameterReader.getData<double>("d");
如果找不到参数,则返回一个空值。
最后,我们还用了一个函数返回相机的内参,这纯粹是为了外部类调用更方便。
设计RGBDFrame类:
程序运行的基本单位是Frame,而我们从数据集中读取的数据也是以Frame为单位的。现在我们来设计一个RGBDFrame类,以及向数据集读取Frame的FrameReader类。
我们把这两个类都放在 include/rgbdframe.h 中,如下所示(为了显示方便就都贴上来了):
#ifndef RGBDFRAME_H
#define RGBDFRAME_H #include "common.h"
#include "parameter_reader.h" #include"Thirdparty/DBoW2/DBoW2/FORB.h"
#include"Thirdparty/DBoW2/DBoW2/TemplatedVocabulary.h" namespace rgbd_tutor{ //帧
class RGBDFrame
{
public:
typedef shared_ptr<RGBDFrame> Ptr; public:
RGBDFrame() {}
// 方法
// 给定像素点,求3D点坐标
cv::Point3f project2dTo3dLocal( const int& u, const int& v ) const
{
if (depth.data == nullptr)
return cv::Point3f();
ushort d = depth.ptr<ushort>(v)[u];
if (d == )
return cv::Point3f();
cv::Point3f p;
p.z = double( d ) / camera.scale;
p.x = ( u - camera.cx) * p.z / camera.fx;
p.y = ( v - camera.cy) * p.z / camera.fy;
return p;
} public:
// 数据成员
int id =-; //-1表示该帧不存在 // 彩色图和深度图
cv::Mat rgb, depth;
// 该帧位姿
// 定义方式为:x_local = T * x_world 注意也可以反着定义;
Eigen::Isometry3d T=Eigen::Isometry3d::Identity(); // 特征
vector<cv::KeyPoint> keypoints;
cv::Mat descriptor;
vector<cv::Point3f> kps_3d; // 相机
// 默认所有的帧都用一个相机模型(难道你还要用多个吗?)
CAMERA_INTRINSIC_PARAMETERS camera; // BoW回环特征
// 讲BoW时会用到,这里先请忽略之
DBoW2::BowVector bowVec; }; // FrameReader
// 从TUM数据集中读取数据的类
class FrameReader
{
public:
FrameReader( const rgbd_tutor::ParameterReader& para )
: parameterReader( para )
{
init_tum( );
} // 获得下一帧
RGBDFrame::Ptr next(); // 重置index
void reset()
{
cout<<"重置 frame reader"<<endl;
currentIndex = start_index;
} // 根据index获得帧
RGBDFrame::Ptr get( const int& index )
{
if (index < || index >= rgbFiles.size() )
return nullptr;
currentIndex = index;
return next();
} protected:
// 初始化tum数据集
void init_tum( );
protected: // 当前索引
int currentIndex =;
// 起始索引
int start_index =; const ParameterReader& parameterReader; // 文件名序列
vector<string> rgbFiles, depthFiles; // 数据源
string dataset_dir; // 相机内参
CAMERA_INTRINSIC_PARAMETERS camera;
}; };
#endif // RGBDFRAME_H
include/rgbdframe.h
关于RGBDFrame类的几点注释:
- 我们把这个类的指针定义成了shared_ptr,以后尽量使用这个指针管理此类的对象,这样可以免出一些变量作用域的问题。并且,智能指针可以自己去delete,不容易出现问题。
- 我们把与这个Frame相关的东西都放在此类的成员中,例如图像、特征、对应的相机模型、BoW参数等。关于特征和BoW,我们之后要详细讨论,这里你可以暂时不去管它们。
- 最后,project2dTo3dLocal 可以把一个像素坐标转换为当前Frame下的3D坐标。当然前提是深度图里探测到了深度点。
接下来,来看FrameReader。它的构造函数中需要有一个parameterReader的引用,因为我们需要去参数文件里查询数据所在的目录。如果查询成功,它会做一些初始化的工作,然后外部类就可以通过next()函数得到下一帧的图像了。我们在src/rgbdframe.cpp中实现init_tum()和next()这两个函数:
#include "rgbdframe.h"
#include "common.h"
#include "parameter_reader.h" using namespace rgbd_tutor; RGBDFrame::Ptr FrameReader::next()
{
if (currentIndex < start_index || currentIndex >= rgbFiles.size())
return nullptr; RGBDFrame::Ptr frame (new RGBDFrame);
frame->id = currentIndex;
frame->rgb = cv::imread( dataset_dir + rgbFiles[currentIndex]);
frame->depth = cv::imread( dataset_dir + depthFiles[currentIndex], -); if (frame->rgb.data == nullptr || frame->depth.data==nullptr)
{
// 数据不存在
return nullptr;
} frame->camera = this->camera;
currentIndex ++;
return frame;
} void FrameReader::init_tum( )
{
dataset_dir = parameterReader.getData<string>("data_source");
string associate_file = dataset_dir+"/associate.txt";
ifstream fin(associate_file.c_str());
if (!fin)
{
cerr<<"找不着assciate.txt啊!在tum数据集中这尼玛是必须的啊!"<<endl;
cerr<<"请用python assicate.py rgb.txt depth.txt > associate.txt生成一个associate文件,再来跑这个程序!"<<endl;
return;
} while( !fin.eof() )
{
string rgbTime, rgbFile, depthTime, depthFile;
fin>>rgbTime>>rgbFile>>depthTime>>depthFile;
if ( !fin.good() )
{
break;
}
rgbFiles.push_back( rgbFile );
depthFiles.push_back( depthFile );
} cout<<"一共找着了"<<rgbFiles.size()<<"个数据记录哦!"<<endl;
camera = parameterReader.getCamera();
start_index = parameterReader.getData<int>("start_index");
currentIndex = start_index;
}
src/rgbdframe.cpp
可以看到,在init_tum中,我们从前一讲生成的associate.txt里获得图像信息,把文件名存储在一个vector中。然后,next()函数根据currentIndex返回对应的数据。
测试FrameReader
现在我们来测试一下之前写的FrameReader。在experiment中添加一个reading_frame.cpp文件,测试文件是否正确读取。
experiment/reading_frame.cpp
#include "rgbdframe.h" using namespace rgbd_tutor;
int main()
{
ParameterReader para;
FrameReader fr(para);
while( RGBDFrame::Ptr frame = fr.next() )
{
cv::imshow( "image", frame->rgb );
cv::waitKey();
} return ;
}
由于之前定义好了接口,这部分就很简单,几乎不需要解释了。我们只是把数据从文件中读取出来,加以显示而已。
下面我们来写编译此程序所用的CMakeLists。
代码根目录下的CMakeLists.txt:
cmake_minimum_required( VERSION 2.8 )
project( rgbd-slam-tutor2 ) # 设置用debug还是release模式。debug允许断点,而release更快
#set( CMAKE_BUILD_TYPE Debug )
set( CMAKE_BUILD_TYPE Release ) # 设置编译选项
# 允许c++11标准、O3优化、多线程。match选项可避免一些cpu上的问题
set( CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11 -march=native -O3 -pthread" ) # 常见依赖库:cv, eigen, pcl
find_package( OpenCV REQUIRED )
find_package( Eigen3 REQUIRED )
find_package( PCL 1.7 REQUIRED ) include_directories(
${PCL_INCLUDE_DIRS}
${PROJECT_SOURCE_DIR}/
) set( thirdparty_libs
${OpenCV_LIBS}
${PCL_LIBRARY_DIRS}
${PROJECT_SOURCE_DIR}/Thirdparty/DBoW2/lib/libDBoW2.so
) add_definitions(${PCL_DEFINITIONS}) # 二进制文件输出到bin
set( EXECUTABLE_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/bin )
# 库输出到lib
set( CMAKE_LIBRARY_OUTPUT_DIRECTORY ${PROJECT_SOURCE_DIR}/lib ) # 头文件目录
include_directories(
${PROJECT_SOURCE_DIR}/include
) # 源文件目录
add_subdirectory( ${PROJECT_SOURCE_DIR}/src/ )
add_subdirectory( ${PROJECT_SOURCE_DIR}/experiment/ )
CMakeLists.txt:
src/目录下的CMakeLists.txt:
add_library( rgbd_tutor
rgbdframe.cpp
)
experiment下的CMakeLists.txt
add_executable( helloslam helloslam.cpp ) add_executable( reading_frame reading_frame.cpp )
target_link_libraries( reading_frame rgbd_tutor ${thirdparty_libs} )
注意到,我们把rgbdframe.cpp编译成了库,然后把reading_frame链接到了这个库上。由于在RGBDFrame类中用到了DBoW库的代码,所以我们先去编译一下DBoW这个库。
cd Thirdparty/DBoW2
mkdir build lib
cd build
cmake ..
make -j4
这样就把DBoW编译好了。这个库以后我们要在回环检测中用到。接下来就是编译咱们自己的程序了。如果你用qtCreator,可以直接打开根目录下的CMakeLists.txt,点击编译即可:
如果你不用这个IDE,遵循传统的cmake编译方式即可。编译后在bin/下面生成reading_frame程序,可以直接运行。
运行后,你可以看到镜头在快速的运动。因为我们没做任何处理,这应该是你在电脑上能看到的最快的处理速度了(当然取决于你的配置)。随后我们要把特征提取、匹配和跟踪都加进去,但是希望它仍能保持在正常的视频速度。
下节预告
下节我们将介绍orb特征的提取与匹配,并测试它的匹配速度与性能。
问题
如果你有任何问题,请写在评论区中。有代表性的问题我会统一回复。
一起做RGB-D SLAM 第二季 (二)的更多相关文章
- 一起做RGB-D SLAM 第二季 (一)
小萝卜:师兄!过年啦!是不是很无聊啊!普通人的生活就是赚钱花钱,实在是很没意思啊! 师兄:是啊…… 小萝卜:他们都不懂搞科研和码代码的乐趣呀! 师兄:可不是嘛…… 小萝卜:所以今年过年,我们再做一个S ...
- NeHe OpenGL教程 第二十二课:凹凸映射
转自[翻译]NeHe OpenGL 教程 前言 声明,此 NeHe OpenGL教程系列文章由51博客yarin翻译(2010-08-19),本博客为转载并稍加整理与修改.对NeHe的OpenGL管线 ...
- Java入门第二季学习总结
课程总概 该门课程作为java入门学习的第二季,是在有一定的java基础上进行的进一步学习.由于该季涉及到了java的一些核心内容,所以相对第一季来说,课程难度有所提升.大致可将该季的课程分为五部分: ...
- 《舌尖上的中国》第二季今日首播了,天猫食品也跟着首发,借力使力[bubuko.com]
天猫旗下的天猫食品与央视CCTV-1栏目<舌尖上的中国>第二季(以下简称“舌尖2”)达成合作,天猫食品成为舌尖2独家合作平台,同步首发每期 节目中的食材和美食菜谱,舌尖2摄制组还将为同步上 ...
- 《Linux命令行与shell脚本编程大全》 第二十二章 学习笔记
第二十二章:使用其他shell 什么是dash shell Debian的dash shell是ash shell的直系后代,ash shell是Unix系统上原来地Bourne shell的简化版本 ...
- Big Data 應用:第二季(4~6月)台湾地区Game APP 变动分布趋势图
图表简介: 该示意图表示了台湾地区第二季内所有Game APP类别的分布情形,经由该图表我们可以快速的了解到在这三个月内,哪类型的APP是很稳定:抑或者哪类型的APP是非常不稳定的. 名词解释: 类别 ...
- Python开发【第二十二篇】:Web框架之Django【进阶】
Python开发[第二十二篇]:Web框架之Django[进阶] 猛击这里:http://www.cnblogs.com/wupeiqi/articles/5246483.html 博客园 首页 ...
- 再造轮子之网易彩票-第二季(IOS 篇 by sixleaves)
02-彩票项目第二季 2.封装SWPTabBar方式一 接着我们思考如何进行封装.前面已经将过了为什么要封装, 和封装达到的效果.这里我们主要有两种封装方式,分别是站在不同的角度上看待问题.虽然角度不 ...
- 第二十二章 Django会话与表单验证
第二十二章 Django会话与表单验证 第一课 模板回顾 1.基本操作 def func(req): return render(req,'index.html',{'val':[1,2,3...]} ...
随机推荐
- 从配置sublimeClang插件中学到的
1.不害怕失败的关键在于要事先为失败准备补救措施.2.人们害怕内部结构复杂的东西出错,并以自己缺乏对内部结构的认识为理由而放弃查错.其实某些情况下根本无需对内部结构有多么深入的认识,只需从外部观察就够 ...
- PAAS平台构建7×24小时高可用应用的方案设计
本博客迁移到部署在jae上的独立博客系统wordpress,博客地址:点击打开独立博客.欢迎大家一起来讨论IT技术. 现在很多企业都在搭建自己的私有PAAS平台,当然也有很多大型互联网公司搭建共有PA ...
- CSS3 圆角制作的消息提示图标
CSS3 圆角制作的消息提示图标,如果你想知道它是如何被开发的,请点击连接查看.http://www.gbtags.com/gb/rtreplayerpreview/142.htm
- FIR.im Weekly - 上周微博热转资源精选
LeakCanary: 让内存泄露无所遁形 Square 开源的 LeakCanary,国内开发者 @廖祜秋liaohuqiu 翻译了对应的官方博客,撰写了中文使用说明文档,同时还写了一个小 Demo ...
- iOS开发--JSON
1.什么是JSON? JSON(JavaScript Object Notation)在网络传输中几乎无处不在,JSON是一种轻量级的数据交换格式,是基于JavaScript(Standard ECM ...
- Leetcode 13 Roman to Integer 字符串处理+STL
题意:将罗马数字1到3999转化成自然数字,这里用了STL库map将罗马字符映射到自然数字. I,V,X,L,C,D,M -> 1,5,10,50,100,500,1000 m[s[i]]< ...
- PowerManager和WakeLock的操作步骤
① PowerManager pm = (PowerManager) getSystemService(Context.POWER_SERVICE);通过 Context.getSystemServ ...
- 关于EntityFramework连接Oracle的详细教程
研发环境需安装的组件 Oracle Developer Tools for Visual Studio 2015 - MSI Installer 来自Oracle官网. 为Visual Studio ...
- 出现Bad command or the file name的原因
出现Bad command or file name的原因 中文释义:错误的命令或文件名 . 错误原因:不能识别输入的命令 . 方法:检查所输入的指令是否正确,包括拼写和大小写等情况.
- PHP Official Service
The way to startup official service command: php.exe -S localhost:80