当有读者看到我这篇SiftGPU入门的学习笔记时，相信你已经读过了高博那篇《SLAM拾萃：SiftGPU》，那篇文章写于16年，已经过去两年的时间。在我尝试配置SiftGPU的环境时，遇到了几个问题，在网络上也少有较为系统的关于SiftGPU的介绍，因此觉得有必要记录下来，以便同样对此感兴趣的同学们少走弯路。

暑假的时候参加了高分举办的无人机大赛，在进行图像处理的时候用到过特征提取，当时主要是考虑SIFT和SURF两种方法，由于提取速度上的优势，我采用了SURF。比赛之后读过一些博客和文章，发觉SIFT的准确率应该更高一些，而我在比赛中也发现SURF偶尔会出现无法匹配的情况。OpenCV集成了SIFT算子，我们可以比较容易地利用其中的函数进行特征点的检测，而由于传统的SIFT算法速度较为缓慢，检测一张图片在台式机上通常都需要100+ms，因此传统的SIFT算法很难应用在无人机这种资源紧张而且对速度要求很高的平台上。目前我们组的无人平台上主要应用过ORBSLAM和VINS。

我的原计划是阅读Lowe的论文，理解算法的原理，而后对源码进行一定的优化以在特定的情景中加快检测速度，然而在一次组会中，老板提到了SiftGPU让我去了解一下，于是就有了这篇学习笔记。原作者Wu Changchang来自北卡罗来纳大学教堂山分校，高博文章中的下载链接基于此。

笔者使用的是Ubuntu 16.04的系统，工作机配置了CUDA9.0，笔记本配置的是CUDA9.2，OpenCV的版本都是3.2.0，关于OpenCV及其contrib的编译可以参照我的另一篇博文[环境配置]Ubuntu 16.04 源码编译安装OpenCV-3.2.0+OpenCV_contrib-3.2.0及产生的问题。SiftGPU大部分代码是基于OpenGL的，因此不编译CUDA也没有问题，两者速度的对比后面会提到。

下载和编译

源码编译之前我们需要安装一些包以及Glew。

$ sudo apt-get install libgl1-mesa-dev libglu1-mesa-dev freeglut3-dev libdevil-dev

Glew的源码位于其官网，下载最新版的即可，之后直接解压。

$ cd Downloads/glew-2.1.0

$ make

$ sudo make install

我们需要告诉系统的cmake工具编译好的文件的位置。

$ sudo ldconfig /usr/lib64/

接下来就是SiftGPU的编译了，Wu Changchang的源码链接已经失效，因此只能去万能的github上下载源码了。但是这个版本的SiftGPU有几处问题，编译之前需要更正，否则无法正确编译完成，为方便起见，我fork之后更新了需要更正的文件，放在我的github上，大家可以直接clone我更正后的代码，然后编译SiftGPU。

$ cd Downloads/SiftGPU

$ make

检查一下得到的bin/libsiftgpu.so的链接是否正确

$ ldd bin/libsiftgpu.so

如果得到如下的图片，说明编译成功，每一个库都找到了对应的位置。

笔者对pitzer的源码主要更改了两个文件，首先一个关于freeglut的问题，报错如下

freeglut ERROR: Function <glutDestroyWindow> called without first calling 'glutInit'.

我们打开src/SiftGPU/LiteWindow.h，找到

virtual ~LiteWindow()   {  if(glut_id > ) glutDestroyWindow(glut_id);  }

改为

virtual ~LiteWindow()

{

    if(glut_id > )

    {

    　　int argc = ;

    　　char** argv;

    　　glutInit(&argc, argv);

    　　glutDestroyWindow(glut_id);

    }

}

第二个文件是src/SiftGPU/SiftGPU.h，在头文件处加一个

#include <stddef.h>

如果缺少这个头文件，会报如下的错误

/home/yao/Environment/SiftGPU/src/SiftGPU/SiftGPU.h:336:40: error: declaration of ‘operator new’ as non-function SIFTGPU_EXPORT void* operator new (size_t size);

测试与结果

测试代码我放在了我的github上，有兴趣的同学可以下载下来测试。

OpenGL

编译好之后我们当然需要来测试一下，笔者主要使用cmake从命令行进行编译，使用编译器的同学如果是调用cmake工具的话，应该步骤相同。首先我们创建一个工程文件夹，名字就叫test_SiftGPU，在文件夹下创建CMakeLists.txt

cmake_minimum_required(VERSION 2.8.)

project(test_SiftGPU)

# OpenCV依赖

find_package( OpenCV REQUIRED )

# OpenGL

find_package(OpenGL REQUIRED)

# GLUT

find_package(GLUT REQUIRED)

# Glew

find_package(GLEW REQUIRED)

find_package(CUDA REQUIRED)

# SiftGPU：手动设置其头文件与库文件所在位置

include_directories("/home/yao/Environment/SiftGPU/src/SiftGPU/" ${OpenGL_INCLUDE_DIR})

set(SIFTGPU_LIBS "/home/yao/Environment/SiftGPU/bin/libsiftgpu.so")

add_executable( test_SiftGPU main.cpp )

target_link_libraries( testSiftGPU

    ${OpenCV_LIBS}

    ${SIFTGPU_LIBS}

    ${GLEW_LIBRARIES} ${GLUT_LIBRARIES} ${OPENGL_LIBRARIES}

)

注意设置SiftGPU的路径时读者要改成自己的路径。此外高博的文章中写到需要为Glew写一个寻找其路径的cmake文件，但在我安装完Glew后cmake的modules文件夹下出现了FindGLEW.cmake这个文件，因此我们不需要专门为Glew写这个文件，直接加上GLEW的find_package代码，注意大写。

main.cpp我一开始使用了高博的代码，在用OpenCV读入图像的条件下，检测出一张640*480图像中所有的特征点需要不到10ms，但是我发现这个测试程序有一些问题，前一部分是测试直接读取一张图片进行Sift检测，后面是对同一张图片先读取再检测。当我注释掉前一段代码时，发现后一段代码无法运行，我必须取消注释检测那一句代码才可以运行，因此我推测后一段代码引用了前一段的结果。我重新改写了一份测试代码，测试速度还算是比较快，通过调参，可以在我的笔记本上达到30ms/帧的检测速度。

在定义部分，默认调用OpenGL，如果想要调用CUDA，换用另一个字符串指针即可，但是要预先安装好CUDA，以及配置好CUDA，配置过程在后面会写。

#include <SiftGPU.h>
#include <iostream>
#include <vector>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include "opencv2/imgproc/imgproc.hpp"
#include <chrono>
#include <GL/gl.h>

using namespace std;
using namespace chrono;

int main( int argc, char** argv)
{
　　//声明SiftGPU并初始化
　　SiftGPU sift;
　　char* myargv[5] = { "-m", "-s", "-unpa", "0"};
　　//char* myargv[4] = {"-fo", "-1", "-cuda", "0"};
　　sift.ParseParam(5, myargv);

　　//检查硬件是否支持SiftGPU
　　int support = sift.CreateContextGL();
　　if ( support != SiftGPU::SIFTGPU_FULL_SUPPORTED )
　　{
　　　　std::cerr << "SiftGPU is not supported!" << std::endl;
　　　　return 2;
　　}

　　sift.ParseParam(5, myargv);
　　cv::Mat img = cv::imread("/home/yao/workspace/SIFT_detection/image/2.png");
　　int width = img.cols;
　　int height = img.rows;

　　sift.AllocatePyramid(width, height);
　　sift.SetTightPyramid(1);
　　auto start_siftgpu = std::chrono::system_clock::now();
　　sift.RunSIFT(width, height, img.data, GL_RGB, GL_UNSIGNED_BYTE);
　　float time_cost = chrono::duration_cast<microseconds>(std::chrono::system_clock::now() - start_siftgpu).count() / 1000.0;
　　std::cout << "siftgpu::runSIFT() cost time=" << time_cost << "ms" << std::endl;
　　int num = sift.GetFeatureNum();
　　std::cout << "Feature number=" << num << std::endl;
　　std::vector<float> descriptors(128*num);
　　std::vector<SiftGPU::SiftKeypoint> keys(num);

　　auto start_siftfeature = std::chrono::system_clock::now();
　　sift.GetFeatureVector(&keys[0], &descriptors[0]);

　　return 0;
}

然后就是轻车熟路的cmake编译过程了。

$ mkdir build

$ cd build

$ cmake ..

$ make

$ ./test_SiftGPU

结果如下图所示

测试代码只调用了OpenGL，我笔记本的配置是i7-7700HQ，显卡GTX1050，读取一张图像后，提取出一张图像中所有的SIFT特征点只需要35毫秒，这相比较于传统的SIFT提取消耗的时间大大减小。多数情况下，我们都是调用OpenCV进行图像的读取以及后续的处理，因此使用SiftGPU可以加快提取特征点的速度。在无人机平台上，图像处理速度一般要求在20HZ以上，因此SiftGPU获取特征点的策略可以应用于无人机平台，与ORB等算子速度相当。

CUDA

我们切换至CUDA下进行特征点提取，关于调用CUDA来完成SiftGPU的测试，github上的原作者写的比较含糊，网络上也鲜有教程，因此特做记录如下。

首先切换至SiftGPU的安装路径，找到makefile中的

ifneq ($(simple_find_cuda), )

     siftgpu_enable_cuda = 0

else

    siftgpu_enable_cuda = 0

endif

CUDA_INSTALL_PATH = /usr/local/cuda

#change  additional  settings, like SM version here if it is not 1.0 (eg. -arch sm_13 for GTX280)

#siftgpu_cuda_options = -Xopencc -OPT:unroll_size=200000

#siftgpu_cuda_options = -arch sm_10

改为

ifneq ($(simple_find_cuda), )

     siftgpu_enable_cuda = 1

else

    siftgpu_enable_cuda = 0

endif

CUDA_INSTALL_PATH = /usr/local/cuda

#change  additional  settings, like SM version here if it is not 1.0 (eg. -arch sm_13 for GTX280)

#siftgpu_cuda_options = -Xopencc -OPT:unroll_size=200000

siftgpu_cuda_options = -arch sm_50

其中最后一行的sm_50取决于读者电脑的GPU算力，笔者笔记本使用的GPU是Pascal架构的GTX1050，算力为5.2，因此采用sm_50这个参数，关于不同GPU的算力可以参考这篇博客。之后重新编译安装SiftGPU。

$ make clean

$ make

我们切回到SiftGPU的测试程序，找到主程序main.cpp，取消注释下面这句

//char* myargv[4] = {"-fo", "-1", "-cuda", "0"};

然后cmake编译，就可以测试了，测试结果如下

调用CUDA检测处同样的一张图片中的所有特征点需要消耗31ms，与不调用CUDA的情况时间相差无几，依据SiftGPU的手册，分辨率低于1080p的时候，OpenGL速度较快，因此这种结果也可以接受。

总结

SIFT在特征点检测领域是一个非常优秀的算子，用于匹配准确率高，缺点是速度慢，而Wu Changchang提出的SiftGPU算法加快了特征点的提取，在CUDA的加成下相较于只调用OpenGL的SiftGPU速度提升有限，因此对于没有装CUDA的同学们来说这算是一个利好。7700HQ的CPU+GTX1050的显卡可以将一幅640*480的图像只用31毫秒便找出了所有的特征点，因此在无人机的轻量级运算平台上的应用很可期。

本文主要是介绍了SiftGPU的编译和使用过程，改进了源码的几处错误以便于正确编译，尝试了调用CUDA的方法，给出了解决方案，对SiftGPU的使用提供了较为系统的方法，同时给出了一个测试程序。欢迎读者提出指正与问题，便于讨论与共同进步。

[学习笔记]SiftGPU入门的更多相关文章

python学习笔记--Django入门四管理站点--二
接上一节 python学习笔记--Django入门四管理站点设置字段可选编辑Book模块在email字段上加上blank=True,指定email字段为可选,代码如下: class Autho ...
WebSocket学习笔记——无痛入门
WebSocket学习笔记——无痛入门标签: websocket 2014-04-09 22:05 4987人阅读评论(1) 收藏举报分类: 物联网学习笔记(37) 版权声明:本文为博主原 ...
Java学习笔记之---入门
Java学习笔记之---入门一. 为什么要在众多的编程语言中选择Java? java是一种纯面向对象的编程语言 java学习起来比较简单,适合初学者使用 java可以跨平台,即在Windows操作系 ...
DBFlow框架的学习笔记之入门
什么是DBFlow? dbflow是一款android高性的ORM数据库.可以使用在进行项目中有关数据库的操作.github下载源码 1.环境配置先导入 apt plugin库到你的classpat ...
MongoDB学习笔记:快速入门
MongoDB学习笔记:快速入门一.MongoDB 简介 MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统.在高负载的情况下,添加更多的节点,可以保证服务器性能.M ...
学习笔记_J2EE_SpringMVC_01_入门
1. 概述笔者作为一个不太正经的不专业佛教信仰者,习惯了解事物的因果关系,所以概述就有点BBB...了.如果不喜欢这些的,请自行跳过概述章节,直接进入第二章的操作实践:2 入门示例. 1.1. ...
dubbo入门学习笔记之入门demo(基于普通maven项目)
注:本笔记接dubbo入门学习笔记之环境准备继续记录; (四)开发服务提供者和消费者并让他们在启动时分别向注册中心注册和订阅服务需求:订单服务中初始化订单功能需要调用用户服务的获取用户信息的接口(订 ...
SpringBoot学习笔记<一>入门与基本配置
毕业实习项目技术学习笔记参考文献学习视频 2小时学会Spring Boot:https://www.imooc.com/learn/767 学习资料 SpringBoot入门:https://bl ...
[学习笔记] pymysql入门
一.快速开始对于会用MySQL的朋友来说,开始使用pymysql可以说真的so esay,只要用下面的代码,把想要对数据库的操作放在 sql = " " 里就可以了. 没有接触过 ...

随机推荐

【转载】Spring最佳后台框架
https://www.quora.com/What-is-the-best-backend-arquitecture-using-spring-framework The most modern a ...
纯css3云彩动画效果
效果描述: 纯CSS3实现的云彩动画飘动效果非常逼真实用使用方法: 1.将body中的代码部分拷贝到你的页面中 2.引入对应的CSS文件即可
python第十六课——外部函数and内部函数
1.外部函数&内部函数内部函数: 定义在某个函数的内部,就是内部函数: [注意事项]: 1).内部函数可以随意使用它外部函数中的内容 2).外部函数不能使用内部函数中的内容 3).内部函数不 ...
Payment：微信支付配置文件设置说明
项目GitHub地址:https://github.com/helei112g/payment 微信支付个人觉得在帐号设置上有些麻烦,帐号太多啦,支付宝目前就是一个应用基本涵盖了所有的接口开发. 可能 ...
BZOJ5418:[NOI2018]屠龙勇士(exCRT,exgcd,set)
Description Input Output Sample Input 23 33 5 74 6 107 3 91 9 10003 23 5 64 8 71 1 11 1 Sample Outpu ...
【LGP4886 】快递员
题目好秒啊,真是一道神仙的点分治于是我们来一个暴力的\(O(nlog^2n)\)的暴力统计吧考虑计算每一个点作为快递中心时的答案我们考虑在这个点成为分治重心时计算这个贡献把这个贡献分成两部分 ...
Eclipse的PHP插件PHPEclipse安装和使用
PHP有很多相当不错的开发工具,如Zend Studio.NetBeans.phpdesigner等,但对于习惯Java编程的程序猿们来说,最常用的还要属Eclipse.那么Eclipse能用于PHP ...
virtualbox+vagrant学习-4-Vagrantfile-5-Machine Settings
Machine Settings 配置命名空间:config.vm config.vm的设置将修改vagrant管理的机器的配置 Available Settings可用设置 config.vm.ba ...
初识Qt基于http协议网页浏览
1.新建一个Qt Gui应用,项目名称为http,基类选择为QMainWindow,类名设置为MainWindow. 2.在http.pro文件中的QT += core gui后添加\ networ ...
JDBC通过配置文件（properites）读取数据库配置信息
扫盲: Classloader 类加载器,用来加载 Java 类到 Java 虚拟机中.与普通程序不同的是.Java程序(class文件)并不是本地的可执行程序.当运行Java程序时,首先运行JVM( ...

[学习笔记]SiftGPU入门