SIFT简介

Scale Invariant Feature Transform，尺度不变特征变换匹配算法，是由David G. Lowe在1999年（《Object Recognition from Local Scale-Invariant Features》）提出的高效区域检测算法，在2004年（《Distinctive Image Features from Scale-Invariant Keypoints》）得以完善。

SIFT特征对旋转、尺度缩放、亮度变化等保持不变性，是非常稳定的局部特征，现在应用很广泛。而SIFT算法是将Blob检测，特征矢量生成，特征匹配搜索等步骤结合在一起优化。我会更新一系列文章，分析SIFT算法原理及OpenCV 2.4.2实现的SIFT源码：

OpenCV2.3之后实现了SIFT的代码，2.4改掉了一些bug。本系列文章主要分析OpenCV 2.4.2SIFT函数源码。

SIFT位于OpenCV nonfree的模块，David G. Lowe申请了算法的版权，请尊重作者权力，务必在允许范围内使用。

SIFT in OpenCV

OpenCV中的SIFT函数主要有两个接口。

构造函数：

SIFT::SIFT(int nfeatures=, int nOctaveLayers=, double contrastThreshold=0.04, double edgeThreshold=

, double sigma=1.6)

nfeatures：特征点数目（算法对检测出的特征点排名，返回最好的nfeatures个特征点）。
nOctaveLayers：金字塔中每组的层数（算法中会自己计算这个值，后面会介绍）。
contrastThreshold：过滤掉较差的特征点的对阈值。contrastThreshold越大，返回的特征点越少。
edgeThreshold：过滤掉边缘效应的阈值。edgeThreshold越大，特征点越多（被多滤掉的越少）。
sigma：金字塔第0层图像高斯滤波系数，也就是σ。

重载操作符：

void SIFT::operator()(InputArray img, InputArray mask, vector<KeyPoint>& keypoints, OutputArray

descriptors, bool useProvidedKeypoints=false)

img：8bit灰度图像
mask：图像检测区域（可选）
keypoints：特征向量矩阵
descipotors：特征点描述的输出向量（如果不需要输出，需要传cv::noArray()）。
useProvidedKeypoints：是否进行特征点检测。ture，则检测特征点；false，只计算图像特征描述。

函数源码

构造函数SIFT()主要用来初始化参数，并没有特定的操作：

SIFT::SIFT( int _nfeatures, int _nOctaveLayers,

           double _contrastThreshold, double _edgeThreshold, double _sigma )

    : nfeatures(_nfeatures), nOctaveLayers(_nOctaveLayers),

    contrastThreshold(_contrastThreshold), edgeThreshold(_edgeThreshold), sigma(_sigma)

    // sigma：对第0层进行高斯模糊的尺度空间因子。

    // 默认为1.6（如果是软镜摄像头捕获的图像，可以适当减小此值）

{

}

主要操作还是利用重载操作符()来执行：

void SIFT::operator()(InputArray _image, InputArray _mask,

                      vector<KeyPoint>& keypoints,

                      OutputArray _descriptors,

                      bool useProvidedKeypoints) const

// mask ：Optional input mask that marks the regions where we should detect features.

// Boolean flag. If it is true, the keypoint detector is not run. Instead,

// the provided vector of keypoints is used and the algorithm just computes their descriptors.

// descriptors – The output matrix of descriptors.

// Pass cv::noArray() if you do not need them.

{

    Mat image = _image.getMat(), mask = _mask.getMat();

    if( image.empty() || image.depth() != CV_8U )

        CV_Error( CV_StsBadArg, "image is empty or has incorrect depth (!=CV_8U)" );

    if( !mask.empty() && mask.type() != CV_8UC1 )

        CV_Error( CV_StsBadArg, "mask has incorrect type (!=CV_8UC1)" );

    // 得到第1组（Octave）图像

    Mat base = createInitialImage(image, false, (float)sigma);

    vector<Mat> gpyr, dogpyr;

    // 每层金字塔图像的组数（Octave）

    int nOctaves = cvRound(log( (double)std::min( base.cols, base.rows ) ) / log(.) - );

    // double t, tf = getTickFrequency();

    // t = (double)getTickCount();

    // 构建金字塔（金字塔层数和组数相等）

    buildGaussianPyramid(base, gpyr, nOctaves);

    // 构建高斯差分金字塔

    buildDoGPyramid(gpyr, dogpyr);

    //t = (double)getTickCount() - t;

    //printf("pyramid construction time: %g\n", t*1000./tf);

    // useProvidedKeypoints默认为false

    // 使用keypoints并计算特征点的描述符

    if( !useProvidedKeypoints )

    {

        //t = (double)getTickCount();

        findScaleSpaceExtrema(gpyr, dogpyr, keypoints);

        //除去重复特征点

        KeyPointsFilter::removeDuplicated( keypoints ); 

        // mask标记检测区域（可选）

        if( !mask.empty() )

            KeyPointsFilter::runByPixelsMask( keypoints, mask );

        // retainBest:根据相应保留指定数目的特征点（features2d.hpp）

        if( nfeatures >  )

            KeyPointsFilter::retainBest(keypoints, nfeatures);

        //t = (double)getTickCount() - t;

        //printf("keypoint detection time: %g\n", t*1000./tf);

    }

    else

    {

        // filter keypoints by mask

        // KeyPointsFilter::runByPixelsMask( keypoints, mask );

    }

    // 特征点输出数组

    if( _descriptors.needed() )

    {

        //t = (double)getTickCount();

        int dsize = descriptorSize();

        _descriptors.create((int)keypoints.size(), dsize, CV_32F);

        Mat descriptors = _descriptors.getMat();

        calcDescriptors(gpyr, keypoints, descriptors, nOctaveLayers);

        //t = (double)getTickCount() - t;

        //printf("descriptor extraction time: %g\n", t*1000./tf);

    }

}

函数中用到的构造金字塔： buildGaussianPyramid(base, gpyr, nOctaves);等步骤请参见文章后续系列。

本文转自：http://blog.csdn.net/xiaowei_cqu/article/details/8069548

【OpenCV】SIFT原理与源码分析的更多相关文章

OpenCV SIFT原理与源码分析
http://blog.csdn.net/xiaowei_cqu/article/details/8069548 SIFT简介 Scale Invariant Feature Transform,尺度 ...
【OpenCV】SIFT原理与源码分析：DoG尺度空间构造
原文地址:http://blog.csdn.net/xiaowei_cqu/article/details/8067881 尺度空间理论自然界中的物体随着观测尺度不同有不同的表现形态.例如我们形 ...
【OpenCV】SIFT原理与源码分析：关键点描述
<SIFT原理与源码分析>系列文章索引:http://www.cnblogs.com/tianyalu/p/5467813.html 由前一篇<方向赋值>,为找到的关键点即SI ...
【OpenCV】SIFT原理与源码分析：方向赋值
<SIFT原理与源码分析>系列文章索引:http://www.cnblogs.com/tianyalu/p/5467813.html 由前一篇<关键点搜索与定位>,我们已经找到 ...
【OpenCV】SIFT原理与源码分析:关键点搜索与定位
<SIFT原理与源码分析>系列文章索引:http://www.cnblogs.com/tianyalu/p/5467813.html 由前一步<DoG尺度空间构造>,我们得到了 ...
OpenCV学习笔记（27）KAZE 算法原理与源码分析（一）非线性扩散滤波
http://blog.csdn.net/chenyusiyuan/article/details/8710462 OpenCV学习笔记(27)KAZE 算法原理与源码分析(一)非线性扩散滤波 201 ...
ConcurrentHashMap实现原理及源码分析
ConcurrentHashMap实现原理 ConcurrentHashMap源码分析总结 ConcurrentHashMap是Java并发包中提供的一个线程安全且高效的HashMap实现(若对Ha ...
HashMap和ConcurrentHashMap实现原理及源码分析
HashMap实现原理及源码分析哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表, ...
（转）ReentrantLock实现原理及源码分析
背景:ReetrantLock底层是基于AQS实现的(CAS+CHL),有公平和非公平两种区别. 这种底层机制,很有必要通过跟踪源码来进行分析. 参考 ReentrantLock实现原理及源码分析源 ...

随机推荐

java基础学习总结--开篇
春去秋来,转眼间,参加工作快2年了.本来应该是3年,然在毕业的第一年,有试着从事过其他行业.最终结果是失败了.2016年又回来从事软件开发,转眼即将2年,在这期间有许多收获,当然也有彷徨迷茫的时候,人 ...
html js div随鼠标移动
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
python中取整的几种方法
#encoding:utf-8import math #向上取整print "math.ceil---"print "math.ceil(2.3) => " ...
Nodejs学习笔记（二）--- 操作MongoDB数据库
最近看了一些关于mongodb的文章,然后就想知道nodeJS是怎么连接的所以我就尝试去了解了一波(这个菜鸟驿站这个网站还不错,虽然知识文档不是最新的,但是还是蛮好的: 顺便官网地址是这个哦:http ...
erlang node time ticket
Erlang doesn't detect net splits by itself. You could start looking atnet_kernel:set_net_ticktime/2 ...
Redis 简要介绍--用于讲解消息中间件
1:安装 Redis yum install -y redis 2:编辑配置文件/etc/redis.conf,Redis作为一个消息中间件,那么应该监听于本机的外网socket上,因此修改 bi ...
201621123037 《Java程序设计》第12周学习总结
作业12-流与文件标签(空格分隔): Java 1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 答: 读取操作从文件中读取: 1.字节流 InputStr ...
【Mark】Android应用开发SharedPreferences存储数据的使用方法
Android应用开发SharedPreferences存储数据的使用方法 SharedPreferences是Android中最容易理解的数据存储技术,实际上SharedPreferences处理的 ...
【Linux 命令】- tar 命令
语法 tar [-ABcdgGhiklmMoOpPrRsStuUvwWxzZ][-b <区块数目>][-C <目的目录>][-f <备份文件>][-F <Sc ...
mysql & vs2013
一 mysql 版本介绍在mysql的官网http://dev.mysql.com/上,mysql 大致分为两个版本,即免费的社区版(community)和付费的商业版(commercial).其 ...

【OpenCV】SIFT原理与源码分析