【Paper Reading】Object Recognition from Scale-Invariant Features
Paper: Object Recognition from Scale-Invariant Features
Sorce: http://www.cs.ubc.ca/~lowe/papers/iccv99.pdf
SIFT 即Scale Invariant Feature Transfrom, 尺度不变变换,由David Lowe提出。是CV最著名也最常用的特征。在图像目标识别的应用中,常常要求图像的特征有很好的roboust即不容易受到平移,旋转,尺度缩放,光照,仿射的英雄。SIFT算子具有尺度,旋转不变性,并且具有部分光照,视角不变性。
一、SIFT算子概述
1.1 SIFT 算子的特征
1. 局部性:对occlusion 和 clutter 有较好的鲁棒性
2. 独特性:使用SIFT特征可以将独立的特征匹配到大量物体
3. 多量性:即使是小物体可以生成很多SIFT特征
4. 高效性:有很好的实时性
5. 可扩展性:可以和其他不同的特征结合,增强鲁棒性
1.2 SIFT算子检测步骤
1. 尺度空间和高斯金字塔的构建:尺度空间的构建是为了模拟图像的多尺度特征,就像人眼对不同远近的物体,有不同的大小。
2. 尺度空间的极值检测,确定关键点的位置:检索图像所有的空间,通过高斯微分函数的最大值或者最小值点来确定关键点的位置。
3. 去除不好的关键点:边缘和第对比度的区域都是不好的关键点,去除不好的描述子能够使得算法更加efficient和roboust。 可以使用Harris Corner Detector
4. 根据关键点领域内的梯度信息确定关键点的主方向,后续的计算都是针对这个方向进行的,确定关键点的方向,使得key points 具有 rotataion invariant特性。
5. 生成SIFT描述子:前面的的尺度空间的关键点方向使得keypoints 具有 scale and rotation invariant接下来就可以直接生成SIFT算子了。
二、 算法原理
1. 尺度空间和空间金字塔的构建
对于实际场景而言,物体都是以一定尺度呈现的,而图像汇总物体大小是固定的。尺度空间的构建就是为了在数字图像中呈现现实世界人对图像的多尺度感知——距离和模糊程度。这样可以提高算法对物体的识别准确度。为了实现这两个目的SIFT算法使用两个步骤:1)降采样构建高斯金字塔 2) 使用高斯核构建多尺度空间。Lindeberg证明了高斯及其微分核是尺度空间分析中唯一线性的平滑核。我们先使用高斯函数:$G(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-x^2/2\sigma^2}$来构建尺度空间。对于二维图像其对应二维高斯核函数可以定义为$G(x,y,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}e^{-(x^2+y^2)/2\sigma^2}$.
一幅图像$I(x,y)$和高斯核函数卷积可以得到:
$$L(x,y,\sigma) = G(x,y,\sigma)*I(x,y) $$
参数$\sigma$决定图像的分辨率,$\sigma$越大图像越模糊。这便是原图像的尺度空间表示。
这一步仅仅是实现了不同图像的模糊程度模拟,我们还需要实现对不同大小图像的表示。这个可以直接通过对图像进行降采样得到。这样对于原图像我们使用高斯函数卷积达到不同模糊程度(不同$\sigma$)关键点,这对应的是一个octave。然后我们对原图像降采样(比如将图像变为原来大小的一半)然后对新得到图像再次使用高斯函数卷积得到下一个octave,这样一直重复我们就可以得到多个octave,每个octave中有多个不同尺度模糊图像,所有的octave构成高斯金字塔。下面是其示意图:

2. 尺度空间极值检测
建立好高斯金字塔之后我们开始检测兴趣点(interest points),我们可以使用LOG(Laplacian of Gaussian)来检测图像中我们需要的兴趣点(边缘,角点)。然而LOG 很容易受到噪声的干扰,这也是我们之前对图像做Blur模糊的原因之一。LOG计算公式如下:
$$\Delta^2 = \frac{\partial^2}{\Delta_x^2}+\frac{\partial^2}{\Delta_y^2}$$
但是二阶倒数计算起来太困难,于是我们选取了一个替代方案来近似LOG:使用DOG(Difference of Gaussian)计算公式如下:
$$D(x,y,\sigma) = \left(G(x,y,k\sigma)-G(x,y,\sigma) \right)*I(x,y)$$
使用DOG 我们计算得到稳定的keypoints。我们可以使用前面够贱的高斯金字塔,相邻高斯金字塔相减得到DOG空间。

3. 去除不好的关键点
4. 给关键点赋方向
5. 生成SIFT features
【Paper Reading】Object Recognition from Scale-Invariant Features的更多相关文章
- 【Paper Reading】Learning while Reading
Learning while Reading 不限于具体的书,只限于知识的宽度 这个系列集合了一周所学所看的精华,它们往往来自不只一本书 我们之所以将自然界分类,组织成各种概念,并按其分类,主要是因为 ...
- 【Paper Reading】Deep Supervised Hashing for fast Image Retrieval
what has been done: This paper proposed a novel Deep Supervised Hashing method to learn a compact si ...
- 【Paper Reading】Bayesian Face Sketch Synthesis
Contribution: 1) Systematic interpretation to existing face sketch synthesis methods. 2) Bayesian fa ...
- 【Paper Reading】Improved Textured Networks: Maximizing quality and diversity in Feed-Forward Stylization and Texture Synthesis
Improved Textured Networks: Maximizing quality and diversity in Feed-Forward Stylization and Texture ...
- Computer Vision_33_SIFT:Object recognition from local scale-invariant features——1999
此部分是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面.对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献.有一些刚刚出版的 ...
- 【尺度不变性】An Analysis of Scale Invariance in Object Detection – SNIP 论文解读
前言 本来想按照惯例来一个overview的,结果看到1篇十分不错而且详细的介绍,因此copy过来,自己在前面大体总结一下论文,细节不做赘述,引用文章讲得很详细,另外这篇paper引用十分详细,如果做 ...
- 【论文笔记】Zero-shot Recognition via semantic embeddings and knowledege graphs
Zero-shot Recognition via semantic embeddings and knowledege graphs 2018-03-31 15:38:39 [Abstrac ...
- 【面试 JDK】【第一篇】Object类面试详解
1.Object类有哪些方法 1>clone()方法 保护方法,实现对象的浅复制,只有实现了Cloneable接口才可以调用该方法,否则抛出CloneNotSupportedException异 ...
- 【Java】【常用类】Object 基类 源码学习
源码总览: 有好些都是native本地方法,背后是C++写的 没有关于构造器的描述,默认编译器提供的无参构造 https://blog.csdn.net/dmw412724/article/detai ...
随机推荐
- ZBrush中Mrgb、Rgb和M的使用
ZBrush®软件工具架中所有的命令选项都是我们平时较为常用的,位于工具架的中间位置,有一个Mrgb.Rgb和M选项它们所表示的是材质及颜色,那么,在Zbrush中只要选择相应的选项,就可以同时绘制材 ...
- EL表达式的作用与限制条件
限制条件 只能访问域对象的数据 用法 访问基本数据类型 首先把数据保存在域对象中 pagecontext.setAttribute("name","eric") ...
- 字符串时间转Date格式
/** * 字符串时间格式转 Date 格式 * @param strDate * @return */ public static Date getDateTimeByStringTime(Stri ...
- CentOS 7最小安装配置网络
安装环境: VMware Workstation14 centos 7.5.1804 最小化安装 安装过程: 在系统安装成功后进行网络配置,我这里采用的是动态ip配置.首先得知道网络配置存放的目录: ...
- JavaScript 的对象继承方式,有几种写法?
JavaScript 的对象继承方式,有几种写法? 一.对象冒充 其原理如下:构造函数使用 this 关键字给所有属性和方法赋值(即采用类声明的构造函数方式).因为构造函数只是一个函数,所以可使 Pa ...
- HDU 4314 Contest 2
可以知道,逃出的人中,最后一个应当是A+B最长的,这是很容易发现的.那么,最选逃出去的必定是A+B最短的.这符合最优. 于是,可以把各小矮人按A+B的和由大到小排序.定义DP[i][j]为i个人中逃出 ...
- 使用Love2D引擎开发贪吃蛇游戏
今天来介绍博主近期捣腾的一个小游戏[贪吃蛇],贪吃蛇这个游戏相信大家都不会感到陌生吧.今天博主将通过Love2D这款游戏引擎来为大家实现一个简单的贪吃蛇游戏,在本篇文章其中我们将会涉及到贪吃蛇的基本算 ...
- android AudioManager AUDIOFOCUS
如今開始做音乐播放器的模块.遇到了几个问题 当播放音乐的过程中,去调节音量或者情景模式中的铃声设置,结果会有两种声音同一时候响起. 引起此问题的解决办法是音乐焦点问题没弄清 现分析一下音乐焦点的几个属 ...
- Java 递归、尾递归、非递归 处理阶乘问题
n!=n*(n-1)! import java.io.BufferedReader; import java.io.InputStreamReader; /** * n的阶乘,即n! (n*(n-1) ...
- node11---相册
app.js /* littleAlbum --.idea --controller(控制层相当于action层) --package.json --router.js --models(做事的是mo ...