Selective Search for Object Recognition（理解）

CZiFan 2024-10-15 11:51:45 原文

0 - 背景

　　在目标检测任务中，我们希望输入一副图像，输出目标所在的位置以及目标的类别。最常用的算法是滑动窗口方法，但滑动窗口其实相当于穷举图像中的所有子图像，其效率低且精度也受限。该论文提出一种新的生成目标检测框的方法selective search。

1 - 算法流程

　　　　　　　　

step 0：生成区域集R
step 1：计算区域集R中每个相邻区域的相似度S
step 2：找出最相似的两个区域，将其合并成新区域添加到R中
step 3：从S中移除所有与step 2中相关的区域
step 4：计算新集与所有子集的相似度
step 5：跳转到step 2，直到S集为空

1.1 - 相似度计算

1.1.1 - 颜色相似度（colour similarity）

　　将颜色空间转换成HSV，每个通道下以bins=25计算直方图，这样每个区域的颜色直方图有$25 \times 3=75$个区间。对直方图除以区域尺度做归一化后采用下式计算相似度：

$$s_{colour}(r_i,r_j)=\sum_{k=1}^{n}min(c_i^k,c_j^k)$$

　　（注：我的理解是，对于波峰波谷出现在相同区间，也即是直方图有相似趋势的两个区域相似度高，否则低）

1.1.2 - 纹理相似度（texture similarity）

　　采用方差为1的高斯分布在8个方向做梯度统计，然后将统计结果（尺寸与区域大小一致）以bins=10计算直方图，直方图区间数为$8 \times 3 \times 10=240$（使用RGB颜色区间）：

$$s_{texture}(r_i,r_j)=\sum_{k=1}^{n}min(t_i^k,t_j^k)$$

1.1.3 - 尺度相似度（size similarity）

　　保证合并操作较为均匀，避免一个大区域连续吞并其他小区域。举个例子，假设有区域a/b/c/d/e/f/g/h，理想的合并方式为ab/cd/ef/gh→abcd/efgh→abcdefgh，而不希望出现的合并方式为ab/c/d/e/f/g/h→abcd/e/f/g/h→abcdef/gh→abcdefgh。尺度相似度计算公式如下：

$$s_{size}(r_i,r_j)=1-\frac{size(r_i)+size(r_j)}{size(im)}$$

1.1.4 - 交叠相似度（shape compatibility measure）

$$s_{fill}(r_i,r_j)=1-\frac{size(BB_{ij})-size(r_i)-size(r_j)}{size(im)}$$

　　　　　　　　

1.1.5 - 最终相似度

$$s(r_i,r_j)=a_1s_{colour}(r_i,r_j)+a_2s_{texture}(r_i,r_j)+a_3s_{size}(r_i,r_j)+a_4s_{fill}(r_i,r_j)$$

2 - 实现

　　参照大神的代码自己复现一遍，代码在此。

3 - 参考资料

https://blog.csdn.net/guoyunfei20/article/details/78723646

https://github.com/AlpacaDB/selectivesearch

https://github.com/CZiFan/SelectiveSearch

Selective Search for Object Recognition（理解）的更多相关文章

[论文理解]Selective Search for Object Recognition
Selective Search for Object Recognition 简介 Selective Search是现在目标检测里面非常常用的方法,rcnn.frcnn等就是通过selective ...
目标检测--Selective Search for Object Recognition(IJCV, 2013)
Selective Search for Object Recognition 作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. ...
【计算机视觉】Selective Search for Object Recognition论文阅读3
Selective Search for Object Recoginition surgewong@gmail.com http://blog.csdn.net/surgewong 在前 ...
【计算机视觉】Selective Search for Object Recognition论文阅读1
Selective Search for Object Recognition 作者: J. R. R. Uijlings, K. E. A. van de Sande, T. Gevers, A. ...
Notes on 'Selective Search For Object Recognition'
UijlingsIJCV2013, Selective Search For Object Recognition code 算法思想利用分割算法将图片细分成很多region, 或超像素. 在这个基 ...
论文笔记：Selective Search for Object Recognition
与 Selective Search 初次见面是在著名的物体检测论文「Rich feature hierarchies for accurate object detection and seman ...
Selective Search for Object Recognition
http://blog.csdn.net/charwing/article/details/27180421 Selective Search for Object Recognition 是J.R. ...
机器学习：Selective Search for Object Recognition
今天介绍 IJCV 2013 年的一篇文章,Selective Search for Object Recognition,这个是后面著名的DL架构 R-CNN 的基础,后续介绍 R-CNN 的时候, ...
【计算机视觉】Selective Search for Object Recognition论文阅读2
Selective Search for Object Recognition 是J.R.R. Uijlings发表在2012 IJCV上的一篇文章.主要介绍了选择性搜索(Selective Sear ...

随机推荐

Windows将自己的代码发布到Github上
1.在GitHub上创建一个repository 2.在自己的电脑上选择工作的文件夹使用Git Bash clone刚刚创建的repository 3.此时本地git应该已经连接了GitHub,如果没 ...
洛谷 AT667 【天下一人力比較】
题目链接 https://www.luogu.org/problemnew/show/AT667 题目描述啥的,都看不懂就一句翻译: 读入若干个字符串,找到字典序第7的字符串并输出. 感谢@da32 ...
玩转3D Swiper美女性感秀之思路分析总结
前言继一次的3D魔方之后,这次利用CSS3的transform.translate.rotate.preserve-3d等结合JS的requestAnimationFrame.class带你一起玩转 ...
Git—推送代码至Github
Git—上传代码至Github 首先得有个Github的账户,然后创建一个库. 然后找到指向改库的URL 第一次上传需要设置用户邮箱,打开git安装文件/bin下面找到git.bash并打开,设置全局 ...
idea的一些好用的第三方插件
用了Idea真的回不去Eclipse了,安利一波. 这里记录一些好用的插件. GenerateAllSetter 这个插件是用在写代码的时候调用Setter的时候能一次性把实体类中的所有Setter方 ...
js中 ajax动态新增节点无法触发点击事件
在写ajax加载数据的时候发现,后面添加进来的demo节点元素,失去了之前的点击事件. 其实最简单的方法就是直接在标签中写onclick="",但是这样写有些场景的是实现不了的,最 ...
MySQL 8.0 - Client does not support authentication protocol requested by server; consider upgrading MySQL client
ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '你的密码';
AngularJS 1.x系列：AngularJS服务-Service、Factory、Provider、Value及Constant（5）
1. AngularJS服务 AngularJS可注入类型包括:Service.Factory.Provider.Value及Constant. 2. Service AngularJS Servic ...
Python学习之路——函数对象作用域名称空间
一.函数对象 # 函数名就是存放了函数的内存地址,存放了内存地址的变量都是对象,即函数名就是函数对象 # 函数对象的应用 # 1 可以直接被引用 fn = cp_fn # 2 可以当作函数参数传 ...
mpvue——页面跳转
两个页面两个页面的跳转,只是单纯的A->B这种跳转. 组件直接使用小程序的组件,navigator,里面还有一些其他的参数,大家可以自行翻阅官方文档 <navigator url=&q ...