PatchMatch Stereo - Stereo Matching with Slanted Support Windows
Tips
MVS: Multi-View Stereo
Abstract
- 思路:一般的局部立体方法是一个具有整形数值视察(disparity)的支持镜头进行匹配,其中有一个隐藏的假设:再支持区域的像素中具有恒定的视差。这个假设在倾斜的表面是不成立的。
- 每个像素有一个单独的3D平面。
- 除了PatchMatch的空间传播方法外,还有
- 在立体中左右视图传播的图传播。
- 时间传播,从视频的前和连续帧中传播平面。
- 倾斜支持窗口可以用来计算全球立体方法的代价,允许明确的遮挡处理,可以处理大的非纹理区域。
- 重构了高度倾斜的表面,并以亚像素精度实现了视差细节。
Introduction
原来局部立体匹配中,恒定时差不太可能发生的原因有二:
- 支持的窗口包含与中心像素位于不同表面的像素。
- 窗口捕捉到倾斜的表面,不是fronto-parallel。
- [ ] ??? 这篇论文提出了一种基于PatchMatch的算法,有效地解决了在每个像素点找到一个“好的”倾斜支持平面的问题。与其他局部算法相比,算法没有构建完整的cost-volume,这在本论文算法中是不可能的,因为标签空间包含了无限个3D平面。相反,算法巧妙地遍历了其中的一部分。这使得一次优化成为可能,平面以及分配给平面的像素能够联合估计,这有效地绕过了错失正确平面的问题。PatchMatch本身就是一个近似稠密的最近邻算法。这篇论文利用随机搜索和传播的PatchMatch思想来寻找平面极线上的最近邻。这使得能够处理倾斜的表面和亚像素精度。
Algorithm
对于两张图像中的每个像素\(p\), 寻找一个平面\(f_p\),视差公式:
\[
d_p = a_{f_p}p_x+b_{f_p}p_y+c_{f_p} (1)
\]
总的优化函数如下:
\[
f_p = argmin_{f\in\xi}m(p,f)(2)
\]
其中\(\xi\)表示所有可能的平面,它的大小是无限的。
代价公式如下:
\[
m(p,f)=\sum_{q\in W_p}w(p,q)\rho(q, q-d_p)
\]
其中\(W_p\)表示以像素\(p\)作为中心的方形窗口。但是与现有方法不同,\(W_p\)不再是2D的,而是3D的。权重函数\(w(p,q)\)用来解决边缘育肥问题,并且实施自适应支持权重的思想,它通过像素之间的颜色来计算他们之间的相似性:
\[
w(p,q) = e^{-||I_p-I_q||}
\]
其中,\(||I_p-I_q||\)计算像素\(p\)和\(q\)在RGB空间的L1距离。
现在来关注\(\rho(q,q')\)部分,首先根据平面\(f\)计算像素\(q\)的视差,并且从\(q\)的x坐标减去这个视差得到在另一张图上的匹配点\(q'\),函数\(\rho(q,q')\)用来计算像素\(q\)和\(q'\)之间的不相似性:
\[
\rho(q,q')=(1-\alpha)min(||I_q-I_{q'}||,\tau_{col})+\alpha min(||-||,\tau_{grad})
\]
2.2 PatchMatch计算视差
随机初始化
给两张图像的一个像素的一个随即平面。
- Somehow,得到一个随机平面的一个点\(P(x_0, y_0, z_0)\)。
- 然后计算平面法向量\(n=(n_x, n_y, n_z)\)
- \(a_f=-n_x/n_z\)
- \(b_f=-n_y/n_z\)
- \(c_f=(n_xx_0 + n_yy_0+n_zz_0)/n_z\)
迭代和传播
四种步骤。(1). spatial propagation, (2). view propagation, (3). temporal propagation, (4). plane refinement。
首先处理左图的所有像素,然后处理右图的所有像素。
- 在奇数次迭代中,从左上角的像素开始,逐行遍历。
- 在偶数次迭代中,颠倒顺序。
Search
简单三步骤
- 初始化:两张图A和B,将A图中的每一个像素,随机赋予一个偏移量,在B图中找到一个与之对应。
- 传播:每个像素检查来自相邻块的便宜是否提供了更好的匹配,如果是则采用邻居的偏移量。
- 搜索:每一个像素点在以现在的偏移量位中心的同心圆内部,找到一个更加匹配的偏移量。
搜索的半径以图片为尺寸,然后以1/2的收敛速度减少,直到半径为1.
PatchMatch Stereo - Stereo Matching with Slanted Support Windows的更多相关文章
- Calculating Stereo Pairs
Calculating Stereo Pairs Written by Paul BourkeJuly 1999 Introduction The following discusses comput ...
- Paper Reading: Stereo DSO
开篇第一篇就写一个paper reading吧,用markdown+vim写东西切换中英文挺麻烦的,有些就偷懒都用英文写了. Stereo DSO: Large-Scale Direct Sparse ...
- PatchMatch小详解
最近发了两片patch match的,其实自己也是有一些一知半解的,找了一篇不知道谁的大论文看了看,又回顾了一下,下面贴我的笔记. The PatchMatch Algorithm patchmatc ...
- Windows上使用“LogView”打开大文件
最近因为工作需要要打开一个300+MB的文件,试过了N个编辑器不是打不开就是软件直接挂掉或是占用内存太大,已经严重影响了我的工作 还好在网络上找到老外写的一个免费软件,官网上说是可以打开4G+的文件( ...
- windows安装redis
下载安装包,由于redis不提供windows版本,但是通过官网了解,如下: The Redis project does not officially support Windows. Howeve ...
- 64位Windows下安装Redis教程
转载于:http://www.itxuexiwang.com/a/shujukujishu/redis/2016/0216/104.html?1455868495 Redis对于Linux是官方支持 ...
- Native code on Windows Phone 8(转)
Windows Phone 8 introduces the ability to use native code to implement Windows Phone. In this sectio ...
- Windows下安装并设置Redis
Redis对于Linux是官方支持的,安装和使用没有什么好说的,普通使用按照官方指导,5分钟以内就能搞定.详情请参考: http://redis.io/download 但有时候又想在windows下 ...
- redis 在windows 上的安装与使用
1.redis-windows 最近在做一个抢拍模块,由于过于平凡的insert与update I/O受不了,故只好把东西放内存里,等拍卖结束了,在写入磁盘. 至于为什么要用window呢? 因为服务 ...
随机推荐
- Linux之《荒岛余生》(三)内存篇
原文:https://juejin.im/post/5c00aee06fb9a049be5d3641 小公司请求量小,但喜欢滥用内存,开一堆线程,大把大把往jvm塞对象,最终问题是内存溢出. 大公司并 ...
- salesforce零基础学习(九十四)classic下pagelayout引入的vf page弹出内容更新此page layout
我们在classic环境中,有时针对page layout不能实现的地方,可以引入 一个vf page去增强标准的 page layout 功能,有时可能要求这个 vf page的部分修改需要更新此 ...
- 关于html的相关讲解
浏览器chrome Chrome它内部有一个解析器,这个解析器就是解析我们的代码,各个浏览器的内核不一样,所以存在浏览器的兼容.这个内核是一个引擎. 谷歌的内核是webkit 引擎是v8. 客户端的请 ...
- 隐马尔科夫模型(Hidden Markov Models) 系列之五
转自:http://blog.csdn.net/eaglex/article/details/6458541 维特比算法(Viterbi Algorithm) 找到可能性最大的隐藏序列 通常我们都有一 ...
- Atlassian JIRA服务器模板注入漏洞复现(CVE-2019-11581)
0x00 漏洞描述 Atlassian Jira是澳大利亚Atlassian公司的一套缺陷跟踪管理系统.该系统主要用于对工作中各类问题.缺陷进行跟踪管理. Atlassian Jira Server和 ...
- python基础-面向对象编程之组合
面向对象编程之组合 定义:一个对象中拥有另一个或其他多个对象的属性和方法. 作用:减少代码的冗余,降低耦合度 关于耦合度的说明 耦合:通俗地讲,就是相互作用,相互影响的意思 耦合度越高,程序的可扩展性 ...
- 微信小程序-获取当前位置和城市名
微信小程序-获取当前城市位置 1, 获取当前地理位置,首先要拿到用户的授权wx.openSetting: 2,微信的getLocation接口,获取当前用户的地理位置(微信返回的是经纬度,速度等参数) ...
- ASCII、Unicode、utf-8、utf-16、utf-32
理解ASCII.Unicode.utf-8.utf-16.utf-32 目录 理解ASCII.Unicode.utf-8.utf-16.utf-32编码与解码字符集字符编码ASCIIUnicodeUT ...
- 【Spring AOP】Spring AOP之如何通过注解的方式实现各种通知类型的AOP操作进阶篇(3)
一.切入点表达式的各种类型 切入点表达式的作用:限制连接点的匹配(满足时对应的aspect方法会被执行) 1)execution:用于匹配方法执行连接点.Spring AOP用户可能最经常使用exec ...
- Linux的IP详解
俗话说:黑发不知勤学早,白首方悔读书迟. ...