利用光场进行深度图估计(Depth Estimation)算法之一—

前面几篇博客主要说了光场相机，光场相机由于能够记录相机内部整个光场，可以实现重聚焦(模糊线索)和不同视角的变换(视差线索)，同时也可以利用这个特性进行深度估计（Depth Estimation）。

先说一下利用重聚焦得到的不同聚焦平面图像获取深度图（模糊线索 ,defocus），其实这个原理非常简单。

1. 以聚焦范围为0.2F-2F为例，alpha∈(0.2,2)，取Depth Resolution=256, 那么步长就为(2-0.2)/256，我们通过重聚焦算法可以获取得到这个范围内的256幅重聚焦图像。

2. 对每一幅重聚焦的图像进行求梯度的操作，得到梯度图，比如使用matlab中的Gradient2D()函数，得到256幅梯度图。注意，都是三通道的，所以求梯度也要在每一个通道进行。

用C++实现的gradient2D的代码如下：

 void gradient2D(Mat input, Mat& output)

 {

     Mat Ix(input.size(), CV_32F);

     Mat Iy(input.size(), CV_32F);

     //get Iy

     for (int nrow = ; nrow < input.rows; nrow++)

     {

         for (int ncol = ; ncol < input.cols; ncol++)

         {

             if (ncol == )

             {

                 Ix.at<float>(nrow, ncol) = abs(input.at<uchar>(nrow, ) - input.at<uchar>(nrow, ));

             }

             else if (ncol == input.cols - )

             {

                 Ix.at<float>(nrow, ncol) = abs(input.at<uchar>(nrow, ncol) - input.at<uchar>(nrow, ncol - ));

             }

             else

             {

                 Ix.at<float>(nrow, ncol) = abs((input.at<uchar>(nrow, ncol + ) - input.at<uchar>(nrow, ncol - )) / 2.0);

             }

         }

     }

     //get Ix

     for (int nrow = ; nrow < input.rows; nrow++)

     {

         for (int ncol = ; ncol < input.cols; ncol++)

         {

             if (nrow == )

             {

                 Iy.at<float>(nrow, ncol) = abs(input.at<uchar>(, ncol) - input.at<uchar>(, ncol));

             }

             else if (nrow == input.rows - )

             {

                 Iy.at<float>(nrow, ncol) = abs(input.at<uchar>(nrow, ncol) - input.at<uchar>(nrow - , ncol));

             }

             else

             {

                 Iy.at<float>(nrow, ncol) = abs((input.at<uchar>(nrow + , ncol) - input.at<uchar>(nrow - , ncol)) / 2.0);

             }

         }

     }

     magnitude(Ix, Iy, output);

 }

3.对每一幅梯度图在局部窗口内进行均值滤波，相当于参考每一个像素点处的邻域梯度值，增加鲁棒性。这个可以简单的使用OpenCV中的Blur()函数实现。

4.均值滤波后的图像也是三通道的，这一步需要将每一个像素点处的三个通道值求平均，得到灰度图像。每一个像素点处的灰度值就为其对应的梯度值，而大家都知道，梯度值能够反应边缘、纹理等信息。

5.在每一个像素点处，遍历256幅图像，找到梯度值最大的那一幅图像(即该点在这一幅图像中最清晰，也就是聚焦到该像素点对应的物平面)，获取该图像的索引值。（比如某一像素点处的第200幅图像中的梯度值最大，则记录index=200）。遍历所有像素点，并获取索引值。这样得到的是一幅索引图像，每一个像素点处的值对应为该点在该索引下的图像中梯度最大，在程序中为0~255.

6.得到上述索引图后就简单了，可以根据每一个像素点处的索引值找到对应的alpha值，也就相应的得到alpha*F的值，该值就为像距V。

7.得到像距V，根据光学中的物像位置公示1/U +1/V = 1/F。V和F均已知，当然可以算出该点处的U值，而U就是深度，深度图就得到了。

这次没有放图，有时间再放上去，原算法参考论文为[1]，中文较为详细的参考[2]

[1] Tao M W, Hadap S, Malik J, et al. Depth from combining defocus and correspondence using light-field cameras[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013: 673-680.

[2] 杨德刚, 肖照林, 杨恒, 等. 基于光场分析的多线索融合深度估计方法[J]. 计算机学报, 2015, 38(12): 002437-2449.

利用光场进行深度图估计(Depth Estimation)算法之一——聚焦算法的更多相关文章

利用光场进行深度图估计(Depth Estimation)算法之二——匹配算法
光场相机由于能够捕获相机内部光线的强度和方向而得到整个光场,可以实现重聚焦(refocus)和视角变换等功能.进而可以进行深度估计获取深度图,前面说过利用重聚焦的图像进行深度估计,今天说一下利用不同视 ...
泡泡一分钟：Towards real-time unsupervised monocular depth estimation on CPU
Towards real-time unsupervised monocular depth estimation on CPU Matteo Poggi , Filippo Aleotti , Fa ...
【HEVC帧间预测论文】P1.9 Coding Tree Depth Estimation for Complexity Reduction of HEVC
Coding Tree Depth Estimation for Complexity Reduction of HEVC <HEVC标准介绍.HEVC帧间预测论文笔记>系列博客,目录见: ...
deep learning+ Depth Estimation
Depth estimation/stereo matching/optical flow @CVPR 2017 Unsupervised Learning of Depth and Ego-Moti ...
[技术栈]C#利用Luhn算法(模10算法)对IMEI校验
1.Luhn算法(模10算法) 通过查看ISO/IEC 7812-1:2017文件可以看到对于luhn算法的解释,如下图: 算法主要分为三步: 第一步:从右边第一位(最低位)开始隔位乘2: 第二步:把 ...
行为识别笔记：improved dense trajectories算法（iDT算法）（转载）
iDT算法是行为识别领域中非常经典的一种算法,在深度学习应用于该领域前也是效果最好的算法.由INRIA的IEAR实验室于2013年发表于ICCV.目前基于深度学习的行为识别算法效果已经超过了iDT算法 ...
比微软kinect更强的视频跟踪算法--TLD跟踪算法介绍
转自:http://blog.csdn.net/carson2005/article/details/7647500 TLD(Tracking-Learning-Detection)是英国萨里大学的一 ...
FM算法(一)：算法理论
主要内容: 动机 FM算法模型 FM算法VS 其他算法一.动机在传统的线性模型如LR中,每个特征都是独立的,如果需要考虑特征与特征直接的交互作用,可能需要人工对特征进行交叉组合:非线性SVM可 ...
最短路经算法简介(Dijkstra算法，A*算法，D*算法)
据 Drew 所知最短路经算法现在重要的应用有计算机网络路由算法,机器人探路,交通路线导航,人工智能,游戏设计等等.美国火星探测器核心的寻路算法就是采用的D*(D Star)算法. 最短路经计算分静态 ...

随机推荐

一起学习Hibernate: Hibernate01 —— Hibernate的概述与入门案例
一 Hibernate的介绍 1 让我们从JDBC与替代它的框架Hibernate进行一下对比. 1.1 JDBC的缺点 1) 代码结构繁琐.每次书写sql语句操作数据库都得需要很多步; 2) 是面向 ...
Django学习日记06_视图_URLconf、View
URLconf Django通过URLconf来响应网页请求,在项目设置settings.py中,设定了ROOT_URLCONF值来指定默认的URLconf(即mysite.urls),当HTTPRe ...
Elasticsearch强制重置未分配的分片(unassigned)
强制重置未分片的分片,这个问题源自于Elasticsearch维护中,Node意外退出的场景. 意外退出后Elasticsearch由于网络原因或者jvm性能压力,未能短时间内分配分片. 看一下分片的 ...
Python使用Tabula提取PDF表格数据
今天遇到一个批量读取pdf文件中表格数据的需求,样式大体是以下这样: python读取PDF无非就是三种方式(我所了解的),pdfminer.pdf2htmlEX 和 Tabula.综合考虑后,选择了 ...
PHP连接LDAP进行登录验证
基于安全性考虑,准备把PHP做的自动化平台加入ldap登录验证,具体做法如下: 了解背景: LDAP 的全称是"轻量级目录访问协议(Lightweight Directory Access ...
2017 年的人生 hard 模式终于结束了，2018年回归初心
2017 年的人生 hard 模式终于结束了,2018年回归初心 2017年对于我个人来讲, 毫不夸张的说算是近十年来除了高考那一年,最最惊心动魄的一年了,没有之一. >>>开篇 ...
CSS中的块级元素（block）与行内元素（inline）
css中有3种基本的定位机制:普通流(相对定位实际上看做普通流定位模型的一部分)浮动(float)绝对定位(固定定位是绝对定位的一种)所以在学习浮动之前,我们先要了解块级元素与内联元素(行内元素).块 ...
【转载】Linux下的IO监控与分析
近期要在公司内部做个Linux IO方面的培训, 整理下手头的资料给大家分享下各种IO监视工具在Linux IO 体系结构中的位置源自 Linux Performance and Tuning G ...
ps 替换背景以及调整尺寸
领导吩咐我修改她的图片背景,尺寸, 屁颠屁颠去弄,半小时后发现大学里学的 ps 忘差不多了,这里总结一下修改图片背景以及尺寸的基本操作. 1. 去除原背景方法一: 选中魔术橡皮擦, 点击原图中背景, ...
跟我一起读postgresql源码(十一)——Executor(查询执行模块之——Materialization节点(上))
物化节点顾名思义,物化节点是一类可缓存元组的节点.在执行过程中,很多扩展的物理操作符需要首先获取所有的元组后才能进行操作(例如聚集函数操作.没有索引辅助的排序等),这时要用物化节点将元组缓存起来.下 ...

利用光场进行深度图估计(Depth Estimation)算法之一——聚焦算法

利用光场进行深度图估计(Depth Estimation)算法之一——聚焦算法的更多相关文章

随机推荐

热门专题