Capel, David, and Andrew Zisserman. "Computer vision applied to super resolution." Signal Processing Magazine, IEEE 20, no. 3 (2003): 75-86.

简介

超分辨率重建的目的是使用一组低分辨率的图像来估计一副高分辨率图像。重建主要通过两个步骤来完成：配准低分辨率的图片组到一个公共的坐标系，然后使用图像的生成模型(generative image model)和图像的先验知识和匹配的图像组数据来形成高分辨率的图像。

图像配准

ML Registration to Two Views

假设真实的物体点投影到图像面上的坐标是$\underline{x}$，而检测到的对应的点$x$的位置的概率分布可以表示为高斯分布： $ Pr(x|\underline{x}) = \frac{1}{2\pi\sigma^2}exp(-\frac{(x-\underline{x})^2+(y-\underline{y})^2}{2\sigma^2}) $

在两幅低分辨率图像中，给定了相互对应的一组理想特征点${\underline{x}\leftrightarrow\underline{x}'}$，通过特征点检测算法计算得到的相应特征点对的似然概率就是： $Pr(x,x')=\prod_i{}Pr(x'\_i|\underline{x}'\_i)Pr(x_i|\underline{x}_i)$

使用$log$函数并去掉不影响函数最小化的$\sigma$后，点对的似然函数简化为：

$L = \sum_i{}((x_i-\hat{x}\_i)^2+(y\_i - \hat{y}\_i)^2 + (x'\_i-\hat{x'}\_i)^2 + (y'\_i-\hat{y'}_i)^2)$

式中理想点对间映射$\hat{x'} = H\hat{x}$可以带入其中，最终的方程中H和N个理想点的坐标（x，y共2N个参数）是未知数，使用非线性最优化进行估计，类似相机标定，得到最终的Homography矩阵H 。

Algorithm: Automatic Two-View Registration

Feature : 计算亚像素特征点，Key Poins
特征点匹配
RANSAC 配准：得到Homography矩阵 H
最优估计 H：通过最大化似然估计，得到优化的H
使用优化的H重新计算特征点匹配 通过迭代，使得匹配点对稳定，得到最后的H

多幅配准

如果是多幅图像，可以选择一副图像，然后估计所有其他图像到这幅图像的映射Homography矩阵系列$H_i$。

光度配准

由于相机的自动曝光、白平衡或是由于相机方位的改变，图像组的亮度和颜色并不统一，通常在图像位置匹配完成后，还需要进行灰度色彩值的配准，在两组图像或特征点区域中，我们可以设计一个线性的辐射度变化，然后通过匹配后的像素对应关系，计算这一线性变化的参数。

超分辨率重建

实际采集到的低分辨率图像可以看成是高分比率图像通过一系列的劣化过程得到的，这些过程包括：几何变换、光学模糊、空间采样和噪声等，超分辨重建的过程其实就是这个劣化过程的逆过程，利用劣化后的图像来估计清晰的图像。接下来会讨论两种方法ML似然估计和MAP贝叶斯后验估计，但在之前会给出图像的生成模型。

生成模型 Generative Models

低分辨率图像的生成可以用一个公式来表示： $ g_n = \alpha_nM_n\bar{f}+\beta_n+\eta_n $

其中各个参数的解释如下：

$\bar{f}$：理想的高分辨率图像按照像素位置展开的矢量；
$g_n$：第n张低分辨率图像；
$\alpha_n,\beta_n$：灰度或颜色配准的参数；
$M_n$：劣化矩阵 $M = s\downarrow(h(u,v) * \bar{f}(T(x, y))$，由以下几个部分组成：
- $T$：几何变换或变形
- $h(u, v)$ ：综合的点扩展函数
- $s\downarrow$：下采样
$\eta_n$：噪声

如果有N幅图像，就可以构成一个超定的线性系统：

最大似然估计

假设图像的噪声是高斯噪声，观测到的图样的概率为： $ Pr(g_n|\bar{f})=\prod_{\forall{}x,y}\frac{1}{\sigma_n\sqrt{2\pi}}exp(-\frac{(\bar{g_n}(x,y)-g_n(x,y))^2}{2\sigma_n^2}) $

式中的$\bar{g_n}$是有生成模型计算得到的，使用Log函数，去掉与最小化无关的$\sigma$得到的似然函数为： $ \sum_{\forall{}n}\mathcal{L}(g_n)=-\sum_{\forall{}n}\lVert{}M_n\bar{f}-g_n\rVert^2=-\lVert{}Mf-g\rVert^2 $

由于M非常大，这个类似最小二乘的线性系统，很难用伪逆$M^+$来计算，而需要使用迭代法进行计算，相关方法在常规的数值线性代数教科书上有详细描述。

贝叶斯最大后验估计

该方法普遍比最大似然估计有更好的效果，并且加入了图像的先验知识。由贝叶斯概率公式$Pr(\bar{f}|g)=Pr(g|\bar{f})Pr(\bar{f})/Pr(g)$，使用Log函数，MAP方法的最优化问题可以表示为： $f_{map}=\mathop{argmax}\_f lg Pr(\bar{f}) + lg Pr(g|\bar{f}) = \mathop{argmax}\_f lg Pr(\bar{f}) - \frac{1}{2\sigma_n^2}\lVert{}Mf-g\rVert^2$

Gaussian MRFs

其中$Pr(f)$就是图像的先验知识。ML方法的最大问题在于分辨率持续增大时，噪声的影响也持续增大，最终图像信号淹没在了噪声中。而在MAP方法中，为了防止像素值无顾忌的被噪声占据，可以约束一个像素和其周边的像素具有一定的连续性，从而约束像素值在一个范围内。在数学表达式上，可以使用该像素点的导数来表示它和周边的连续性，如$d_x, d_y, d_{xy}, d_{yx}$。如前所述，$f$是按像素展开的矢量，而梯度算子在二维上是一个滤波器算子，也需要展开为一个更大的稀疏矩阵$L$，并且像素值变化连续，导数就需要小，那么在MAP最大化式中，需要加上负号。综上，可以定义图像的先验概率为： $ Pr(f)=\frac{1}{Z}exp(-f^TQf), Q=L^TL $ 则Log的最大后验概率则会变为： $ f_{map}=\mathop{argmax}_f-\gamma^2\lVert{}Lf\rVert^2-\frac{1}{2\sigma^2}\lVert{}Mf-g\rVert^2 $

Huber MRFs

Gaussian MRFs方法使用高斯函数保证图像的平滑特性，但导致应该保持非连续的边界区域被过度平滑。为了保证边缘处的非连续性，采用更加鲁棒的估计方法Huber函数来估计像素点的梯度值，在计算出梯度后，带入huber函数，则可以保证对于分界线处梯度值的保证，相关信息可见Robust估计相关资料。

效果图

下面两张图给出了ML和MAP两种方法效果图，点开看大图。

Computer Vision Applied to Super Resolution的更多相关文章

Analyzing The Papers Behind Facebook's Computer Vision Approach
Analyzing The Papers Behind Facebook's Computer Vision Approach Introduction You know that company c ...
Speech Super Resolution Generative Adversarial Network
博客作者:凌逆战博客地址:https://www.cnblogs.com/LXP-Never/p/10874993.html 论文作者:Sefik Emre Eskimez , Kazuhito K ...
[转载]Three Trending Computer Vision Research Areas，从CVPR看接下来几年的CV的发展趋势
As I walked through the large poster-filled hall at CVPR 2013, I asked myself, “Quo vadis Computer V ...
计算机视觉和人工智能的状态：我们已经走得很远了 The state of Computer Vision and AI: we are really, really far away.
The picture above is funny. But for me it is also one of those examples that make me sad about the o ...
Computer Vision Tutorials from Conferences (3) -- CVPR
CVPR 2013 (http://www.pamitc.org/cvpr13/tutorials.php) Foundations of Spatial SpectroscopyJames Cogg ...
[学习笔记] CS131 Computer Vision: Foundations and Applications：Lecture 9 深度学习
深度学习 So far this week Edge detection RANSAC SIFT K-Means Linear classifier Mean-shift PCA/Eigenfaces ...
[学习笔记] CS131 Computer Vision: Foundations and Applications：Lecture 4 像素和滤波器
Background reading: Forsyth and Ponce, Computer Vision Chapter 7 Image sampling and quantization Typ ...
【E2EL5】A Year in Computer Vision中关于图像增强系列部分
http://www.themtank.org/a-year-in-computer-vision 部分中文翻译汇总:https://blog.csdn.net/chengyq116/article/ ...
code and dataset resources of computer vision
From:http://rogerioferis.com/VisualRecognitionAndSearch2014/Resources.html Source Code Non-exhaustiv ...

随机推荐

careercup-树与图 4.6
4.6 设计一个算法,找出二叉查找树中指定结点的“下一个”结点(也即中序后继).可以假定每个结点都含有指向父节点的连接. 思路: 有两种情况:1)如果该结点存在右子树,则中序后继即为右子树中最小的结点 ...
关于Servlet中重定向
public class Red1Servlet extends HttpServlet { public void doGet(HttpServletRequest request, HttpSer ...
Java基础知识强化之IO流笔记61：输入流和输出流使用总结
1. 结构: 字节流:InputStream,OutputStream 字符流:Reader,Writer 2. 字符流和字节流: (1)Reader:读取字符流的抽象类 BufferedRead ...
UISenior之数据的本地化持久化
数据的本地化主要分为两个方面:1.简单数据的本地持久化(NSString.NSArray.NSDictionary.NSData)2.复杂数据的本地持久化(本文以Person类为例) 简单对象的本地化 ...
Web Services之SOAP学习
Web Services之SOAP [toc] 什么是SOAP SOAP(Simple Object Access Protocol)简单对象访问协议是在分散或分布式的环境中交换信息的简单的协议,是一 ...
js 如何判断数据是数据还是对象
如果用typeof测试,数组和对象都是显示的Object, 测试方式:var mycars=new Array();mycars[0]="Saab";mycars[1]=" ...
C#微信公众号开发 -- （三）用户关注之后自动回复
通过了上一篇文章之后的微信开发者验证之后,我们就可以做微信公众号的代码开发了. 当我们点击关注某个公众号的时候,有时候会发现他会自动给我们回复一条消息,比如欢迎关注XXX公众号.这个功能其实是在点击关 ...
MathType支持64位 WIN 7Office 2013（完美解决）（转载）
经过几次尝试解决了,方法如下: 1. 安装MathType 6.8 (别的版本不知是否适用,本人安装的是该版本) 2. 将以下两个文件拷贝出来 C:\Program Files (x86)\MathT ...
ASP.NET页面生命周期总结（2）
HttpAplicationFactory获取一个HttpApplication对象: 内部:1.如果是第一次请求过来,那么就把global文件编译成一个类型.(后续请求来的,就可以直接获取这个类型) ...
学习XAML中的一些基本语法
1:slider 控件 2:x:名称空间的使用 3:事件处理器 event handler { <Button x:Name="button1" Click=" ...

Computer Vision Applied to Super Resolution

简介

图像配准

超分辨率重建

效果图

Computer Vision Applied to Super Resolution的更多相关文章

随机推荐

热门专题