今天作了一个paper reading,感觉论文不错,马克一下~

CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies"



研究视觉问题的同学都知道,视觉问题很多都是多标签的问题,在进行优化的时候,我们都可以把他们转化为能量函数的形式,由数据项和平滑项组成。这些能量函数可以用变分的形式进行表达,当能量函数的项是非凸的话,一般使用梯度下降迭代的方法进行近似求解,有可能只能得到局部极小值。为了求解到全局最优值,我们致力于将非凸问题转化为凸问题,然后进行优化求解。

本篇论文基于泛函提升的方法提出空间连续的凸松弛框架,即将非凸问题转化为凸问题,是一种解决亚标签精度的多标签问题的方法。相比以前泛函提升的方法,该论文的方法能够使用较少的标签推断出不错的结果。这是因为以前方法标签之间是线性的,为了得到一个较好的结果,需要有很多的标签,而该论文的方法标签之间是凸近似的,可以是线性的,也可以是二次的。此外,该论文提出的将非凸问题转化为凸问题的方法,在数学上是最紧的凸松弛,有严格的数学推导。

该论文的整体思路是什么样的呢?现在我们有能量函数的变分表达式,分别对两项求取凸包络,怎么求呢?作者使用两次共轭的方法进行求解,在论文的第三部分有数学推导,这种方法是将非凸问题转化为凸问题最紧的方法。然后对转化后的数学表达式进行优化求解,可以把这个表达式转化为一个鞍点形式,进而使用原对偶的方法进行求解。x相比传统方法,该论文的优势是使用较少的标签,能够推断出空间平滑的结果,减少标签的数量,以视差图为例,如下:

为什么其标签少,还能得到不错的效果呢?请看下图

本篇论文的求解方法,作者公布了代码,他们还在ECCV2016发表了类似的文章,如下:

Code:https://github.com/tum-vision/sublabel_relax

Sublabel-AccurateRelaxation of Nonconvex Energies (T. Möllenhoff,E. Laude, M. Moeller, J. Lellmann, D. Cremers),In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

Sublabel-AccurateConvex Relaxation of Vectorial MultilabelEnergies (E. Laude, T. Möllenhoff, M. Moeller, J. Lellmann,D. Cremers),In European Conference on Computer Vision and Pattern Recognition (ECCV), 2016.

浅析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention的更多相关文章

  1. 深度视觉盛宴——CVPR 2016

    小编按: 计算机视觉和模式识别领域顶级会议CVPR 2016于六月末在拉斯维加斯举行.微软亚洲研究院在此次大会上共有多达15篇论文入选,这背后也少不了微软亚洲研究院的实习生的贡献.大会结束之后,小编第 ...

  2. (转)CVPR 2016 Visual Tracking Paper Review

    CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072 ...

  3. CVPR 2016 paper reading (3)

    DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations, Ziwei Liu, Pin ...

  4. CVPR 2016 paper reading (2)

    1. Sketch me that shoe, Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M. Hospedales, Cheng Chan ...

  5. CVPR 2016 paper reading (6)

    1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fi ...

  6. [CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记

    p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

  7. 论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)

    论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...

  8. Single Image Haze Removal(图像去雾)-CVPR’09 Best Paper

    公式推导 paper闪光点 找到了一个很简洁的假设. paper不足 代码跑起来很慢.据说2010年的ECCV那篇是改进的.

  9. 目标检测网络之 YOLOv2

    YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体. 每个格子预测B个bounding b ...

随机推荐

  1. 开源协议瞎扯淡,什么是 MIT 协议?[转]

    图片来源:http://ruby-china.org/topics/15979

  2. css 宽高自适应的div 元素 如何居中 垂直居中

    在我们 编写css 样式的时候经常会遇见一个问题 那就是一个 宽高未知的元素 要让他 垂直居中如何实现这个呢 下面是我常用的两种方法 上代码 下面的是 结构代码 <div class=" ...

  3. PHPCMS某处设计缺陷可致authkey泄露

    在分析几个phpcms的漏洞就换分析其他的,换换口味. 漏洞来源:http://wooyun.jozxing.cc/static/bugs/wooyun-2015-0106892.html swfup ...

  4. Linux(四)使用Xshell5远程登录

    Xshell5和Xftp5的安装包 链接:https://pan.baidu.com/s/1q3-ch75TW3lvC3KX25klNQ 密码:m31n 说明: 公司开发的时候,具体情况是这样的: 1 ...

  5. TF-IDF In Scikit-Learn

    TF-IDF In Scikit-Learn 2017年9月30日补充   其实在算下面TF-IDF的步骤之前,还有一步,就是计算Term Frequency 也就是词频.当然,scikit-lear ...

  6. [Codeforces 176B]Word Cut

    Description 题库链接 给你两个字符串 \(S\) 和 \(T\) ,准许你 \(k\) 次操作,每次将字符串左右分成两个非空的部分,再交换位置,问你有多少种不同的操作方法将 \(S\) 串 ...

  7. [SCOI 2010]传送带

    Description 题库链接 在一个 \(2\) 维平面上有两条传送带,每一条传送带可以看成是一条线段.两条传送带分别为线段 \(AB\) 和线段 \(CD\) .在 \(AB\) 上的移动速度为 ...

  8. [SDOI2016]储能表

    Description 有一个 n 行 m 列的表格,行从 0 到 n−1 编号,列从 0 到 m−1 编号.每个格子都储存着能量.最初,第 i 行第 j 列的格子储存着 (i xor j) 点能量. ...

  9. bzoj 2564 集合的面积

    Description 对于一个平面上点的集合P={(xi,yi )},定义集合P的面积F(P)为点集P的凸包的面积. 对于两个点集A和B,定义集合的和为: A+B={(xiA+xjB,yiA+yjB ...

  10. bzoj 5289: [Hnoi2018]排列

    Description Solution 首先注意到实际上约束关系构成了一棵树 考虑这个排列 \(p\),编号为 \(a[i]\) 的出现了,\(i\) 才可以出现 那么如果连边 \((a[i],i) ...