论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

ICCV 2013

　　本文提出了一种结合多种传统手工设计 feature 的多模态方法，在 label propagation 的基础上进行标签传递，进行半监督学习，综合利用各种 feature 的优势，自适应的对各种feature 的效果进行加权，即：对于判别性较好的 feature给予较高的权重，较差的 feature 给予较低的权重，然后将整个流程融合在一个框架中进行学习。

　　关于基于 Graph 的标签传递的基础知识，请参考具体论文，或者本博客的博文“Dynamic Label Propagation for Semi-supervised Multi-class Multi-label Classification”。

　　下面的公式即为所提出的 general 的 framework：

　　其中，这个公式主要有 3个成分，即：各个feature 所占的权重 $\alpha^{(v)}$，V 是所有feature类别总数，$G^{(v)}$ 是第 v 个特征对应的类别标签矩阵 (class label matrix)，$G$ 是我们所感兴趣的比较趋于一致的类别标签矩阵。通过求解该公式，同时得到 $G^{(v)}$, $G$, $\alpha^{(v)}$。

　　由于该框架并非凸的，那么无法直接对其进行求解，那么我们要做的就是将其拆分为 3个步骤，分别进行求解，即：

　　Step 1: 　　固定 $G^{(v)}$, $G$, 然后先求解 $\alpha^{(v)}$：

　　然后这个子问题，就可以利用拉格朗日乘数法进行求解，因为这是一个带有约束的最小值问题。

　　然后可以求解得到公式（11），即为各个模态的权重，但是蓝色加深字体，可能是作者笔误，我认为这里应该是 $\alpha^{(v)}$才对，因为求得就是这个，不知道为何弄出一个 $a^{(v)}$出来。额。。。

　　Step 2.　　就是固定已经求出的 $\alpha^{(v)}$ 以及 $G$，然后去求解 $G^{(v)}$：

　　将上述问题转换为：

　　可以得到公式（13），即为所求。

　　Step 3. 　　固定已经求出的 $\alpha^{(v)}$ 以及 $G^{(v)}$，然后去求解 $G$：

　　由此可以得到：

　　迭代的进行上述三个步骤，直至收敛。

　　最后一步，就是将所得到的标签向量取最大值，作为对应样本的标签，即：

　　完整的算法流程如下：

　　本文的实验部分，做的比较充分，在 4个数据集上进行了验证。本文所要验证的主要问题就是，这种方式自适应加权的 feature 组合可以得到更好的标签传递效果。

　　感受：

　　今天由于是博主要做实验对比，才去搜索对应的半监督学习论文，然后发现了聂飞平老师的文章，也算是比较老的文章了。我觉得这也给我们做学术的人提供了一个很好的示例，如何做研究。本来 label propagation 是一种经典的算法，那么如何在别人在算法进行修改的基础上，做出自己的东西来，额，这个其实看着是大空话，不过还是很有指导意义的。归纳下本文的贡献点，即：提出一种 general 的半监督学习框架，在传统方法 label propagation 的基础上，引入了多种 feature 的思想，对各个feature 的性能进行加权处理，当然求解方法也是经常使用的拆分成子问题的方法来做。

　　本文给出了算法的主要 code，但是各种 feature 的提取真是蛋疼，我找了半天才找到一个工具包，但是还是不够全面，因为文中涉及到多种feature的提取，我觉得作者最好还是将 feature的提取工具放出来比较好，这样别人在引用您的文章时，也可以很不费劲的进行实验，然后对比。额。。。

　　不说了，我去提 feature了。。。

　　拜拜。。。

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model的更多相关文章

论文笔记之：Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
论文笔记：Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering
Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering 2019-04-25 21: ...
论文笔记：Cross-Domain Visual Matching via Generalized Similarity Measure and Feature Learning
Cross-Domain Visual Matching,即跨域视觉匹配.所谓跨域,指的是数据的分布不一样,简单点说,就是两种数据「看起来」不像.如下图中,(a)一般的正面照片和各种背景角度下拍摄的照 ...
论文笔记：多标签学习综述（A review on multi-label learning algorithms）
2014 TKDE(IEEE Transactions on Knowledge and Data Engineering) 张敏灵,周志华简单介绍传统监督学习主要是单标签学习,而现实生活中目标样 ...
论文笔记 - GRAD-MATCH: A Gradient Matching Based Data Subset Selection For Efficient Learning
Analysis Coreset 是带有权重的数据子集,目的是在某个方面模拟完整数据的表现(例如损失函数的梯度,既可以是在训练数据上的损失,也可以是在验证数据上的损失): 给出优化目标的定义: $w^ ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
论文笔记之：Natural Language Object Retrieval
论文笔记之:Natural Language Object Retrieval 2017-07-10 16:50:43 本文旨在通过给定的文本描述,在图像中去实现物体的定位和识别.大致流程图如下 ...
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

随机推荐

Android Studio开发环境变量配置
1,Android Studio官网可以下载可以选择下载带有SDK版本 2,如果没有配置SDK,AVD虚拟机是没法使用的,真机调试也用不了. 有时会提醒adb is not connected. 和 ...
hdu 2090
PS:输入麻烦...我还以为是输入一个就输出一个...后来看了大神的才知道....暴力破解了... 代码; #include "stdio.h" int main(){ ,a,b; ...
搭建linux系统环境
1.安装centos6.4 x86,选择的是Desktop模式2.配置centos a关闭NetwrokManager(chkconfig NetworkManager off) b开机启动netwo ...
Configuration for Python to run on Android
It's exiting to learn to make app on Android with python. But when I check <Head First Python> ...
排版字号对应多少pt
各字号对应多少pt?初号= 42pt: 小初号= 36pt: 一号= 26pt: 二号= 22pt: 小二号= 18pt: 三号= 16pt: 四号= 14pt: 小四号= 12pt: 五号= 10. ...
Squid代理之透明代理
二．透明代理 1.检测squid是否安装
codeforces 711C Coloring Trees（DP）
题目链接:http://codeforces.com/problemset/problem/711/C O(n^4)的复杂度,以为会超时的思路:dp[i][j][k]表示第i棵数用颜色k涂完后bea ...
Cisco ASA 5505 Routing Between Two (Internal) VLANS
Referenced:http://www.petenetlive.com/KB/Article/0000869 Problem I had to set this up for a client t ...
SWUST0249 （凸包面积）
type node=record x,y:longint; end; ; var k,q,qq:longint; sum:double; f,g:..maxn] of node; m,i,j,a,b: ...
Ztree实现带checkBox的下拉框
UI <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="ArticleMove ...

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model

论文笔记之：Heterogeneous Image Features Integration via Multi-Modal Semi-Supervised Learning Model的更多相关文章

随机推荐

热门专题