解读“Deep Neural Decision Forests” 2015 Winner of the David Marr Prize

2015ICCV会议最佳论文奖，即有着“计算机视觉界最高奖”之称的马尔奖(Marr Prize)授予了由微软剑桥研究院(Microsoft Research, Cambridge UK)、卡内基梅隆大学和意大利布鲁诺凯斯勒研究中心(Fondazione Bruno Kessler)合作的论文“深度神经决策森林(Deep Neural Decision Forests)”。论文提出将分类树模型和深度神经网络的特征学习相结合进行端到端训练的深度学习方法。该方法使用决策森林(decision forest)作为最终的预测模型，提出了一套完整的、联合的、全局的深度学习参数优化方法。在手写数据库MNIST和图像分类数据库ImageNet的实验中都取得了超越当前最好方法的结果。这是傅建龙老师、梅涛老师和罗杰波老师对本篇论文的简介。

本人最近要作这篇文章的组会报告，在以上三位老师介绍的基础上，有了大概的了解，对这篇论文进行了学习。我们做深度学习的同学都知道，怎么训练学习模型和测试是重点，即将深度学习框架和随机森林结合在一起，如何前向传播和反向传播呢？以及叶子节点预测分布的更新？本篇博客分为三个部分重点阐述这些问题。

一、前向传播

预备知识：由图可知，每个分离节点（split nodes）的参数由DNN来学习(representation learning)，DNN最后一层是全连接层，每个节点单元的输出作为分离节点决策函数(d1,d2,...)的输入参数，本篇论文采用的决策函数是sigmoid函数。知道决策函数后，我们可以计算其路径函数（routing
function），每棵树的根节点，其路径函数的值赋予1，然后乘以该节点的决策函数值d，得到左边子节点的路径函数1*d，右边子节点的路径函数值为1*(1-d)，以此类推，可以计算出每颗决策树节点的路径函数。

首先，我们要初始化分离节点决策函数的参数（theta），以及对叶子节点分布参数(pai)初始化为均匀分布。然后根据上面内容计算各个节点的路径函数（routing function）。当数据集的标签确定时，叶子节点的预测类别也是确定的，初始化时是均匀分布，当训练完成时，其(prediction)满足一定的概率分布。

然后，当样本来时，通过DNN，得到分离节点决策函数的参数，从而计算出决策函数和路径函数(routing function)，到叶子节点时，我们使用该节点的路径函数乘以该节点监督类别的概率，作为预测输出，并通过对每个节点的预测输出进行求和，得到这棵树的预测输出，这样，我们就可以得到各个类别的概率输出。

二、反向传播

本篇论文的反向传播分为两个部分，第一部分是决策树的反向传播，第二部分是DNN的反向传播，紧跟在决策树后面，DNN的反向传播大家都很清楚。下面我们重点说一下本篇论文决策树如何反向传播？

由Decision tree决定的梯度部分，可以换算成如下公式：

即，由决策函数和A函数决定，在反向传播的过程中，首先达到的是叶子节点，通过以上公式，可以计算出叶子节点的决策函数和A函数，再往上，父节点的A函数由子节点的A函数相加得到，以此类推，只需一次反向遍历，就可以完成反向传播。

三、叶子节点分布函数

本篇论文采用交替迭代的方法，依次更新决策函数的参数和叶子节点分布函数，以上内容是对决策函数参数的迭代，对叶子节点分布函数的迭代如下：

为什么采用这个更新策略，文章作者在补充材料里进行了证明，即采用这种方式，目标函数是收敛的。本篇论文的迭代策略是：

以上是我对本文的理解，错误之处，烦请指出，谢谢！

关于2015 ICCV会议情况，推荐这篇文章：【CCCF动态】视觉的饕餮盛宴：第15届国际计算机视觉会议

解读“Deep Neural Decision Forests” 2015 Winner of the David Marr Prize的更多相关文章

On Explainability of Deep Neural Networks
On Explainability of Deep Neural Networks « Learning F# Functional Data Structures and Algorithms is ...
深度神经网络如何看待你，论自拍What a Deep Neural Network thinks about your #selfie
Convolutional Neural Networks are great: they recognize things, places and people in your personal p ...
Must Know Tips/Tricks in Deep Neural Networks
Must Know Tips/Tricks in Deep Neural Networks (by Xiu-Shen Wei) Deep Neural Networks, especially C ...
Coursera Deep Learning 2 Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization - week1, Assignment(Initialization)
声明:所有内容来自coursera,作为个人学习笔记记录在这里. Initialization Welcome to the first assignment of "Improving D ...
Must Know Tips/Tricks in Deep Neural Networks (by Xiu-Shen Wei)
http://lamda.nju.edu.cn/weixs/project/CNNTricks/CNNTricks.html Deep Neural Networks, especially Conv ...
[C4] Andrew Ng - Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization
About this Course This course will teach you the "magic" of getting deep learning to work ...
Training Deep Neural Networks
http://handong1587.github.io/deep_learning/2015/10/09/training-dnn.html //转载于 Training Deep Neural ...
Introduction to Deep Neural Networks
Introduction to Deep Neural Networks Neural networks are a set of algorithms, modeled loosely after ...
Classifying plankton with deep neural networks
Classifying plankton with deep neural networks The National Data Science Bowl, a data science compet ...

随机推荐

jvm（三）：对象
关于对象,我们需要面对的问题主要有对象的创建,对象在内存中的布局,对象的结构,对象的访问定位. 对象的创建对象的创建过程如下图所示: 其主要步骤有:给对象分配内存,初始化对象,执行构造方法. 在对象 ...
mouseover,mouseout和mouseenter,mouseleave的区别及适用情况
在做类似于百度地图右下角,不同地图切换UI时,遇到了问题. 就是鼠标滑过的时候出现一个层,当鼠标滑到当前层的话mouseover和mouseout在低版本的浏览器会出现闪动的现象,最简单的那就是把mo ...
jquery easyui panel title文字格式设置
$('#txtLeftPercent').panel({ title: '剩余权重:' + '<b style="color:red">' + 100 + '%< ...
sublime text3中设置Emmet输入标签自动闭合
项目后端前一段时间从C#转成了JAVA,在开发的过程中,由于HTML对标签的语法很宽松,比如这样:<img src="" alt="">在标签的结尾 ...
Hibernate更新数据（不用update也可以）
在介绍hibernate的更新之前,我们先来看看session的两个方法.load和get方法:这两个方法是获取数据的根据对象的id值: 先看两段代码.load和get的方法都含有两个参数,前者是得到 ...
110个oracle常用函数总结
. ASCII 返回与指定的字符对应的十进制数; SQL) zero,ascii( ) space from dual; A A ZERO SPACE --------- --------- ---- ...
深入理解SpringCloud之引导程序应用上下文
tips:我希望通过这篇文章来给对于bootstrap还不理解的朋友带来帮助.当然这篇文章不仅仅是讲解知识,我更希望给广大朋友带来学习与理解官方文档的一种思路.阅读本文前,建议大家对SpringBoo ...
存出和载入Docker镜像
存出镜像如果要导出镜像到本地文件,可以使用 docker save 命令. $ sudo docker images REPOSITORY TAG IMAGE ID CREATED VIRTUAL ...
PTA中如何出Java题目？
PTA中如何出Java题目? 很多第一次出题的老师,不知道Java在PTA中是如何处理输入的.写一篇文章供大家参考.比如以下这样的一个题目: 从控制台读入两个数,然后将其相加输出. 对于该题可以有如下 ...
给定 n×n 的实数矩阵，每行和每列都是递增的，求这 n^2 个数的中位数。
#define COL 4 #define ROW 4 int findMedian(int matrix[][COL], int row, int col) { int* arr = new int ...

解读“Deep Neural Decision Forests” 2015 Winner of the David Marr Prize

解读“Deep Neural Decision Forests” 2015 Winner of the David Marr Prize的更多相关文章

随机推荐

热门专题