NeurIPS2018: DropBlock: A regularization method for convolutional networks

NIPS 改名了！改成了neurips了。。。

深度神经网络在过参数化和使用大量噪声和正则化（如权重衰减和 dropout）进行训练时往往性能很好。dropout 广泛用于全连接层的正则化，但它对卷积层的效果没那么好。原因可能在于卷积层中的激活单元是空间关联的，使用 dropout 后信息仍然能够通过卷积网络传输到下一层。相比于dropout一个一个扔掉神经元，自然而然我们就要成块成块扔。因此就产生了这种叫dropblock的方法来对卷积网络进行正则化约束，它会丢弃特征图相邻区域中的单元。此外，在训练过程中逐渐增加丢弃单元的数量会带来更高的准确率，使模型对超参数选择具备更强的鲁棒性。

如下图更加形象生动：

图(a)中图片狗的区域是包含语义信息的，(b)中dropout扔神经元基本是这样随机扔，这就导致了很多狗这个实例的相关性信息被保存下来了，如(c), dropblock的思想是随机找一些点，然后自定义一个区域（block）把这里的信息一股脑全扔了。这样语义信息就不会冗余，从一定程度上使学习到的特征更加鲁棒。

如何操作：

block_size：控制block的区域大小

：控制丢掉多少神经元，注意这里的神经元不是真正丢了，而是某一次不用它的概率。

参数设置：

Blocksize设置为1的时候和dropout类似，但是只在图中绿色区域丢

设置：

Keep_prob 为保存信息的比率

feat_size 为整个feature map的大小

feat_size-block_size+1 为绿色区域的大小，我把它命名为语义信息区域吧。。

我的想法：

读了这篇文章，我倒是有些想法，我们的目标不是去除图像像素之间的冗余特征吗，那么我们根据这样一句话：

the m best features are not the best m features....在卷积层与全连接层的中间加一个去冗余层。

扔特征的目标是不是就是找出含有个特征的特征子集S？其实相对于也是丢弃一部分特征

那我们这样：

1：与标签的最大相关性：

（2）

C为类别，S 为特征子集，为第i个特征。

变量间的最小冗余度：

（3）

其中I函数为给定两个随机变量x和y，他们的概率密度函数（对应于连续变量）为p(x),p(y),p(x,y)p(x),p(y),p(x,y)，则互信息为：

那么我们整个神经网络优化公式为：

传统损失 - 公式（2）+公式（3）

当然上面思想主要来自于mrmr算法，正好可以结合卷积来做一下。一点初步的idea，有空实现下，在来分享。

NeurIPS2018: DropBlock: A regularization method for convolutional networks的更多相关文章

（原）DropBlock A regularization method for convolutional networks
转载请注明出处: https://www.cnblogs.com/darkknightzh/p/9985027.html 论文网址: https://arxiv.org/abs/1810.12890 ...
（转）ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks
ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks by KO ...
Fully Convolutional Networks for Semantic Segmentation 译文
Fully Convolutional Networks for Semantic Segmentation 译文 Abstract Convolutional networks are powe ...
论文翻译——Character-level Convolutional Networks for Text Classification
论文地址 Abstract Open-text semantic parsers are designed to interpret any statement in natural language ...
论文阅读（Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks）
Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录作者和相关链接方法概括 ...
VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION 这篇论文
由Andrew Zisserman 教授主导的 VGG 的 ILSVRC 的大赛中的卷积神经网络取得了很好的成绩,这篇文章详细说明了网络相关事宜. 文章主要干了点什么事呢?它就是在在用卷积神经网络下, ...
Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）
摘要卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有 ...
Very Deep Convolutional Networks for Large-Scale Image Recognition
Very Deep Convolutional Networks for Large-Scale Image Recognition 转载请注明:http://blog.csdn.net/stdcou ...
论文学习：Fully Convolutional Networks for Semantic Segmentation
发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...

随机推荐

Linux组件封装（三）使用面向对象编程封装Thread
C++11提供了thread,但是过于复杂,我们还是倾向于在项目中编写自己的Thread. Posix Thread的使用这里不再赘述. 重点是这个函数: #include <pthread.h ...
Win8.1应用开发之Bing Maps
这里介绍怎样进行Bing Maps的开发.首先我们须要在我们的程序中引入Bing Map的SDK.详细方法,这里推荐一个链接<win8>使用Bing地图.这样一个hello world便出 ...
chrome浏览器提取网页视频
http://blog.csdn.net/pipisorry/article/details/37728839 在我们平时上网看视频听音乐时都会产生缓存,可是我们非常难通过一些软件把当中的视频和音乐文 ...
Java 常见的异常错误分析大集合
算术异常类:ArithmeticExecption 空指针异常类:NullPointerException 类型强制转换异常:ClassCastException 数组负下标异常:Negative ...
12个高效的VS调试技巧
介绍调试是软件开发周期中的一个很重要的部分,有时很有挑战性,有时候则让程序员迷惑,有时候让程序员发疯,但是.可以肯定的是,对于任何不是太那个微不足道的程序来说,调试是不可避免的.近年来,调试工具的发 ...
BNU 34990 Justice String （hash+二分求LCP）
思路:枚举第一个字符串的位置,然后枚举最长公共前缀的长度,时间即会下降-- #pragma comment(linker, "/STACK:1024000000,1024000000&quo ...
php数组操作，内容相同，键值不同，互换
$title = array("A"=>"创建时间","C"=>"商品信息","D"=& ...
java游戏开发基础Swing之JRadioButton
© 版权声明:本文为博主原创文章,转载请注明出处 1.按钮(JButton) Swing中的按钮是JButton,它是javax.swing.AbstractButton类的子类,Swing中的按钮可 ...
openWRT自学---对官方的开发指导文档的解读和理解记录2：如何控制内核模块的编译
openwrt对于kernel module的处理分两类:随内核主线而来的kernel module 和其他作为独立project的kernel module.而这两种,openwrt将采用相同的模 ...
(1) yum源配置-epel
1.获取epel地址登录https://fedoraproject.org/wiki/EPEL/zh-cn,看“如何获取EPEL的软件包”,根据你的操作系统版本,复制对应的下载地址. 2.下载epe ...

NeurIPS2018: DropBlock: A regularization method for convolutional networks

我的想法：

NeurIPS2018: DropBlock: A regularization method for convolutional networks的更多相关文章

随机推荐

热门专题