发表在2017年CVPR。

摘要

在图像检测任务中，对于图像不同的区域，我们可以分配不同层数的网络予以处理。

本文就提出了一个基于ResNet的层数可调网络，可以端到端训练、确定的（deterministic）并且是问题不可知的（problem-agnostic），即可用于其他计算机视觉任务。

作者发现，该网络不仅能提高ResNet计算效率，而且其表现也与人类的注意力机制相符，如图1。

故事

DCNN被广泛应用于各种计算机视觉问题，并且逐渐成为SOTA方法必不可少的组分 =>
然而，DCNN最大的问题在于其计算负担重 =>
一种自然的方法是像人类一样，采取注意力机制 =>
例如，glimpse-based注意力模型只处理少数重点区域。显然这种方法不适用于图像转换问题或逐像素预测问题，如分割。并且，预测重点区域需要额外的子网络或启发过程[1] =>
除此之外，我们还可以采取空域软注意力模型。但它们压根不会节省计算量，反而可能增加计算量（计算权值） =>
为此，我们采用最近用于RNN的ACT（Adaptive Computation Time）[12]机制。我们将展示：ACT可以动态决策ResNet的层数 =>
进一步，我们提出空域自适应的计算时间算法SACT，可以根据空域计算量完成ACT。在COCO上的实验证明：SACT超过了ACT和非适应算法。

SACT机制

SACT是一个可以端到端训练的结构。其将注意力机制融入ResNet。

它学习的是一种确定性的决策模式：若特征变得足够好，那么某个空域位置上的计算就将停止。

由于SACT会在图像和特征图之间保持对齐（maintains the alighment），因此SACT适用于逐像素预测任务。

ACT机制

ResNet由多个Residual block组成，而每一个block内有多个residual unit。每一个unit就是一个$F(x) = x + f(x)$函数，其中后者是一个3层卷积：首先是1x1卷积降通道数，然后3x3卷积通道尺寸不变，最后是1x1卷积还原通道数。

为了实现ACT，作者在每个unit的输出端都加入一个分支，预测停止得分（halting score）：一个在0、1之间的标量。如图3，该得分会在一个block内累积。当累积至1时，推导就停止，后面的unit都会被跳过。

并且，根据这个得分，我们还可以计算剩余得分R，以及最终的停留成本ponder cost（见2.1节）。最终的输出也是前面特征的加权求和，权值就是各unit得分。

为什么要这么设计呢？因为我们通过惩罚这个停留成本，可以让网络尽早停止（ponder cost惩罚经过的unit数量），同时又能得到可靠的输出（最终输出是各unit的加权求和）。

该ponder cost会被加权，然后计入总损失函数。

注意，每个block内都会单独执行一次ACT。

具体而言，该停止得分是通过一个简单的线性方程得到的。其先对输入平均池化，然后输入线性方程，经sigmoid输出。

SACT机制

上面的ACT机制，是对每一个unit设计了一个停止得分，然后不断累加。在这里，SACT就是对空域特征设计了停止得分，如图4。

如果某个位置被停止，那么其将直接复制（相当于设置残差为0），从而继续完成下一次卷积。

实验

看图很有意思。停留成本高，说明该区域需要经过较长推理，很难节省计算量。

Paper | Spatially Adaptive Computation Time for Residual Networks的更多相关文章

Paper | Adaptive Computation Time for Recurrent Neural Networks
目录 1. 网络资源 2. 简介 3. 自适应运算时间 3.1 有限运算时间 3.2 误差梯度 1. 网络资源这篇文章的写作太随意了,读起来不是很好懂(掺杂了过多的技术细节).因此有作者介绍会更好. ...
Residual Networks <2015 ICCV, ImageNet 图像分类Top1>
本文介绍一下2015 ImageNet中分类任务的冠军——MSRA何凯明团队的Residual Networks.实际上,MSRA是今年Imagenet的大赢家,不单在分类任务,MSRA还用resid ...
Residual Networks <2015 ICCV, ImageNet 图像分类Top1>
本文介绍一下2015 ImageNet中分类任务的冠军--MSRA何凯明团队的Residual Networks.实际上.MSRA是今年Imagenet的大赢家.不单在分类任务,MSRA还用resid ...
解析Wide Residual Networks
Wide Residual Networks (WRNs)是2016年被提出的基于扩展通道数学习机制的卷积神经网络.对深度卷积神经网络有了解的应该知道随着网络越深性能越好,但是训练深度卷积神经网络存在 ...
深度残差网(deep residual networks)的训练过程
这里介绍一种深度残差网(deep residual networks)的训练过程: 1.通过下面的地址下载基于python的训练代码: https://github.com/dnlcrl/deep-r ...
残差网络（Residual Networks, ResNets）
1. 什么是残差(residual)? “残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.”“如果回归模型正确的话, 我们可以将残差看作误差的观测值.” 更准确地,假设我们想要找一个 $x$ ...
课程四(Convolutional Neural Networks)，第二周（Deep convolutional models: case studies） ——3.Programming assignments : Residual Networks
Residual Networks Welcome to the second assignment of this week! You will learn how to build very de ...
Residual Networks
Andrew Ng deeplearning courese-4:Convolutional Neural Network Convolutional Neural Networks: Step by ...
深度学习论文笔记：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes
这篇文章将深度学习算法应用于机械故障诊断,采用了“小波包分解+深度残差网络(ResNet)”的思路,将机械振动信号按照故障类型进行分类. 文章的核心创新点:复杂旋转机械系统的振动信号包含着很多不同频率 ...

随机推荐

oracle--共享磁盘挂载
01,查看挂载的磁盘 [root@SHLPDBWX01 ~]# fdisk -l Disk /dev/sda: bytes heads, sectors/track, cylinders Units ...
ASP.NET Core 集成测试中模拟登录用户的一种姿势
不管哪种用户验证方式,最终都是在验证成功后设置 HttpContext.User ,后续处理环节通过 HttpContext.User 获取用户信息.如果能直接修改 HttpContext.User ...
Java连载41-this关键字其他注意事项、static方法
一.this关键字 1.this在多数情况下都会省略 2.this不能用在含有static的方法之中. 3.static的方法的调用是不需要对象的,直接使用格式:类名.方法名:没有当前对象,自然不能访 ...
【Nginx】Nginx反向代理转发Host设置
#事故现场: 服务器A(Nginx服务器):192.168.2.126 服务器B(Web服务器):192.168.2.221 服务器A反向代理服务器B,A配置了upstream为: http { up ...
失败zero
1127 系统玩崩溃了分区助手调整c盘,导致自动进入快速启动然后疯狂boot网卡检测?还有测试中心? 查找错误initialization and establishing link,结论是bios ...
下载文件旁边附的MD5/SHA256等有什么用途？
在我们下载很多软件时,旁边会出现md5,sha1/sha256/sha512等一长串字符串,这些字符串是什么意义呢? 因为怕盗版或者怕软件被植入病毒或者插件等,要对软件的完整性做校验.步骤:先下载完软 ...
EF中获取当前上下文的表名
EF在处理并发上并不是很好,很多时候我们需要手动写sql操作数据库.但是在基类中我们如何获取当前服务仓储操作的表呢? 使用正则是其中一种解决办法 Repository.Table是一条查询语句,通过t ...
String trim() ,去除当前字符串两边的空白字符
package seday01;/** * String trim() * 去除当前字符串两边的空白字符 * @author xingsir */public class TrimDemo { pub ...
Java并发编程杂记（2）
对象共享 synchronized 设定原子性确定临界区 + 内存可见性要解决如下问题防止一个线程在使用对象状态而另一个线程在修改对象状态:且当一个线程修改了对象状态后,对其他线程可见. 可见 ...
Python中使用requests和parsel爬取喜马拉雅电台音频
场景喜马拉雅电台: https://www.ximalaya.com/ 找到一步小说音频,这里以下面为例 https://www.ximalaya.com/youshengshu/16411402/ ...

Paper | Spatially Adaptive Computation Time for Residual Networks

摘要

故事

SACT机制

ACT机制

SACT机制

实验

Paper | Spatially Adaptive Computation Time for Residual Networks的更多相关文章

随机推荐

热门专题