发表在2017年CVPR。

读后总结

这篇论文旨在说明：反馈学习比单纯的前向学习更有效，并且给出了一些理由，并予以实验证明。本文通过ConvLSTM予以实现，同时考察了课程学习方法对coarse-to-fine分类原理（同时也是反馈学习框架的优势）的应用。

现在看着蛮平庸的。虽然想法很直接，也很容易想到，但本文的实验充分，有理有据，还是不错的。

动机

对于图像分类问题，我们通常采用前向CNN网络。但作者认为我们还可以采取反馈的方式代替前向模式，有以下几点优势：

可以实现提前判决，这在查询时特别有效。
符合标签化的分类原理，从大类到小类（coarse to fine）逐步判断，如图1。
为Curriculum Learning提供了基础。

作者通过ConvLSTM实现了这种思想，其性能超越了前向网络。注意，本文提出的反馈，指的是在隐藏空间中的反馈。这样就不需要针对特定任务，设计误差-输入转换。

故事

反馈是循环因果系统的产物[13] =>
反馈是一种在控制论和物理学中被广泛使用的强大手段[一堆文献]。大脑也是[一堆文献]，表明了反馈在视觉中有重要意义 =>
因此，本文就提出了基于反馈的学习方法，相较传统前向方法具有上述优点。

ConvLSTM图像分类网络

本文中，ConvLSTM单元是权值共享的。其中还有红线代表短连接。

注意，ConvLSTM有两个维度：时间t和深度d。具体gate和推导操作见3.1节。核心：中间层状态同时由当前输入和上一层隐藏层状态决定。3.2节介绍了图2中ConvLSTM单元的具体结构。

进一步，作者还通过短连接，将若干时刻前的隐藏层状态与当前输入求和，得到新的输入。这种短连接是有效的，见表1给出的溶解实验结果。

损失函数

方法的精髓在于：作者在每一个时间步都计算一次loss。最终的loss是这些loss的加权组合。这样，我们就避免网络成为一个前向推导网络，而是成为一个具有coarse-to-fine特点的推导网络。更进一步，我们还可以结合课程学习的方法，见下一节。

与Episodic Curriculum Learning的结合

很简单。作者设计了一个动态变化的loss。在训练早期，loss将重点惩罚大类错误，后期再重点惩罚小类错误。就像一个孩子，我们让TA循序渐进地学习，从分大类开始，再到细致分类。

实验方法

并没有对early exit设置判决方法。相反，作者是让网络完整地进行推导，然后看看在每一层的准确率是多少。

作者将反馈网络与前向网络相比，观察到：反馈网络在相同层级上准确率更高。

此外还有一个实验：有一些样本在大类是正确的，但小类是错误的。通过增加网络深度，作者看看网络是否能逐渐得到正确的小类。具体见论文。结论是反馈结构更具有这种能力。

Paper | Feedback Networks的更多相关文章

Paper | Highway Networks
目录 1. 网络结构 2. 分析解决的问题:在当时,人们认为提高深度是提高精度的法宝.但是网络训练也变得很困难.本文旨在解决深度网络训练难的问题,本质是解决梯度问题. 提出的网络:本文提出的 ...
Paper | Squeeze-and-Excitation Networks
目录 1. 故事 2. SENet 2.1 概况 2.2 具体 3. 实验本文的贡献点在于:通过显式建模特征注意力机制,达到了很好的效果.这是以往被默认隐式学习的操作.并且注意,此时建模出来的注意力 ...
CVPR 2017 Paper list
CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View ...
Awesome Deep Vision
Awesome Deep Vision A curated list of deep learning resources for computer vision, inspired by awes ...
Res-Family: From ResNet to SE-ResNeXt
Res-Family: From ResNet to SE-ResNeXt 姚伟峰 http://www.cnblogs.com/Matrix_Yao/ Res-Family: From ResNet ...
图像超分辨-DBPN
本文译自2018CVPR DeepBack-Projection Networks For Super-Resolution 代码: github 特点:不同于feedback net,引入back ...
Awesome Torch
Awesome Torch This blog from: A curated list of awesome Torch tutorials, projects and communities. T ...
OpAmp Voltage Follower/Regulator
LDO Regulator High accuracy voltage regulator Vout = 2.5V * (1 + ( 5.6 / 6.8 ) ) = 4.55V Recently th ...
[Paper Reading]--Exploiting Relevance Feedback in Knowledge Graph
<Exploiting Relevance Feedback in Knowledge Graph> Publication: KDD 2015 Authors: Yu Su, Sheng ...

随机推荐

Kubernetes之Pod使用
一.什么是Podkubernetes中的一切都可以理解为是一种资源对象,pod,rc,service,都可以理解是一种资源对象.pod的组成示意图如下,由一个叫”pause“的根容器,加上一个或多个 ...
解决 canvas 下载含图片的画布时的报错
Uncaught DOMException: Failed to execute 'toDataURL' on 'HTMLCanvasElement': Tainted canvases may no ...
五分钟搞定 HTTPS 配置，二哥手把手教
01.关于 FreeSSL.cn FreeSSL.cn 是一个免费提供 HTTPS 证书申请.HTTPS 证书管理和 HTTPS 证书到期提醒服务的网站,旨在推进 HTTPS 证书的普及与应用,简化证 ...
centos7下mysql5.7的安装与配置
centos7下MySQL5.7的安装与配置下载下载地址根据系统和版本选择红框中的四个RPM包下载即可,然后放到centos7系统中的/opt目录下,等待稍后安装. 安装前的准备 1. 检查系统 ...
[debug]ubuntu共享文件夹所在目录
使用Vmware虚拟机,Vmware Tools工具的复制粘贴一直无效,之后采用共享文件夹. 其默认的是在 \mnt\hgfs 下,在Vmware的设置中建立好文件夹,将文件传入进去,之后就可以去 \ ...
Java生鲜电商平台-用户管理的架构与实战
Java生鲜电商平台-用户管理的架构与实战在电商后台中,用户管理是运营人员管理用户的模块.这里的用户区别于运营人员,会在权限的角色管理中分别阐述.这里的用户包含平台的一般用户,会员用户等.本文将分享 ...
webservice调用天气服务
常见服务:http://www.webxml.com.cn/zh_cn/support.aspx 可能用到缺少的ArrayOfString.java文件 package com.test.wes.we ...
如何突破DNS报文的512字节限制
- DNS的512字节限制根据协议标准,DNS协议同时占用UDP和TCP的53端口,这是为什么呢? 翻阅DNS资料,可以发现,DNS协议默认按UDP传输,为优化传输性能,DNS协议有一个512字节的 ...
Android框架Volley使用：Get请求实现
首先我们在项目中导入这个框架: implementation 'com.mcxiaoke.volley:library:1.0.19' 在AndroidManifest文件当中添加网络权限: < ...
[转]JVM系列一：JVM内存组成及分配
原文地址:http://www.cnblogs.com/redcreen/archive/2011/05/04/2036387.html JVM系列一:JVM内存组成及分配 java内存组成介绍:堆( ...

Paper | Feedback Networks