吴恩达深度学习笔记（八） —

主要内容：

一.深层神经网络的优点和缺陷

二.残差网络的引入

三.残差网络的可行性

四.identity block 和 convolutional block

一.深层神经网络的优点和缺陷

1.深度神经网络很大的一个优点就是能够表示一个复杂的功能。网络的层数越多，意味着能够提取到不同level的特征越丰富。并且，越深的网络提取的特征越抽象，越具有语义信息。但其有一个巨大的缺陷，那就是：如果简单地增加深度，会导致梯度弥散或梯度爆炸。使得训练速度十分缓慢：

2.对于上述问题，解决方法是引入batch normalization，但这又会导致另一个问题，那就是“退化问题”。表现为网络层数增加，但是在训练集上的准确率却饱和甚至下降了。退化问题可能是因为深层的网络并不是那么好训练。

二.残差网络的引入

1.残差网络解决了增加深度带来的副作用（退化问题），这样就能够实现通过增加网络深度，来提高网络性能。

2.其基本思想是：在理想化的深层神经网络中，如果后面的网络层是恒等映射，那么深层神经网络就退化为浅层神经网络。所谓恒等映射就是输入等于输出（F(x) = x)，放在神经网络当中，那就是把前面的值，直接穿过若干个网络层（而没有经过任何实际性的处理），最后到达输出层。但是，深层神经网络在实际中并不那么理想，因为深层的网络并不是那么好训练，特别是学习恒等映射（至于为什么这样，我也是人云亦云）。

3.但是，深层的网络学习F(x) = 0，则相对容易（此也人云亦云，可能在后面的网络层，权重衰减严重，因而引入了batch normalization）。让深层神经网络学习F(x) = 0的方法是构建：H(x) = F(x) + x，对应于神经网络的结构图如下：

对于第l+2层，其总输出就是g(H(x))，也就是a[l+2]，而a[l+2] = g(a[l] + z[l+1])，又因为H(x) = F(x) + x，规定z[l+1]对应F(x)，a[l]对应x。因此，就是要学习z = 0，这对于深层的网络来说是没那么难的。

三.残差网络的可行性

为何学习深层的网络学习 z = 0 会可行呢？还是看会l+2层的表达式：

在深层的网络层，权重衰减严重，原因是引入了batch normalization，导致了w[l+2]、b[l+2]都接近于0，因此z[l+2]就接近于0，证明了残差网络是可行的。

四.identity block 和 convolutional block

1.残差网络，从感性上去认识，就是将当前的输出输入到下一层的同时，还增加一条路径输入到更后面的某一层。这样构成的一个块，叫做残差块，残差块就是构成残差网络的基础。

2.一般地，是将a[l]输入到第l+k层的激活函数之前（发明者通过实验证明的高效做法），即将a[l]和z[l+k]相加，然后送到激活函数中去。a[l]能和z[l+k]相加的前提条件是：a[l]的shape等于z[l+k]的shape。当两者相等时，可以直接输入进去，此种块称为identity block；当两者不同时，则需要将a[l]通过一个卷积层以调整其shape与z[l+k]一致，此种块称为convolutional block。

吴恩达深度学习笔记（八） —— ResNets残差网络的更多相关文章

【Deeplearning.ai 】吴恩达深度学习笔记及课后作业目录
吴恩达深度学习课程的课堂笔记以及课后作业代码下载:https://github.com/douzujun/Deep-Learning-Coursera 吴恩达推荐笔记:https://mp.weix ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（二）
经典网络 LeNet-5 AlexNet VGG Ng介绍了上述三个在计算机视觉中的经典网络.网络深度逐渐增加,训练的参数数量也骤增.AlexNet大约6000万参数,VGG大约上亿参数. 从中我们可 ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上）
作者:szx_spark 1. Padding 在卷积操作中,过滤器(又称核)的大小通常为奇数,如3x3,5x5.这样的好处有两点: 在特征图(二维卷积)中就会存在一个中心像素点.有一个中心像素点会十 ...
吴恩达深度学习笔记（deeplearning.ai）之循环神经网络（RNN）（三）
1. 导读本节内容介绍普通RNN的弊端,从而引入各种变体RNN,主要讲述GRU与LSTM的工作原理. 事先声明,本人采用ng在课堂上所使用的符号系统,与某些学术文献上的命名有所不同,不过核心思想都是 ...
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（一）
Padding 在卷积操作中,过滤器(又称核)的大小通常为奇数,如3x3,5x5.这样的好处有两点: 在特征图(二维卷积)中就会存在一个中心像素点.有一个中心像素点会十分方便,便于指出过滤器的位置. ...
吴恩达深度学习笔记（十二）—— Batch Normalization
主要内容: 一.Normalizing activations in a network 二.Fitting Batch Norm in a neural network 三.Why does ...
吴恩达深度学习笔记（七） —— Batch Normalization
主要内容: 一.Batch Norm简介二.归一化网络的激活函数三.Batch Norm拟合进神经网络四.测试时的Batch Norm 一.Batch Norm简介 1.在机器学习中,我们一般会 ...
吴恩达深度学习笔记1-神经网络的编程基础(Basics of Neural Network programming)
一:二分类(Binary Classification) 逻辑回归是一个用于二分类(binary classification)的算法.在二分类问题中,我们的目标就是习得一个分类器,它以对象的特征向量 ...
吴恩达深度学习笔记（十一）—— dropout正则化
主要内容: 一.dropout正则化的思想二.dropout算法流程三.dropout的优缺点一.dropout正则化的思想在神经网络中,dropout是一种“玄学”的正则化方法,以减少过拟合 ...

随机推荐

解决ionic 2载入速度慢的问题
1.ionic build android --prod 使用生产环境的服务器 (最关键部分) [--production-mode=y,n] ................. Tell Io ...
三个内置模块shutil logging hashlib config
高级的文件.文件夹.压缩包处理模块 shutil.copyfileobj(fsrc, fdst[, length])将文件内容拷贝到另一个文件中 1 import shutil 2 3 shuti ...
第10章 Docker Machine 相关问题
10.1 打开命令行后,看到下载啥 boot2docker.iso,然后总是超时失败,怎么办? 装了 Docker Toolbox 的 Windows 用户,或者第一次使用 docker-machin ...
Linux(Centos6.5)下安装svn服务器，并通过http访问
linux安装svn其实很容易,个人觉得难就难在配置上,反复配置,琢磨,查找相关资料,总算是成功了.. 安装: 安装svn,一般情况下,选择yum方式安装还是比较简单的. ? 1 2 [root@mo ...
"无法加载 DLL“oramts.dll”: 找不到指定的模块。 (异常来自 HRESULT:0x8007007E)。" —— 的解决方法
Oramts.dll 文件公开登记 Oracle 连接所涉及到在通过 Microsoft 分布式事务处理协调器 (MSDTC) 启动的事务中的公共 API. 在事务处理环境中运行时, Syste ...
VS2008试用版到期解决办法----win7下VS2008升级补丁.zip
打开好久没用的Visual studio 2008,才知道试用版已经到期了.在网上找来了序列号,可是连一个输入序列号的地方都没有,困惑了好久,终于找到了解决办法. 首先献上自己收集的Visual st ...
android实现卸载提示
这篇文章是整理的以前用过的一个功能,由于多种原因现在停用了,也希望这篇文章能帮助一些android入门的小童鞋.android是不提供监控卸载自己的功能的,这里使用了监控android日志的功能,an ...
【BZOJ3124】[Sdoi2013]直径树形DP（不用结论）
[BZOJ3124][Sdoi2013]直径 Description 小Q最近学习了一些图论知识.根据课本,有如下定义.树:无回路且连通的无向图,每条边都有正整数的权值来表示其长度.如果一棵树有N个节 ...
《从零开始学Swift》学习笔记（Day 31）——存储属性
原创文章,欢迎转载.转载请注明:关东升的博客 Swift中的属性分为存储属性和计算属性,存储属性就是Objective-C中的数据成员,计算属性不存储数据,但可以通过计算其他属性返回数据. 存储属性可 ...
EasyNVR和EasyDSS云平台联手都不能解决的事情，只有国标GB28181能解决了
需求痛点我们经常收到这样一种需求,就是将客户手里的各种类型的网络摄像机IPC和网络硬盘录像机NVR进行统一的整合接入和管理,并进行常规的直播.存储.录像检索和回放等操作,而这个时候我们通常会选择用E ...

吴恩达深度学习笔记（八） —— ResNets残差网络

吴恩达深度学习笔记（八） —— ResNets残差网络的更多相关文章

随机推荐

热门专题