《全连接的BP神经网络》

本文主要描述全连接的BP神经网络的前向传播和误差反向传播，所有的符号都用Ng的Machine learning的习惯。下图给出了某个全连接的神经网络图。

1前向传播

1.1前向传播

分别计算第l层神经元的输入和输出；

1.1.1偏执项为1时

向量整体形式：

分量形式：

1.1.2偏执项为b时

向量整体形式：

分量形式：

1.2网络误差

1.2.1偏执项为1时

对于某一个输入样本，它的输出为，它所对应的真实输出应该为，那么，该样本对应的误差E为

（1）

注意到输出层的第k个神经元的输出可以计算如下：

（2）

那么，误差E可以展开至隐藏层(第L-1层)的形式

（3）

又注意到隐藏层(第L-1层)的第j个神经元的输出可以计算如下：

(4)

那么，误差E进一步展开至隐藏层(第L-2层)

(5)

可以发现，E是权值的函数。

1.2.2偏执项为b时

对于某一个输入样本，它的输出为，它所对应的真实输出应该为，那么，该样本对应的误差E为

(6)

注意到输出层的第k个神经元的输出可以计算如下：

(7)

那么，误差E可以展开至隐藏层(第L-1层)的形式

(8)

又注意到隐藏层(第L-1层)的第j个神经元的输出可以计算如下：

(9)

那么，误差E进一步展开至隐藏层(第L-2层)

(10)

可以发现，E是权值和偏执项的函数。

2误差反向传播中的敏感度

某一层的敏感度的定义为：网络的误差对该层的输入的偏导数，即

2.1偏执项为1时的敏感度

2.1.1输出层的敏感度

输出层（第L层）的第k个神经元的敏感度定义如下：

为了计算该敏感度，利用链式法则，引入中间变量（第L层的第k个神经元的输出）：

(11)

首先，计算：

然后，计算：

这里的f为sigmoid函数，有：

从而可以得到：

(12)

那么，第L层的所有神经元的敏感度为：

(13)

2.1.2其他层

计算第L-1层的第j个神经元的敏感度，定义如下：

为了计算该敏感度，利用链式法则，引入中间变量（第L-1层的第j个神经元的输出）：

(14)

首先，计算：

其中：

则有：

然后，计算：

从而可以得到：

(15)

其中：

那么，第L-1层的所有神经元的敏感度为

(16)

以上推导是由第L层的敏感度计算第L-1层的敏感度，那么，利用递推方法可以得到第l层的敏感度的计算方法（l=L-1,…,2）：

(17)

2.2偏执项为b时的敏感度

推导过程中，只有一处发生改变，即隐藏层的计算式发生如下改变，但结果并没有改变，所以不会对最终的敏感度的计算公式造成影响：

3梯度的计算

3.1单个样本（偏执项为1时）的梯度

此时的待优化参数只有权值矩阵中的元素，计算误差E对第l层的权值矩阵的偏导数：

对于其中的某一个元素，计算如下：

那么，整个求导矩阵计算如下：

即：

3.2单个样本（偏执项为b时）的梯度

此时的待优化参数为权值矩阵中的元素和偏执项b；

首先计算误差E对第l层的权值矩阵的偏导数：

对于其中的某一个元素，计算如下：

那么，整个求导矩阵计算如下：

接下来，计算误差E对第l层的偏执项矩阵的偏导数：

对于其中的某一个元素，计算如下：

所以，整个偏执项求得到计算如下：

3.3m个样本的梯度求解（未加入其他惩罚项）

如前所述，对于单个样本而言，它的代价函数为E，现在有m个训练样本，它的代价函数应该为所有样本的代价函数的均值，用E_i表示第i个训练样本的代价函数（也就是前文一直使用的代价函数），E表示所有样本的代价函数，则它们有如下关系：

则有：

(18)

如果有偏执项b的话，则有

(19)

如果有m个样本，前面计算所得得到的和都是矩阵，它们的每一列是每个样本对应的第l层的敏感度和输出值。那么，可以按照如下方式计算m个样本所对应的梯度值：

（1）偏执项为1

(20)

（2）偏执项为b

(21)

(22)

4加了正则化项和稀疏项后

4.1网络误差

加入了正则化项和稀疏项后的网络误差计算公式如下：

(23)

其中：

J₁、J₂和J₃的计算方法分别如下：

第k个隐藏层中j个神经元的相对熵的计算公式如下：

(24)

其中：，为第k个隐藏层中j个神经元相对于第i个输入样本的激励值，而为第k个隐藏层中j个神经元相对于所有输入样本激励值的均值。

4.2网络代价函数的偏导数

网络代价函数的偏导数：

其中：

（1）偏执项为1时

(25)

（2）偏执项为b时

(26)

4.3敏感度的计算

加入了权值惩罚项和稀疏项后，输出层的敏感度计算不发生变化，而其余各层的敏感度公式变为如下：

(27)

5计算流程

利用前向传播算法计算各层的激励值
计算整个网络的代价函数

利用式 (23)
利用反向传播算法计算各层的敏感度
计算代价函数对权值矩阵和偏执项的梯度

利用式(26)计算代价函数对权值矩阵和偏执项的梯度

全连接的BP神经网络的更多相关文章

直观理解神经网络最后一层全连接+Softmax
目录写在前面全连接层与Softmax回顾加权角度模板匹配几何角度 Softmax的作用总结参考博客:blog.shinelee.me | 博客园 | CSDN 写在前面这篇文章将从3 ...
RBF神经网络和BP神经网络的关系
作者:李瞬生链接:https://www.zhihu.com/question/44328472/answer/128973724来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注 ...
TensorFlow------单层(全连接层)实现手写数字识别训练及测试实例
TensorFlow之单层(全连接层)实现手写数字识别训练及测试实例: import tensorflow as tf from tensorflow.examples.tutorials.mnist ...
全连接BP神经网络
前馈神经网络前馈神经网络(feedforward neural network)是最朴素的神经网络,通常我们所说的前馈神经网络有两种,一种叫反向传播网络(Back propagation Netwo ...
TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断)
在上一篇博客<TensorFlow之DNN(一):构建“裸机版”全连接神经网络>中,我整理了一个用TensorFlow实现的简单全连接神经网络模型,没有运用加速技巧(小批量梯度下降不算哦) ...
TensorFlow之DNN（一）：构建“裸机版”全连接神经网络
博客断更了一周,干啥去了?想做个聊天机器人出来,去看教程了,然后大受打击,哭着回来补TensorFlow和自然语言处理的基础了.本来如意算盘打得挺响,作为一个初学者,直接看项目(不是指MINIST手写 ...
MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 在前两篇文章MINIST深度学习识别:python全连接神经网络和pytorch LeNet CNN网 ...
基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络
包含一个隐含层的全连接神经网络结构如下: 包含一个隐含层的神经网络结构图以MNIST数据集为例,以上结构的神经网络训练如下: #coding=utf-8 from tensorflow.exampl ...
Python3 卷积神经网络卷积层，池化层，全连接层前馈实现
# -*- coding: utf-8 -*- """ Created on Sun Mar 4 09:21:41 2018 @author: markli " ...

随机推荐

WPF textbox 圆角制作
在app.xaml中加入以下节点,全局设置textbox圆角 <Style TargetType="{x:Type TextBox}"> < ...
[ORACLE]数据库之间复制表
---------------------------------------------------------------------------- -------------ORACLE数据库管 ...
HTML5到底能给企业带来些什么？
一.改变企业网络广告的模式与分布广告是企业网络营销的主要方式之一.十几年来,无论是展示还是互动,基本被Adobe Flash所主宰.然而,HTML5网页的多媒体特性.三维.图形及特效,超炫的浏览体验 ...
mysql in 的两种使用方法
简述MySQL 的in 的两种使用方法: 他们各自是在 in keyword后跟一张表(记录集).以及在in后面加上字符串集. 先讲后面跟着一张表的. 首先阐述三张表的结构: s(sno,sname. ...
经典SQL语句大全之基本函数
SQL Server基本函数 1.字符串函数长度与分析用 1,datalength(Char_expr) 返回字符串包含字符数,但不包含后面的空格2,substring(expression,sta ...
List<T>实体去重分组：
实体去重分组: //实体类 public class Province { public string id { get; set; } public string name { get; set; ...
php通过文件头检测文件类型通用类（zip,rar…)(转)
在做web应用时候,通过web扩展名判断上存文件类型,这个是我们常使用的.有时候我们这样做还不完善.可能有些人上存一些文件,但是他通过修改扩展名,让在我们的文件类型之内. 单实际访问时候又不能展示( ...
linux内核分析系列--百度
http://www.baidu.com/p/frsllzh http://www.baidu.com/p/%E9%98%BF%E4%BF%A1sxq
Linux I/O Scheduler--CFQ(上)图解
http://blog.csdn.net/vanbreaker/article/details/8299491 http://doc.okbase.net/29060569/archive/46628 ...
使用dom4j对xml文件进行增删改查
1.使用dom4j技术对dom_demo.xml进行增删改查首选要下载dom4j的jar包在官网上找不到,网上搜索了一下在这个链接:http://sourceforge.net/projects/ ...

全连接的BP神经网络

1前向传播

1.1前向传播

1.1.1偏执项为1时

1.1.2偏执项为b时

1.2网络误差

1.2.1偏执项为1时

1.2.2偏执项为b时

2误差反向传播中的敏感度

2.1偏执项为1时的敏感度

2.1.1输出层的敏感度

2.1.2其他层

2.2偏执项为b时的敏感度

3梯度的计算

3.1单个样本（偏执项为1时）的梯度

3.2单个样本（偏执项为b时）的梯度

3.3m个样本的梯度求解（未加入其他惩罚项）

4加了正则化项和稀疏项后

4.1网络误差

4.2网络代价函数的偏导数

4.3敏感度的计算

5计算流程

全连接的BP神经网络的更多相关文章

随机推荐

热门专题