caffe中的前向传播和反向传播

caffe中的网络结构是一层连着一层的，在相邻的两层中，可以认为前一层的输出就是后一层的输入，可以等效成如下的模型

可以认为输出top中的每个元素都是输出bottom中所有元素的函数。如果两个神经元之间没有连接，可以认为相应的权重为０。其实上图的模型只适用于全连接层，其他的如卷积层、池化层，x与y之间很多是没有连接的，可以认为很多权重都是０，而池化层中有可能部分x与y之间是相等的，可以认为权重是１。

下面用以上的模型来说明反向传播的过程。在下图中，我用虚线将y与损失Loss之间连接了起来，表示Loss必然是由某种函数关系由y映射而成，我们只需要知道这个函数是由后面的网络参数决定的，与这一层的网络参数无关就行了。

当我们知道了Loss对本层输出的导数dy，便能推出Loss对本层输入x及本层网络参数w的导数。

先推Loss对输入x的导数。由

可知，y对x的导数如下，其中g为某种函数映射，它由上面的f唯一地确定，因而是一种已知的映射。

由此推出Loss对x的导数如下，其中h也为某种函数映射，也是由上面的f唯一地确定，是一种已知的映射。

至于Loss对该层网络参数w的导数，由上述公式很容易得到

其中的p、q和g、h一样，都是由f确定的已知映射。

从上面的分析中可以看出，只要知道了Loss对本层输出的导数dy，就能计算出本层参数的梯度，并且求出Loss对本层输入x的导数dx。反向传播是从最后一层（损失层）向第一层（输出层）传播，损失层中Loss对输出的导数dy是能直接求取的，并且本层的输入恰是上一层的输出，因此这种计算可以由后向前地递推下去，这就是反向传播的大体过程。最后示意图如下图所示

以上便是caffe实现反向传播的整体思路。对不同的层，由于前向传播的过程f不一样，所以对应的反向传播的过程p、q也是不一样的。在后面的章节中，我将结合源代码，分析ConvolutionLayer、PoolingLayer、InnerProductLayer、ReLULayer、SoftmaxLayer、SoftmaxWithLossLayer这几种层前向传播、后向传播的具体过程。

caffe中的前向传播和反向传播的更多相关文章

CNN中卷积层池化层反向传播
参考:https://blog.csdn.net/kyang624823/article/details/78633897 卷积层池化层反向传播: 1,CNN的前向传播 a)对于卷积层,卷积核与输入 ...
机器学习（ML）八之正向传播、反向传播和计算图，及数值稳定性和模型初始化
正向传播正向传播的计算图通常绘制计算图来可视化运算符和变量在计算中的依赖关系.下图绘制了本节中样例模型正向传播的计算图,其中左下角是输入,右上角是输出.可以看到,图中箭头方向大多是向右和向上,其中 ...
小白学习之pytorch框架(6)-模型选择(K折交叉验证)、欠拟合、过拟合(权重衰减法(=L2范数正则化)、丢弃法)、正向传播、反向传播
下面要说的基本都是<动手学深度学习>这本花书上的内容,图也采用的书上的首先说的是训练误差(模型在训练数据集上表现出的误差)和泛化误差(模型在任意一个测试数据集样本上表现出的误差的期望) ...
caffe中 softmax 函数的前向传播和反向传播
1.前向传播: template <typename Dtype> void SoftmaxLayer<Dtype>::Forward_cpu(const vector< ...
BP原理 - 前向计算与反向传播实例
Outline 前向计算反向传播很多事情不是需要聪明一点,而是需要耐心一点,踏下心来认真看真的很简单的. 假设有这样一个网络层: 第一层是输入层,包含两个神经元i1 i2和截距b1: 第二层是隐含 ...
反向传播算法（前向传播、反向传播、链式求导、引入delta）
参考链接: 一文搞懂反向传播算法
前向传播和反向传播实战（Tensor）
前面在mnist中使用了三个非线性层来增加模型复杂度,并通过最小化损失函数来更新参数,下面实用最底层的方式即张量进行前向传播(暂不采用层的概念). 主要注意点如下: · 进行梯度运算时,tensorf ...
Tensorflow笔记——神经网络图像识别（一）前反向传播，神经网络八股
第一讲:人工智能概述第三讲:Tensorflow框架前向传播: 反向传播: 总的代码: #coding:utf-8 #1.导入模块,生成模拟数据集 import t ...
caffe中python接口的使用
下面是基于我自己的接口,我是用来分类一维数据的,可能不具通用性: (前提,你已经编译了caffe的python的接口) 添加 caffe塻块的搜索路径,当我们import caffe时,可以找到. 对 ...

随机推荐

php write excel
/** * 写excel方法 */ function writeExcel($tabArr, $dataArr,$path) { require_once CODE_BASE2 . '/util/ph ...
codevs1358棋盘游戏(状压dp)
1358 棋盘游戏时间限制: 1 s 空间限制: 64000 KB 题目等级 : 大师 Master 题目描述 Description 这个游戏在一个有10*10个格子的棋盘上进行,初 ...
bzoj2287【POJ Challenge】消失之物(退背包)
2287: [POJ Challenge]消失之物 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 657 Solved: 382[Submit][S ...
JavaScript中的+= 是什么？
+=表示相加并赋值,“i+=5”与“i=i+5”是等效的. 类似的运算符还有-=,*=,/=. i-=5等价于i=i-5; i*=5等价于i=i*5: i/=5等价于i=i/5.
Kubernetes Port Forward 机制访问 pod
需求:研发需要调试部署的pod是否能正常提供访问,但又不对pod进行暴露到集群外. 实现:通过Kubernetes的Port Forward机制对本机端口映射到pod端口来实现 1.安装kubectl ...
java 关键字与保留字
Java 关键字列表 (依字母排序共51组),所有的关键字都是小写,在MyEclipse中都会显示不同的颜色: abstract, assert,boolean, break, byte, case ...
C# 怎么把类文件如(XXX.cs)转为dll文件
打开VS2012或2017 ,新建项目,选择类库(.NET Framework),创建好一个项目在建好的项目中添加需要转的类文件然后将项目重新生成后,在项目的Debug下就可以找到对应的dll ...
Java创建Excel-DEMO
import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.Out ...
Leetcode0019--Remove Nth Node From End of List 移除链表第N个结点
[转载请注明]http://www.cnblogs.com/igoslly/p/8672656.html 看一下题目: Given a linked list, remove the nth node ...
Python中join函数和os.path.join用法
Python中有join和os.path.join()两个函数,具体作用如下: join:连接字符串数组.将字符串.元组.列表中的元素以指定的字符(分隔符)连接生成一个新的字符串 os.path.jo ...

caffe中的前向传播和反向传播

caffe中的前向传播和反向传播的更多相关文章

随机推荐

热门专题