内容来自ufldl，代码参考自tornadomeet的cnnCost.m

1.Forward Propagation

convolvedFeatures = cnnConvolve(filterDim, numFilters, images, Wc, bc); %对于第一个箭头

activationsPooled = cnnPool(poolDim, convolvedFeatures);%对应第二个箭头

%对应第3个箭头，即平铺开

activationsPooled = reshape(activationsPooled,[],numImages);

%开始计算softmax后属于各类的概率

probs = zeros(numClasses,numImages);

%Wd=(numClasses,hiddenSize),probs的每一列代表一个输出

%M=Wd*ah+bd

M = Wd*activationsPooled+repmat(bd,[1,numImages]);

%这步可以省略，可以这么做的原因是 exp(a+b)=exp(a)exp(b)

M = bsxfun(@minus,M,max(M,[],1));

%M=exp(Wd*ah+bd)

M = exp(M);

%normalize

probs = bsxfun(@rdivide, M, sum(M));

2.Back propagation

% 首先需要把labels弄成one-hot编码

%对应图片中的I

groundTruth = full(sparse(labels, 1:numImages, 1));

%P-I

delta_d = -(groundTruth-probs);

%ah(P-I) ，不同处为后面加上了正规项的导数

Wd_grad = (1./numImages)*delta_d*activationsPooled'+lambda*Wd;

bd_grad = (1./numImages)*sum(delta_d,2); %注意这里是要求和

%对应图中reshape右边的   J对ah求导

delta_s = Wd'*delta_d;

delta_s=reshape(delta_s,outputDim,outputDim,numFilters,numImages);

%对应途中    1/4，delta_s的每个分量，都扩展为4个

for i=1:numImages

    for j=1:numFilters

        delta_c(:,:,j,i) = (1./poolDim^2)*kron(squeeze(delta_s(:,:,j,i)), ones(poolDim));

    end

end

%对于左下方，但此时ximage还没有乘上去

delta_c = convolvedFeatures.*(1-convolvedFeatures).*delta_c;

for i=1:numFilters

    Wc_i = zeros(filterDim,filterDim);

    for j=1:numImages

%此处conv2非常巧妙

        Wc_i = Wc_i+conv2(squeeze(images(:,:,j)),rot90(squeeze(delta_c(:,:,i,j)),2),'valid');

    end

   % Wc_i = convn(images,rot180(squeeze(delta_c(:,:,i,:))),'valid');

    % add penalize

    Wc_grad(:,:,i) = (1./numImages)*Wc_i+lambda*Wc(:,:,i);

    bc_i = delta_c(:,:,i,:);

    bc_i = bc_i(:);

    bc_grad(i) = sum(bc_i)/numImages;

end

上面conv2的正确性，可以用下面方法验证

A=rand(9,9);

B=rand(3,3);

c1=conv2(A,B,'valid');

B=zeros(3);

for i=1:7

    for j=1:7

        B=B+(A(i:i+2,j:j+2)*c1(i,j));

    end

end

%看到B和conv2结果相同

conv2(A,rot90(c1,2),'valid')

B

cnn softmax regression bp求导的更多相关文章

【机器学习基础】对 softmax 和 cross-entropy 求导
目录符号定义对 softmax 求导对 cross-entropy 求导对 softmax 和 cross-entropy 一起求导 References 在论文中看到对 softmax 和 ...
【机器学习】BP & softmax求导
目录一.BP原理及求导二.softmax及求导一.BP 1.为什么沿梯度方向是上升最快方向根据泰勒公式对f(x)在x0处展开,得到f(x) ~ f(x0) + f'(x0)(x-x0) ...
softmax 损失函数求导过程
前言:softmax中的求导包含矩阵与向量的求导关系,记录的目的是为了回顾. 下图为利用softmax对样本进行k分类的问题,其损失函数的表达式为结构风险,第二项是模型结构的正则化项. 首先,每个qu ...
【转载】softmax的log似然代价函数（求导过程）
全文转载自:softmax的log似然代价函数(公式求导) 在人工神经网络(ANN)中,Softmax通常被用作输出层的激活函数.这不仅是因为它的效果好,而且因为它使得ANN的输出值更易于理解.同时, ...
Deep learning：五十一(CNN的反向求导及练习)
前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它.虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好.而本文 ...
Deep Learning基础--CNN的反向求导及练习
前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它.虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好.而本文 ...
softmax分类器+cross entropy损失函数的求导
softmax是logisitic regression在多酚类问题上的推广,\(W=[w_1,w_2,...,w_c]\)为各个类的权重因子,\(b\)为各类的门槛值.不要想象成超平面,否则很难理解 ...
前馈网络求导概论(一)·Softmax篇
Softmax是啥? Hopfield网络的能量观点 1982年的Hopfiled网络首次将统计物理学的能量观点引入到神经网络中, 将神经网络的全局最小值求解,近似认为是求解热力学系统的能量最低点(最 ...
Deep Learning基础--Softmax求导过程
一.softmax函数 softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类! 假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个 ...

随机推荐

hdoj分类
http://blog.csdn.net/lyy289065406/article/details/6642573 模拟题, 枚举1002 1004 1013 1015 1017 1020 1022 ...
利用VisualVM监测Azure云服务中的Java应用
在做Java开发的时候,我们需要在上线之前对程序进行压力测试,对程序的性能进行全面的监控,了解JVM的CPU,内存,GC,classes,线程等等信息,或者在程序上线运行的过程当中以便于诊断问题或者对 ...
JIT和程序的首次执行
由于C#源代码经过编译器编译生成的是IL代码,而IL是与CPU无关的机器语言.因此当程序运行于特定的CPU时,首先必须将IL转换成本地CPU指令,这正是JIT(Just-In-Time)编译器的任务. ...
Oracle左连接、右连接、全外连接
Oracle 外连接 (1)左外连接 (左边的表不加限制)(2)右外连接(右边的表不加限制)(3)全外连接(左右两表都不加限制) 外连接(Outer Join) outer join则会返回每个满足 ...
js的框架
Ember.js的一些学习总结 1.1.1 摘要现在,我们经常都可以看到复杂的JavaScript应用程序,由于这些应用程序变得越来越复杂,一长串的jQuery回调语句或者通过应用程序在各个状态 ...
SpringBoot优化内嵌的Tomcat
SpringBoot测试版本 <parent> <groupId>org.springframework.boot</groupId> <artifactId ...
OSCHina技术导向：web内容管理系统Magnolia
Magnolia简介: Magnolia CMS是一家瑞士公司自2003年起发布的一个基于Java的开源内容管理系统.它适合且已被使用在以下领域:电子商务(例如:COOP.Migros.Rossman ...
数据挖掘之分类算法---knn算法(有matlab例子)
knn算法(k-Nearest Neighbor algorithm).是一种经典的分类算法.注意,不是聚类算法.所以这种分类算法必然包括了训练过程. 然而和一般性的分类算法不同,knn算法是一种懒 ...
xmpp总结
1. 浅谈对于XMPP协议自己的看法以及对其理解 http://blog.sina.com.cn/s/blog_69f68f880102uyeg.html 2. XMPP协议学习笔记一 http:// ...
具体总结 Hive VS 传统关系型数据库
本文思路,看图说话,一张图,清晰总结二者差别以下对图中的各条做具体总结 1.查询语言不做赘述 2.数据存储位置不做赘述 3.数据格式 Hive:Hive 中未定义专门的数据格式,数据格式能够由用 ...

cnn softmax regression bp求导

内容来自ufldl，代码参考自tornadomeet的cnnCost.m

1.Forward Propagation

2.Back propagation

cnn softmax regression bp求导的更多相关文章

随机推荐

热门专题