ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)

ufldl出了新教程，感觉比之前的好，从基础讲起，系统清晰，又有编程实践。

在deep learning高质量群里面听一些前辈说，不必深究其它机器学习的算法，能够直接来学dl。

于是近期就開始搞这个了。教程加上matlab编程。就是完美啊。

新教程的地址是：http://ufldl.stanford.edu/tutorial/

本节学习地址：http://ufldl.stanford.edu/tutorial/supervised/MultiLayerNeuralNetworks/

神经网络一般求解过程：

1 正向传播，把每一层的激活值求出来，还有总的cost。

基本上，隐藏层的激活值都是加权和再加上bias，再激活函数比方sigmoid。

输出层的激活值，或许不叫激活值，叫特征值更好。以softmax为例，是将上一层的激活值作为特征输入X。将权重W作为theta參数，依据公式算出h。

2 反向传播。

先计算输出层的残差。这个能够依据损失函数直接求导。

由l+1层的残差和l层的激活值，就可以求得l层的W和b的梯度。

由l+1层的残差和l层的W，还有l层激活函数的偏导数，就可以求得l层的残差。

4 更新參数W和b

5 增加权重衰减项防止过拟合。求cost和梯度的时候。须要做对应的调整。

以下是supervised_dnn_cost.m的代码：

function [ cost, grad, pred_prob] = supervised_dnn_cost( theta, ei, data, labels, pred_only)

%SPNETCOSTSLAVE Slave cost function for simple phone net

%   Does all the work of cost / gradient computation

%   Returns cost broken into cross-entropy, weight norm, and prox reg

%        components (ceCost, wCost, pCost)

%% default values

po = false;

if exist('pred_only','var')

    po = pred_only;

end;

%% reshape into network

numHidden = numel(ei.layer_sizes) - 1;

numSamples = size(data, 2);

hAct = cell(numHidden+1, 1);

gradStack = cell(numHidden+1, 1);

stack = params2stack(theta, ei);

%% forward prop

%%% YOUR CODE HERE %%%

for l=1:numHidden   %隐藏层特征计算

	if(l == 1)

		z = stack{l}.W*data;

	else

		z = stack{l}.W*hAct{l-1};

	end

	z = bsxfun(@plus,z,stack{l}.b);

	hAct{l}=sigmoid(z);

end

%输出层(softmax)特征计算

h = (stack{numHidden+1}.W)*hAct{numHidden};

h = bsxfun(@plus,h,stack{numHidden+1}.b);

e = exp(h);

pred_prob = bsxfun(@rdivide,e,sum(e,1)); %概率表

hAct{numHidden+1} = pred_prob;

%[~,pred_labels] = max(pred_prob, [], 1);

%% return here if only predictions desired.

if po

    cost = -1; ceCost = -1; wCost = -1; numCorrect = -1;

    grad = [];

    return;

end;

%% compute cost 输出层softmax的cost

%%% YOUR CODE HERE %%%

ceCost =0;

c= log(pred_prob);

%fprintf("%d,%d\n",size(labels,1),size(labels,2)); %60000,1

I=sub2ind(size(c), labels', 1:size(c,2));%找出矩阵c的线性索引，行由labels指定，列由1:size(c,2)指定，生成线性索引返回给I

values = c(I);

ceCost = -sum(values);

%% compute gradients using backpropagation

%%% YOUR CODE HERE %%%

% Cross entroy gradient

%d = full(sparse(labels,1:size(c,2),1));

d = zeros(size(pred_prob));

d(I) = 1;

error = (pred_prob-d); %输出层的残差 

%梯度。残差反向传播

for l = numHidden+1: -1 : 1

	gradStack{l}.b = sum(error,2);

	if(l == 1)

		gradStack{l}.W = error*data';

	    break;%l==1时。即当前层是第一层隐藏层时，不须要再传播残差

	else

		gradStack{l}.W = error*hAct{l-1}';

	end

	error = (stack{l}.W)'*error .*hAct{l-1}.* (1-hAct{l-1});%后面部分是激活函数偏导数

end

%% compute weight penalty cost and gradient for non-bias terms

%%% YOUR CODE HERE %%%

wCost = 0;

for l = 1:numHidden+1

    wCost = wCost + .5 * ei.lambda * sum(stack{l}.W(:) .^ 2);%全部权值的平方和

end

cost = ceCost + wCost;

% Computing the gradient of the weight decay.

for l = numHidden : -1 : 1

    gradStack{l}.W = gradStack{l}.W + ei.lambda * stack{l}.W;%softmax没用到权重衰减项

end

%% reshape gradients into vector

[grad] = stack2params(gradStack);

end

原来训练集是60000条，有点费时间，我改了run_train.m代码，把训练集改了10000条。

当然影响了精确度。

恢复源码，拿60000条做训练集。结果例如以下：

本文作者：linger

本文链接：http://blog.csdn.net/lingerlanlan/article/details/38464317

ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)的更多相关文章

ufldl学习笔记和编程作业：Feature Extraction Using Convolution,Pooling(卷积和汇集特征提取)
ufldl学习笔记与编程作业:Feature Extraction Using Convolution,Pooling(卷积和池化抽取特征) ufldl出了新教程,感觉比之前的好,从基础讲起.系统清晰 ...
ufldl学习笔记和编程作业：Softmax Regression（softmax回报）
ufldl学习笔记与编程作业:Softmax Regression(softmax回归) ufldl出了新教程.感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量 ...
ufldl学习笔记与编程作业：Softmax Regression(vectorization加速)
ufldl学习笔记与编程作业:Softmax Regression(vectorization加速) ufldl出了新教程,感觉比之前的好.从基础讲起.系统清晰,又有编程实践. 在deep learn ...
ufldl学习笔记与编程作业：Logistic Regression（逻辑回归）
ufldl学习笔记与编程作业:Logistic Regression(逻辑回归) ufldl出了新教程,感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听 ...
ufldl学习笔记与编程作业：Linear Regression（线性回归）
ufldl学习笔记与编程作业:Linear Regression(线性回归) ufldl出了新教程,感觉比之前的好.从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听一些 ...
stanford coursera 机器学习编程作业 exercise4--使用BP算法训练神经网络以识别阿拉伯数字(0-9)
在这篇文章中,会实现一个BP(backpropagation)算法,并将之应用到手写的阿拉伯数字(0-9)的自动识别上. 训练数据集(training set)如下:一共有5000个训练实例(trai ...
深度学习课程笔记（十六）Recursive Neural Network
深度学习课程笔记(十六)Recursive Neural Network 2018-08-07 22:47:14 This video tutorial is adopted from: Youtu ...
深度学习课程笔记（十五）Recurrent Neural Network
深度学习课程笔记(十五)Recurrent Neural Network 2018-08-07 18:55:12 This video tutorial can be found from: Yout ...
【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior
[论文笔记]Malware Detection with Deep Neural Network Using Process Behavior 论文基本信息会议: IEEE(2016 IEEE 40 ...

随机推荐

一步一步搭建springCloud
一.spring cloud简介Spring Cloud是一系列框架的有序集合.它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册.配置中心.消息总线.负载均 ...
星际争霸虚空之遗人族5BB 操作流程
人族5BB rush timing 3min-3min30 一波战术,对面双开不侦察应该就GG了. 14农民BS,建议在第一个BS后的100矿,马上接上一个BS堵口,基本上对面是侦察不到的,特别是内双 ...
iOS图片相似度比较
1. 缩小尺寸:将图像缩小到8*8的尺寸,总共64个像素.这一步的作用是去除图像的细节,只保留结构/明暗等基本信息,摒弃不同尺寸/比例带来的图像差异: 注:实际操作时,采取了两种尺寸作对比( ...
Ucenter添加新应用
最近手头上有个项目需要用到Ucenter跟Discuz和UcHome整合到一起,使用同步登录.注册,使用同一的用户数据. 以前没用过Ucenter,第一次接触,看过官网的教程感觉不难.于是开始动手,下 ...
DELPHI开发LINUX桌面程序
DELPHI开发LINUX桌面程序 DELPHI官方目前为止尚不能开发LINUX桌面程序. 但三方控件FmxLinux(商业控件)是可以的.网上有破解版本.
利用谷歌API生成二维码
http://chart.apis.google.com/chart?cht=qr&chs=104x104&chld=L|0&chl=http://www.cnblogs.co ...
julia,集Python、C++、R为一体！Julia 1.0重磅发布，　MIT发布史上最强科学计算编程语言?创始人独家解答11个问题
这个编程语言的新版本之所以受到整个人工智能界的关注,最主要的原因正是其将 C 语言的速度.Ruby 的灵活.Python 的通用性前所未有地结合在一起,支持并行处理,易于学习和使用,尤其适合科学和工程 ...
WordPress < 3.6.1 PHP 对象注入漏洞
0x00 背景当我读到一篇关于Joomla的“PHP对象注射”的漏洞blog后,我挖深了一点就发现Stefan Esser大神在2010年黑帽大会的文章: http://media.blackhat ...
http://wsj356428476.iteye.com/blog/1655032
http://wsj356428476.iteye.com/blog/1655032 http://jingyan.baidu.com/article/19192ad83ce167e53e570705 ...
LightOJ - 1265 Island of Survival 期望
题目大意:有一个生存游戏,里面t仅仅老虎,d仅仅鹿,另一个人,每天都要有两个生物碰面,如今有下面规则 1.老虎和老虎碰面.两仅仅老虎就会同归于尽 2.老虎和人碰面或者和鹿碰面,老虎都会吃掉对方 3.人 ...

ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)

ufldl学习笔记与编程作业：Multi-Layer Neural Network(多层神经网络+识别手写体编程)的更多相关文章

随机推荐

热门专题