机器学习：Softmax Classifier (两个隐含层)

程序实现 softmax classifier, 含有两个隐含层的情况。activation function 是 ReLU : f(x)=max(0,x)

f1=w1x+b1

h1=max(0,f1)

f2=w2h1+b2

h2=max(0,f2)

f3=w3h2+b3

y=ef3i∑jef3j



function Out=Softmax_Classifier_2(train_x,  train_y, opts)

% setting learning parameters

step_size=opts.step_size;

reg=opts.reg;

batchsize = opts.batchsize;

numepochs = opts.numepochs;

K=opts.class;

h1=opts.hidden_1;

h2=opts.hidden_2;

D=size(train_x, 2);

W1=0.01*randn(D,h1);

b1=zeros(1,h1);

W2=0.01*randn(h1, h2);

b2=zeros(1,h2);

W3=0.01*randn(h2, K);

b3=zeros(1, K);

loss(1 : numepochs)=0;

num_examples=size(train_x, 1);

numbatches = num_examples / batchsize;

for epoch=1:numepochs

     kk = randperm(num_examples);

     loss(epoch)=0;

     tic;

      sprintf('epoch %d:  \n' , epoch)

     for bat=1:numbatches

         batch_x = train_x(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

         batch_y = train_y(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

         %% forward

         f1=batch_x*W1+repmat(b1, batchsize, 1);

         hiddenval_1=max(0, f1);

         f2=hiddenval_1*W2+repmat(b2, batchsize, 1);

         hiddenval_2=max(0, f2);

         scores=hiddenval_2*W3+repmat(b3, batchsize, 1);

         %% the loss

         exp_scores=exp(scores);

         dd=repmat(sum(exp_scores, 2), 1, K);

         probs=exp_scores./dd;

         correct_logprobs=-log(sum(probs.*batch_y, 2));

         data_loss=sum(correct_logprobs)/batchsize;

         reg_loss=0.5*reg*sum(sum(W1.*W1))+0.5*reg*sum(sum(W2.*W2))+0.5*reg*sum(sum(W3.*W3));

         loss(epoch) =loss(epoch)+ data_loss + reg_loss;

         %% back propagation

          % output layer

         dscores = probs-batch_y;

         dscores=dscores/batchsize;

         dW3=hiddenval_2'*dscores;

         db3=sum(dscores);

         % hidden layer 2

         dhiddenval_2=dscores*W3';

         mask=max(sign(hiddenval_2), 0);

         df_2=dhiddenval_2.*mask;

         dW2=hiddenval_1'*df_2;

         db2=sum(df_2);

         % hidden layer 1

         dhiddenval_1=df_2*W2';

         mask=max(sign(hiddenval_1), 0);

         df_1=dhiddenval_1.*mask;

         dW1=batch_x'*df_1;

         db1=sum(df_1);

         %% update

         dW3=dW3+reg*W3;

         dW2=dW2+reg*W2;

         dW1=dW1+reg*W1;

         W3=W3-step_size*dW3;

         b3=b3-step_size*db3;

         W2=W2-step_size*dW2;

         b2=b2-step_size*db2;

         W1=W1-step_size*dW1;

         b1=b1-step_size*db1;

     end

     loss(epoch)=loss(epoch)/numbatches;

    sprintf('training loss is  %f:  \n', loss(epoch))

    toc;

end

Out.W1=W1;

Out.W2=W2;

Out.W3=W3;

Out.b1=b1;

Out.b2=b2;

Out.b3=b3;

Out.loss=loss;

机器学习：Softmax Classifier (两个隐含层)的更多相关文章

机器学习： Softmax Classifier (三个隐含层)
程序实现 softmax classifier, 含有三个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
机器学习 Softmax classifier (一个隐含层)
程序实现 softmax classifier, 含有一个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
机器学习 Softmax classifier (无隐含层)
程序实现 Softmax classifer, 没有隐含层, f=wx+b y=efi∑jefj %% Softmax classifier function Out=Softmax_Classifi ...
理解dropout——本质是通过阻止特征检测器的共同作用来防止过拟合 Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作，不工作的那些节点可以暂时认为不是网络结构的一部分，但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了
理解dropout from:http://blog.csdn.net/stdcoutzyx/article/details/49022443 http://www.cnblogs.com/torna ...
基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络
包含一个隐含层的全连接神经网络结构如下: 包含一个隐含层的神经网络结构图以MNIST数据集为例,以上结构的神经网络训练如下: #coding=utf-8 from tensorflow.exampl ...
基于MNIST数据集使用TensorFlow训练一个没有隐含层的浅层神经网络
基础在参考①中我们详细介绍了没有隐含层的神经网络结构,该神经网络只有输入层和输出层,并且输入层和输出层是通过全连接方式进行连接的.具体结构如下: 我们用此网络结构基于MNIST数据集(参考②)进行训 ...
[DeeplearningAI笔记]序列模型2.6Word2Vec/Skip-grams/hierarchical softmax classifier 分级softmax 分类器
5.2自然语言处理觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.6 Word2Vec Word2Vec相对于原先介绍的词嵌入的方法来说更加的简单快速. Mikolov T, Chen ...
ubuntu之路——day13 只用python的numpy在较为底层的阶段实现单隐含层神经网络
首先感谢这位博主整理的Andrew Ng的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273 ...
3.4 常用的两种 layer 层 3.7 字体与文本
3.4 常用的两种 layer 层 //在cocos2d-x中,经常使用到的两种 layer 层 : CCLayer 和 CCLayerColor //CCLayer 的创建 CCLayer* la ...

随机推荐

code-代码平台服务器路径
下面记录的是各个平台的服务器路径(va使用) ("repo init -u ssh://vanzo/platform_89/manifest.git") ("repo i ...
Matrix学习——基础知识
以前在线性代数中学习了矩阵,对矩阵的基本运算有一些了解,前段时间在使用GDI+的时候再次学习如何使用矩阵来变化图像,看了之后在这里总结说明. 首先大家看看下面这个3 x 3的矩阵,这个矩阵被分割成4部 ...
Core Animation 文档翻译—附录B（可动画的属性）
前言许多CALayer和CIFliter的属性都是可动画的.本节附录列出了这些属性默认使用的动画. CALayer可动画属性表B-1展示了CALayer类的可动画属性.针对每个属性此表 ...
Myeclipse的默认工作区间怎么恢复提示框?
好久一直使用默认工作空间.现在,回过头来想让那个提示框回来. 该如何做呢? 1.找到我们的myeclipse安装目录下的 2.false是关闭. 3.改成true 4.同时,新增新的工作区间和之前旧的 ...
python项目实战-小游戏1
项目规则: 1.玩家和敌人分别从现有的角色中选择3个角色 2.随机生成目前的血量,和攻击量 3.游戏规则:当玩家向敌人发起攻击,敌人当前的血量=之前的血量-玩家的血量,同理 4.3局两胜 5.自定义玩 ...
[求助]linux同一目录可否挂载多个数据盘？
https://bbs.aliyun.com/read/281222.html?pos=20
Python 在线笔试
1. 循环输入输出交互 Python在线笔试琐碎求两个整数 A+B 的和. while True: try: (n, m) = (int(x) for x in raw_input().split( ...
HDU 1251统计难题字典树
字典树的应用. 数据结构第一次课的作业竟然就需要用到树了!!!这不科学啊.赶紧来熟悉一下字典树. 空间开销太大T T #include<cstdio> #include<cstrin ...
[Docker] Create Docker Volumes for Persistent Storage
Docker containers are stateless by default. In order to persist filesystem changes, you must use doc ...
手动脱KBys Packer(0.28)壳实战
作者:Fly2015 吾爱破解培训第一课选修作业第5个练习程序.在公司的时候用郁金香OD调试该加壳程序的时候出了点问题,可是回家用吾爱破解版的OD一调试,浑身精神爽,啥问题也没有. 首先使用查壳工具对 ...

机器学习：Softmax Classifier (两个隐含层)

机器学习：Softmax Classifier (两个隐含层)的更多相关文章

随机推荐

热门专题