机器学习 Softmax classifier (一个隐含层)

程序实现 softmax classifier, 含有一个隐含层的情况。activation function 是 ReLU : f(x)=max(0,x)

f1=w1x+b1

h1=max(0,f1)

f2=w2h1+b2

y=ef2i∑jef2j



function Out=Softmax_Classifier_1(train_x,  train_y, opts)

% setting learning parameters

step_size=opts.step_size;

reg=opts.reg;

batchsize = opts.batchsize;

numepochs = opts.numepochs;

K=opts.class;

h=opts.hidden;

D=size(train_x, 2);

W1=0.01*randn(D,h);

b1=zeros(1,h);

W2=0.01*randn(h, K);

b2=zeros(1,K);

loss(1 : numepochs)=0;

num_examples=size(train_x, 1);

numbatches = num_examples / batchsize;

for epoch=1:numepochs

    kk = randperm(num_examples);

    loss(epoch)=0;

    % %      tic;

    % %

    % %       sprintf('epoch %d:  \n' , epoch)

    for bat=1:numbatches

        batch_x = train_x(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

        batch_y = train_y(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

        %% forward

        f1=batch_x*W1+repmat(b1, batchsize, 1);

        hiddenval_1=max(0, f1);

        scores=hiddenval_1*W2+repmat(b2, batchsize, 1);

        %% the loss

        exp_scores=exp(scores);

        dd=repmat(sum(exp_scores, 2), 1, K);

        probs=exp_scores./dd;

        correct_logprobs=-log(sum(probs.*batch_y, 2));

        data_loss=sum(correct_logprobs)/batchsize;

        reg_loss=0.5*reg*sum(sum(W1.*W1))+0.5*reg*sum(sum(W2.*W2));

        loss(epoch) =loss(epoch)+ data_loss + reg_loss;

        %% back propagation

        dscores = probs-batch_y;

        dscores=dscores/batchsize;

        dW2=hiddenval_1'*dscores;

        db2=sum(dscores);

        dhiddenval_1=dscores*W2';

        mask=max(sign(hiddenval_1), 0);

        df_1=dhiddenval_1.*mask;

        dW1=batch_x'*df_1;

        db1=sum(df_1);

        %% update

        dW2=dW2+reg*W2;

        dW1=dW1+reg*W1;

        W1=W1-step_size*dW1;

        b1=b1-step_size*db1;

        W2=W2-step_size*dW2;

        b2=b2-step_size*db2;

    end

    loss(epoch)=loss(epoch)/numbatches;

    if (mod(epoch, 10)==0)

        sprintf('epoch: %d, training loss is  %f:  \n', epoch, loss(epoch))

    end

    toc;

end

Out.W1=W1;

Out.b1=b1;

Out.b2=b2;

Out.W2=W2;

Out.loss=loss;

end

机器学习 Softmax classifier (一个隐含层)的更多相关文章

机器学习 Softmax classifier (无隐含层)
程序实现 Softmax classifer, 没有隐含层, f=wx+b y=efi∑jefj %% Softmax classifier function Out=Softmax_Classifi ...
基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络
包含一个隐含层的全连接神经网络结构如下: 包含一个隐含层的神经网络结构图以MNIST数据集为例,以上结构的神经网络训练如下: #coding=utf-8 from tensorflow.exampl ...
ubuntu之路——day13 只用python的numpy在较为底层的阶段实现单隐含层神经网络
首先感谢这位博主整理的Andrew Ng的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273 ...
机器学习： Softmax Classifier (三个隐含层)
程序实现 softmax classifier, 含有三个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
机器学习：Softmax Classifier (两个隐含层)
程序实现 softmax classifier, 含有两个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
基于MNIST数据集使用TensorFlow训练一个没有隐含层的浅层神经网络
基础在参考①中我们详细介绍了没有隐含层的神经网络结构,该神经网络只有输入层和输出层,并且输入层和输出层是通过全连接方式进行连接的.具体结构如下: 我们用此网络结构基于MNIST数据集(参考②)进行训 ...
理解dropout——本质是通过阻止特征检测器的共同作用来防止过拟合 Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作，不工作的那些节点可以暂时认为不是网络结构的一部分，但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了
理解dropout from:http://blog.csdn.net/stdcoutzyx/article/details/49022443 http://www.cnblogs.com/torna ...
[DeeplearningAI笔记]序列模型2.6Word2Vec/Skip-grams/hierarchical softmax classifier 分级softmax 分类器
5.2自然语言处理觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.6 Word2Vec Word2Vec相对于原先介绍的词嵌入的方法来说更加的简单快速. Mikolov T, Chen ...
MLP神经网络隐含层节点数的设置】如何设置神经网络隐藏层的神经元个数
神经网络隐含层节点数的设置]如何设置神经网络隐藏层的神经元个数置顶 2017年10月24日 14:25:07 开心果汁阅读数:12968 版权声明:本文为博主原创文章,未经博主允许不得转 ...

随机推荐

《Java实战开发经典》第五章5.3
package xiti5; public class Third { public static void main(String[] args) { T t=new T("want yo ...
Shell中反引号（`）与$()用法的区别
今天有人提问: echo `echo \\\\\\\w` echo $(echo \\\\\\\w) 为什么输出的不一样? 这就引申出了另一个问题:反引号与$()有没有区别? 这是一个非常有意思的问题 ...
background-size在PC端和移动端使用媒体查询的不同
1.PC端background-size:100%:是展现原图的大小. 2.使用媒体查询的移动端的background-size:100%:是根据内容的高度自动拉伸高度的.
【例题 7-9 UVA-1601】The Morning after Halloween
[链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] 对于没有出现的,当成0节点就好. 所以总是认为有3个人需要走到各自的终点. 将平面图转成点边图.这样比较好枚举. (二维变成一维,模 ...
为SSO 5.5恢复忘记的administrator@vsphere.local密码
转自:http://blog.itpub.net/27042095/viewspace-1179938/ 1. cd \Program Files\VMware\Infrastructure\VMwa ...
（转）ORA-00257归档日志写满的解决方法
转自:http://www.cnblogs.com/xwdreamer/p/3804509.html 背景: 在前一篇博客中我们提到了如何启动或关闭oracle的归档(ARCHIVELOG)模式,在我 ...
DB2学习总结（1）——DB2数据库基础入门
DB2的特性完全Web使能的:可以利用HTTP来发送询问给服务器. 高度可缩放和可靠:高负荷时可利用多处理器和大内存,可以跨服务器地分布数据库和数据负荷:能够以最小的数据丢失快速地恢复,提供多种备份 ...
common daemon
http://zdsyouxiang.iteye.com/blog/1940202 http://commons.apache.org/proper/commons-daemon/procrun.ht ...
Altium Designer画原理图时要紧凑
之所以要紧凑,是为了方便打印到纸上,一般原理图也都用A4纸去画, 这样打印到纸上看起来不会太小,也不会太大.
C#添加水印
using System; using System.Data; using System.Configuration; using System.Web; using System.Web.Secu ...

机器学习 Softmax classifier (一个隐含层)

机器学习 Softmax classifier (一个隐含层)的更多相关文章

随机推荐

热门专题