多层神经网络与C++实现
BP理论部分参考:http://blog.csdn.net/itplus/article/details/11022243
参考http://www.cnblogs.com/ronny/p/ann_02.html#!comments,结合BP算法的理论部分,可以真正理解了ANN。
代码部分我加了部分注释
#include<vector>
using namespace std; //单个连接线
class NNconnection
{
public:
//两个索引,一个与该结点相连(前一层)的前一层结点的索引,
//一个对应的权值索引在整个单层网络中权值向量中的索引
unsigned weightIdx;
unsigned neuralIdx;
}; //单个神经元,包括一个输出和多个连接线
class NNneural
{
public:
double output;//输出
vector<NNconnection> m_connection;
}; //单层网络
class NNlayer
{
public:
NNlayer *preLayer;//该层网络的前一层
NNlayer(){ preLayer = NULL; }
vector<NNneural> m_neurals;//每层网络多个神经元
vector<double> m_weights;//权值向量
//加多少个神经元,及经前一层神经元的个数
void addNeurals(unsigned num, unsigned preNumNeurals);
//反向传播
void backPropagate(vector<double>& ,vector<double>&,double); }; class NeuralNetwork
{
private:
unsigned nLayer;//网络层数
vector<unsigned> nodes;//每层的结点数
vector<double> actualOutput;//每次迭代的输出结果
double etaLearningRate;//权值学习率
unsigned iterNum;//迭代次数
public:
vector<NNlayer*>m_layers;//由多个单层网络组成
//创建网络,第二个参数为[48,25,30],则表明该网络有三层,每层结点数分别为48,25,30
void create(unsigned num_layers, unsigned *ar_nodes);
void initializeNetwork();//初始化网络,包括权值设置等 void forwardCalculate(vector<double> &invect, vector<double> &outvect);//向前计算 void backPropagate(vector<double>& tVect, vector<double>& oVect);//反向传播 void train(vector<vector<double>>& inputVec, vector<vector<double>>& outputVec);//训练 void classifier(vector<vector<double>>& inputVec, vector<vector<double>>& outputVec);//分类 }; void NeuralNetwork::initializeNetwork()
{
//初始化网络,创建各层和各层结点,初始化权值
// i为何如此定义?
for (vector<NNlayer*>::size_type i = ; i != nLayer; i++)
{
NNlayer *ptrLayer = new NNlayer;
if (i == )
{
ptrLayer->addNeurals(nodes[i], );//第一层之前的结点数为0
}
else
{
ptrLayer->preLayer = m_layers[i - ];
//每个神经元的初值包括与前一层神经元的连接索引和该层权重索引
ptrLayer->addNeurals(nodes[i], nodes[i - ]);
//连结权重个数
unsigned num_weights = nodes[i] * (nodes[i - ] + );//+bias
//初始化权重
for (vector<NNlayer*>::size_type k = ; k != num_weights; k++)
{ ptrLayer->m_weights.push_back(0.05*rand() / RAND_MAX);//0~0.05
}
}
m_layers.push_back(ptrLayer);
}
} void NNlayer::addNeurals(unsigned num, unsigned preNumNeural)
{
for (vector<NNneural>::size_type i = ; i != num; i++)
{
NNneural sneural;
sneural.output = ;
for (vector<NNconnection>::size_type k = ; k != preNumNeural; k++)
{
NNconnection sconnection;
//给该神经元加上连接索引和权值索引
sconnection.weightIdx = i*(preNumNeural + ) + k;//加1给偏置留一个索引位置
sconnection.neuralIdx = k;
sneural.m_connection.push_back(sconnection);
}
m_neurals.push_back(sneural);
}
}
void NeuralNetwork::forwardCalculate(vector<double> &invect, vector<double> &outvect)
{
actualOutput.clear();
vector<NNlayer*>::iterator layerIt = m_layers.begin();
while (layerIt != m_layers.end())
{
if (layerIt == m_layers.begin())
{
for (vector<NNneural>::size_type k = ; k != (*layerIt)->m_neurals.size(); k++)
{
//对第一层的神经元来说,输出即为输入
(*layerIt)->m_neurals[k].output = invect[k];
}
}
else
{
vector<NNneural>::iterator neuralIt = (*layerIt)->m_neurals.begin();
int neuralIdx = ;
while (neuralIt != (*layerIt)->m_neurals.end())
{
//每个神经元的连接线数
vector<NNconnection>::size_type num_connection = (*neuralIt).m_connection.size();
//偏置
double dsum = (*layerIt)->m_weights[num_connection*(neuralIdx + ) - ];
for (vector<NNconnection>::size_type i = ; i != num_connection; i++)
{
//sum=sum+w*x;
unsigned wgtIdx = (*neuralIt).m_connection[i].weightIdx;
unsigned neuralIdx = (*neuralIt).m_connection[i].neuralIdx; dsum += (*layerIt)->preLayer->m_neurals[neuralIdx].output*
(*layerIt)->m_weights[wgtIdx];
}
neuralIt->output = SIGMOID(dsum); neuralIt++;//下一个神经元
neuralIdx++;//每个神经元的偏置不同
}
}
layerIt++;//下一层网络
}
//将最后一层的结果保存至输出
NNlayer * lastLayer = m_layers[m_layers.size() - ];
vector<NNneural>::iterator neuralIt = lastLayer->m_neurals.begin();
while (neuralIt != lastLayer->m_neurals.end())
{
outvect.push_back(neuralIt->output);
neuralIt++;
}
} void NeuralNetwork::backPropagate(vector<double>& tVect, vector<double>& oVect)
{
//首先取得最后一层迭代器
vector<NNlayer *>::iterator lit = m_layers.end() - ;
//用于保存最后一层所有结点误差
vector<double> dErrWrtDxLast((*lit)->m_neurals.size());
for (vector<NNneural>::size_type i = ; i != (*lit)->m_neurals.size(); i++)
{
dErrWrtDxLast[i]=oVect[i] - tVect[i];
}
//所有层的误差
vector<vector<double>> diffVect(nLayer);
diffVect[nLayer - ] = dErrWrtDxLast; //先将其他层误差设为0
for (unsigned int i = ; i < nLayer - ; i++)
{
//每层误差的个数要与神经元相等
diffVect[i].resize(m_layers[i]->m_neurals.size(), 0.0);
} vector<NNlayer>::size_type i = m_layers.size() - ;
//对每一层调用BP算法,第一个参数为第i层输出误差
//第二个参数可作为下次调用的返回值
for (lit; lit>m_layers.begin(); lit--)
{
(*lit)->backPropagate(diffVect[i], diffVect[i - ], etaLearningRate);
i--;
}
diffVect.clear();
} void NNlayer::backPropagate(vector<double>& dErrWrtDxn, vector<double>& dErrWrtDxnm, double eta)
{
//三个参数分别代表第i层的误差,第i-1层的误差,学习速率
//计算每个神经元的误差
double output;
vector<double> dErrWrtDyn(dErrWrtDxn.size());//每个神经元的残差
for (vector<NNneural>::size_type i = ; i != m_neurals.size(); i++)
{
output = m_neurals[i].output;
//计算第i层的残差,对于输出层,dErrWrtDxn表示误差,对于
//其他层,dErrWrtDxn表示w*(i+1层残差)
dErrWrtDyn[i] = DSIGMOD(output)*dErrWrtDxn[i];
}
//计算每个w的偏导数
unsigned ii();
vector<NNneural>::iterator nit = m_neurals.begin();
vector<double> dErrWrtDwn(m_weights.size(), ); while (nit != m_neurals.end())
{
//对于每个神经元
for (vector<NNconnection>::size_type k = ; k != (*nit).m_connection.size(); k++)
{
//对于每个权重连接
if (k == (*nit).m_connection.size() - )
output = ;//如果是偏置,则为1
else//与该权重相连的前一层神经元的输出
output = preLayer->m_neurals[(*nit).m_connection[k].neuralIdx].output;
//计算该权重的偏导数值(随着迭代的进行,偏导也是逐渐累加的)
dErrWrtDwn[((*nit).m_connection[k].weightIdx)] += output*dErrWrtDyn[ii];
}
nit++;
ii++;
} //dErrWrtDxnm作为下一层的dErrWrtDxn,用于计算残差
unsigned j();
nit = m_neurals.begin();
while (nit != m_neurals.end())
{
for (vector<NNconnection>::size_type k = ; k != (*nit).m_connection.size()-; k++)
{
dErrWrtDxnm[(*nit).m_connection[k].neuralIdx] += dErrWrtDyn[j] *
m_weights[(*nit).m_connection[k].weightIdx];
}
j++;
nit++;
} for (vector<double>::size_type i = ; i != m_weights.size(); i++)
{
m_weights[i] -= eta*dErrWrtDwn[i];
}
}
多层神经网络与C++实现的更多相关文章
- 多层神经网络BP算法 原理及推导
首先什么是人工神经网络?简单来说就是将单个感知器作为一个神经网络节点,然后用此类节点组成一个层次网络结构,我们称此网络即为人工神经网络(本人自己的理解).当网络的层次大于等于3层(输入层+隐藏层(大于 ...
- TensorFlow 训练MNIST数据集(2)—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...
- 用Tensorflow实现多层神经网络
用Tensorflow实现多层神经网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Tensorflow机器学习实战指南 源代码请点击下方链接欢迎加星 ReLU激活函数/L1范数 ...
- Spark2.0机器学习系列之7: MLPC(多层神经网络)
Spark2.0 MLPC(多层神经网络分类器)算法概述 MultilayerPerceptronClassifier(MLPC)这是一个基于前馈神经网络的分类器,它是一种在输入层与输出层之间含有一层 ...
- ufldl学习笔记与编程作业:Multi-Layer Neural Network(多层神经网络+识别手写体编程)
ufldl学习笔记与编程作业:Multi-Layer Neural Network(多层神经网络+识别手写体编程) ufldl出了新教程,感觉比之前的好,从基础讲起,系统清晰,又有编程实践. 在dee ...
- MXNET:多层神经网络
多层感知机(multilayer perceptron,简称MLP)是最基础的深度学习模型. 多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hidden layer).隐藏层位于输入层和输出层 ...
- MLP(多层神经网络)介绍
写在前面的 接触神经网络(ANN)的时间很长了,以前也只是学了学原理,做过一个BPN的练习,没有系统的总结过,最近看Torch的源码,对MLP有了更多的了解,写写自己学到的东西吧,算是做了一次总结! ...
- 学习笔记TF011:多层神经网络
线性回归.对数几率回归模型,本质上是单个神经元.计算输入特征加权和.偏置视为每个样本输入特征为1权重,计算特征线性组合.激活(传递)函数 计算输出.线性回归,恒等式(值不变).对数几率回归,sigmo ...
- 简单多层神经网络实现异或XOR
最近在看<Neural Network Design_Hagan> 然后想自己实现一个XOR 的网络. 由于单层神经网络不能将异或的判定分为两类. 根据 a^b=(a&~b)|(~ ...
- ubuntu之路——day14 只用python的numpy在底层实现多层神经网络
首先感谢这位博主整理的Andrew Ng的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273 ...
随机推荐
- “耐撕”团队 2016.03.30 站立会议
1. 时间: 16:45--17:05 总计:20分钟 2. 成员: Z 郑蕊 * 组长 (博客:http://www.cnblogs.com/zhengrui0452/), P 濮成林(博客:ht ...
- 全局唯一标识符(GUID)
全局唯一标识符,简称GUID(发音为/ˈɡuːɪd/或/ˈɡwɪd/),是一种由算法生成的唯一标识,通常表示成32个16进制数字(0-9,A-F)组成的字符串,如:{21EC2020-3AEA-106 ...
- maven_创建quickstart模板时异常
错误信息: Could not resolve archetype org.apache.maven.archetypes:maven-archetype-quickstart:1.1 from an ...
- unicode和gbk的互相转换
unicode和gbk的互相转换主要依靠window下的escape和unescape方法,然后把%u替换成\u就好了; var GB2312UnicodeConverter = { ToUnicod ...
- hdu3746 KMP
这题琢磨了挺长的时间.需要理解next[]表示了什么; next[i]代表了前缀和后缀的最大匹配的值,也就是个数. len-next[len]表示循环节的长度; 比如abcab int fl=le ...
- Android中的Uri.parse()
1,调web浏览器 Uri myBlogUri = Uri.parse("http://www.baidu.com"); returnIt = new Intent(Intent. ...
- POJ2594 Treasure Exploration
Time Limit: 6000MS Memory Limit: 65536K Total Submissions: 8193 Accepted: 3358 Description Have ...
- CODEVS 1959 拔河比赛(另一版本)
题目描述 Description 一个学校举行拔河比赛,所有的人被分成了两组,每个人必须(且只能够)在其中的一组,要求两个组的人数相差不能超过1,且两个组内的所有人体重加起来尽可能地接近. 输入描述 ...
- hdu 2046 骨牌铺方格
#include<stdio.h> int main(void) { long long i,n,narr[55]; narr[1]=1;narr[2]=2;narr[3]=3; for( ...
- Linux下如何搭建VPN服务器(转)
VPN服务器的配置与应用 实验场景 通过将Linux配置VPN服务器允许远程计算机能够访问内网. 我的目的: 现在需要开发第三方接口,而第三方接口有服务器IP地址鉴权配置,这样在本地开发出来的程序每次 ...