神经网络算法以及Tensorflow的实现

一、多层向前神经网络(Multilayer Feed-Forward Neural Network)

多层向前神经网络由三部分组成：输入层(input layer), 隐藏层 (hidden layers), 输入层 (output layers)
每层由单元(units)组成
输入层(input layer)是由训练集的实例特征向量传入
经过连接结点的权重(weight)传入下一层，上一层的输出是下一层的输入
隐藏层的个数可以是任意的，输入层有一层，输出层有一层
每个单元(unit)也可以被称作神经结点（根据生物学来源定义）
以上成为2层的神经网络（输入层不算）
一层中加权的求和（输入乘以权重在加上偏向），然后根据非线性方程转化输出
作为多层向前神经网络，理论上，如果有足够多的隐藏层(hidden layers) 和足够大的训练集, 可以模拟出任何方程

二、神经网络结构设计

使用神经网络训练数据之前，必须确定神经网络的层数，以及每层单元的个数
特征向量在被传入输入层时通常被先标准化(normalize）到0和1之间（为了加速学习过程）
离散型变量可以被编码成每一个输入单元对应一个特征值可能赋的值

比如：特征值A可能取三个值（a0, a1, a2), 可以使用3个输入单元来代表A。

如果A=a0, 那么代表a0的单元值就取1, 其他取0；
如果A=a1, 那么代表a1de单元值就取1，其他取0，以此类推

神经网络即可以用来做分类(classification）问题，也可以解决回归(regression)问题

对于分类问题，如果是2类，可以用一个输出单元表示（0和1分别代表2类）
如果多于2类，每一个类别用一个输出单元表示
所以输入层的单元数量通常等于类别的数量

没有明确的规则来设计最好有多少个隐藏层

根据实验测试和误差，以及准确度来实验并改

三、Backpropagation算法

通过迭代思想来处理训练集中的实例
对比经过神经网络后输入层预测值(predicted value)与真实值(target value)之间
反方向（从输出层=>隐藏层=>输入层）来以最小化误差(error)来更新每个连接的权重(weight)
算法详细介绍:

初始化权重(weights)和偏向(bias): 随机初始化在-1到1之间，或者-0.5到0.5之间，每个单元有一个偏向
对于每一个训练实例X，执行以下步骤：

由输入层向前传送(前向传播)：输入层==>权重和偏向==>非线性处理==>输出层(预测结果)
根据误差(error)反向传送:误差==>输出层==>隐藏层==>输入层(通常利用梯度下降算法)（更新权重和偏向）

3.终止条件

权重的更新低于某个阈值
预测的错误率低于某个阈值
达到预设一定的循环次数

四、利用神经网络实现回归问题——非线性回归

 #程序：

 import os

 os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

 import tensorflow as tf

 import numpy as np

 import matplotlib.pyplot as plt     #python中画图工具包

 #使用numpy生成200个随机点（样本点）

 x_data = np.linspace(-0.5, 0.5, 200)[:, np.newaxis]      #使用numpy生成200个随机点，[:, np.newaxis]增加维度（x_data 是一个200行1列的数据）

 noise = np.random.normal(0, 0.02, x_data.shape)         #生成随机噪声干扰项（形状同x_data）

 y_data = np.square(x_data) + noise               #构造类似于二次函数的点图形

 #定义两个placeholder

 x = tf.placeholder(tf.float32, [None, 1])    #x、y的维度为任意行，1列（根据样本来定义的维度）

 y = tf.placeholder(tf.float32, [None, 1])

 #定义神经网络隐藏层L1（该神经网络的神经元数量为（1-10-1））

 Weights_L1 = tf.Variable(tf.random_normal([1, 10]))    #随机产生10个权重

 Biases_L1 = tf.Variable(tf.zeros([1, 10]))    #0初始化偏向

 Wx_plus_B_L1 = tf.matmul(x, Weights_L1) + Biases_L1    #L1层进行加权求和

 L1 = tf.nn.tanh(Wx_plus_B_L1)   #根据非线性方程（双曲正切函数）转化输出

 #定义神经网络输出层

 Weights_L2 = tf.Variable(tf.random_normal([10, 1]))

 Biases_L2 = tf.Variable(tf.zeros([1, 1]))

 Wx_plus_B_L2 = tf.matmul(L1, Weights_L2) + Biases_L2    #将L1的输出作为输出层的输入

 prediction = tf.nn.tanh(Wx_plus_B_L2)         #预测值

 #定义二次代价函数

 loss = tf.reduce_mean(tf.square(y - prediction))

 #使用随机梯度下降法进行训练，使得二次代价函数最小

 train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

 #变量初始化

 init = tf.global_variables_initializer()

 #定义会话

 with tf.Session() as sess:

     sess.run(init)

     for _ in range(2000):     #进行2000次训练学习

         sess.run(train_step, feed_dict = {x:x_data, y:y_data})

     #获得预测值

     prediction_value = sess.run(prediction, feed_dict = {x:x_data})

     #画图

     plt.figure()

     plt.scatter(x_data, y_data)

     plt.plot(x_data, prediction_value, 'r-', lw = 5)

     plt.show()

#执行结果：

五、利用神经网络实现分类问题——MNIST数据集分类相关介绍及其简单实现

1. MNINST数据集介绍

MINST数据集官网： http://yann.lecun.com/exdb/mnist/
MINST数据集分类：MNIST手写数字数据库具有60000个示例的训练集和10000个示例的测试集
每一张图片包含28*28个像素，将其变成一个1行28*28=784列的向量。图片中的像素值介于0-1之间。
60000个示例的训练集是一个[60000,784]的张量。
MNIST数据集的标签是0-9的数字。
‘one-hot vector’：某一位维度的数字是1，其余维度的数字是0.
将MNIST数据集的标签转换为‘one-hot vector’，比如标签5，用该种方法表示为：[0000010000]

2. softmax函数（归一化指数函数）

作用：

将一个含任意实数的k维向量‘压缩’到另一个k维向量中，使得每一个元素的范围都在（0,1）之间，并且所有元素的和位1。

形式：

常用于基于概率的多分类问题中

举例理解：
比如MNIST数据集识别结果为(1,5,3)
则：
exp（1）= 2.718；exp（5）= 148.413；exp（3）= 20.086
exp（1）+ exp（5）+ exp（3）= 171.217
P1 = exp（1）% ( exp（1）+ exp（5）+ exp（3）)= 0.016
P5 = exp（5）% ( exp（1）+ exp（5）+ exp（3）)= 0.867
P3 = exp（3）% ( exp（1）+ exp（5）+ exp（3）)= 0.117
因为结果为5的概率最大。所以，最终识别结果应该是 5.

3.构建简单的神经网络来进行MNIST数据集识别

784个神经元作为输入，无隐藏层，10个神经元为输出

4.Tensorflow程序实现

 import os

 os.environ['TF_CPP_MIN_LOG_LEVEL'] = ''

 import tensorflow as tf

 from tensorflow.examples.tutorials.mnist import input_data

 #载入数据集

 mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

 #每个批次的大小（即每次训练的图片数量）

 batch_size = 50

 #计算一共有多少个批次

 n_bitch = mnist.train.num_examples // batch_size

 #定义两个placeholder

 x = tf.placeholder(tf.float32, [None, 784])

 y = tf.placeholder(tf.float32, [None, 10])

 #创建一个只有输入层（784个神经元）和输出层（10个神经元）的简单神经网络

 Weights = tf.Variable(tf.zeros([784, 10]))

 Biases = tf.Variable(tf.zeros([10]))

 Wx_plus_B = tf.matmul(x, Weights) + Biases

 prediction = tf.nn.softmax(Wx_plus_B)

 #二次代价函数

 loss = tf.reduce_mean(tf.square(y - prediction))

 #使用梯度下降法

 train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

 #初始化变量

 init = tf.global_variables_initializer()

 #结果存放在一个布尔型列表中

 correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(prediction, 1)) #argmax返回一维张量中最大的值所在的位置，标签值和预测值相同，返回为True

 #求准确率

 accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) #cast函数将correct_prediction的布尔型转换为浮点型，然后计算平均值即为准确率

 with tf.Session() as sess:

     sess.run(init)

     #将测试集循环训练20次

     for epoch in range(21):

         #将测试集中所有数据循环一次

         for batch in range(n_bitch):

             batch_xs, batch_ys = mnist.train.next_batch(batch_size)   #取测试集中batch_size数量的图片及对应的标签值

             sess.run(train_step, feed_dict={x:batch_xs, y:batch_ys})  #将上一行代码取到的数据进行训练

         acc = sess.run(accuracy, feed_dict={x:mnist.test.images, y:mnist.test.labels})  #准确率的计算

         print('Iter: ' + str(epoch) + ',Testing Accuracy= ' + str(acc))

#执行结果

 #执行结果：（因为已经下载过数据集，如果第一次运行，是提示下载成功）

 Extracting MNIST_data\train-images-idx3-ubyte.gz

 Extracting MNIST_data\train-labels-idx1-ubyte.gz

 Extracting MNIST_data\t10k-images-idx3-ubyte.gz

 Extracting MNIST_data\t10k-labels-idx1-ubyte.gz

 Iter : 0,Testing Accuracy = 0.8599

 Iter : 1,Testing Accuracy = 0.8806

 Iter : 2,Testing Accuracy = 0.8909

 Iter : 3,Testing Accuracy = 0.8963

 Iter : 4,Testing Accuracy = 0.9006

 Iter : 5,Testing Accuracy = 0.9034

 Iter : 6,Testing Accuracy = 0.9047

 Iter : 7,Testing Accuracy = 0.9069

 Iter : 8,Testing Accuracy = 0.908

 Iter : 9,Testing Accuracy = 0.9094

 Iter : 10,Testing Accuracy = 0.9113

 Iter : 11,Testing Accuracy = 0.9127

 Iter : 12,Testing Accuracy = 0.9137

 Iter : 13,Testing Accuracy = 0.9144

 Iter : 14,Testing Accuracy = 0.9144

 Iter : 15,Testing Accuracy = 0.9156

 Iter : 16,Testing Accuracy = 0.9156

 Iter : 17,Testing Accuracy = 0.9171

 Iter : 18,Testing Accuracy = 0.9173

 Iter : 19,Testing Accuracy = 0.9177

 Iter : 20,Testing Accuracy = 0.9179

#准确率不是很高，但是我只是构建了最简单的输入输出层。我会根据之后所学去优化程序，提高准确率

机器学习与Tensorflow（2）——神经网络及Tensorflow实现的更多相关文章

机器学习与Tensorflow（4）——卷积神经网络与tensorflow实现
1.标准卷积神经网络标准的卷积神经网络由输入层.卷积层(convolutional layer).下采样层(downsampling layer).全连接层(fully—connected laye ...
用Tensorflow让神经网络自动创造音乐
#————————————————————————本文禁止转载,禁止用于各类讲座及ppt中,违者必究————————————————————————# 前几天看到一个有意思的分享,大意是讲如何用Ten ...
学习笔记TF053:循环神经网络，TensorFlow Model Zoo，强化学习，深度森林，深度学习艺术
循环神经网络.https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/re ...
大白话5分钟带你走进人工智能-第36节神经网络之tensorflow的前世今生和DAG原理图解(4)
目录 1.Tensorflow框架简介 2.安装Tensorflow 3.核心概念 4.代码实例和详细解释 5.拓扑图之有向无环图DAG 6.其他深度学习框架详细描述 6.1 Caffe框架: 6.2 ...
tensorflow卷积神经网络与手写字识别
1.知识点 """ 基础知识: 1.神经网络(neural networks)的基本组成包括输入层.隐藏层.输出层.而卷积神经网络的特点在于隐藏层分为卷积层和池化层(po ...
机器学习实战_基于Scikit-Learn和Tensorflow读书笔记
第一部分机器学习基础第二部分神经网络和深度学习第9章运行Tensorflow 分布式系统:分布式系统的定义是这个系统建立在网络的操作系统,具有高度的内聚性和透明性,它与网络的区别在于高层软件 ...
TensorFlow 卷积神经网络实用指南 | iBooker·ApacheCN
原文:Hands-On Convolutional Neural Networks with TensorFlow 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译不要担心自己的形象,只关心 ...
（转）一文学会用 Tensorflow 搭建神经网络
一文学会用 Tensorflow 搭建神经网络本文转自:http://www.jianshu.com/p/e112012a4b2d 字数2259 阅读3168 评论8 喜欢11 cs224d-Day ...
Chinese-Text-Classification，用卷积神经网络基于 Tensorflow 实现的中文文本分类。
用卷积神经网络基于 Tensorflow 实现的中文文本分类项目地址: https://github.com/fendouai/Chinese-Text-Classification 欢迎提问:ht ...

随机推荐

c#内存中创建反射
代码 IWFP_SYS_Bytes mywfpbyte; /**/ byte[] bin=null; using (FileStream fs = new FileStream(filename, F ...
容器,表格 ,div,元素可左右拖动,滚动 css
<!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8&quo ...
JS如何创建对象
js创建对象的方法很多,以下分别介绍
工作中的小tips（持续更新）
1.在工作的时候一定要留下痕迹,这样即使乙方抵赖,或者说领导认为你没干活的时候留下证据(电话没有微信,邮件之类的文字类有效果) 2.每天晚上下班之前将一天的工作总结一下,把第二天的工作给罗列出来,以方 ...
python advanced programming (Ⅲ)
IO编程 IO在计算机中指Input/Output.由于程序和运行时数据是在内存中驻留,由CPU来执行,涉及到数据交换的地方,通常是磁盘.网络等,就需要IO接口. IO编程中,Stream(流)是一个 ...
java通过poi编写excel文件
public String writeExcel(List<MedicalWhiteList> MedicalWhiteList) { if(MedicalWhiteList == nul ...
20155326 2017-2018-1 《信息安全系统设计基础》课下加分项mypwd实现
20155326 2017-2018-1 <信息安全系统设计基础>课下加分项mypwd实现 pwd命令能做什么在虚拟机中输入pwd查看其返回的是什么通过上图得知pwd命令用来显示目录. ...
Pyenv 安装部署
Pyenv Pyenv是个多版本Python管理器,可以同时管理多个Python版本共存, 区别于virtualenv. 安装 git clone git://github.com/yyuu/pyen ...
pickle 继承
1.什么是方法,什么是函数 class Foo: def chi(self): print("我是吃") @staticmethod def static_method(): pa ...
poj 2262 Goldbach's Conjecture
素数判定...很简单= =.....只是因为训练题有,所以顺便更~ #include<cstdio> #include<memory.h> #define maxn 50000 ...

机器学习与Tensorflow（2）——神经网络及Tensorflow实现