Tensorflow之MNIST手写数字识别：分类问题（2）

整体代码：

#数据读取

import tensorflow as tf

import matplotlib.pyplot as plt

import numpy as np

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)

#定义待输入数据的占位符

#mnist中每张照片共有28*28=784个像素点

x = tf.placeholder(tf.float32,[None,784],name="X")

#0-9一共10个数字=>10个类别

y = tf.placeholder(tf.float32,[None,10],name="Y")

#定义模型变量

#以正态分布的随机数初始化权重W，以常数0初始化偏置b

#在神经网络中，权值W的初始值通常设为正态分布的随机数，偏置项b的初始值通常也设置为正态分布的随机数或常数。

W = tf.Variable(tf.random_normal([784,10],name="W"))

b = tf.Variable(tf.zeros([10]),name="b")

#用单个神经元构建神经网络

forward=tf.matmul(x,W) + b   #前向计算

#结果分类

#当我们处理多分类任务的时候，通常需要使用Softmax Regression模型。Softmax会对每一类别估算出一个概率。

#工作原理：将判定为某一类的特征相加，然后将这些特征转化为判定是这一类的概率

pred = tf.nn.softmax(forward)     #Softmax分类

#设置训练参数

train_epochs = 120     #训练轮数

batch_size = 120      #单次训练样本数（批次大小）

total_batch = int(mnist.train.num_examples/batch_size)              #一轮训练有多少批次

display_step = 1   #显示粒度

learning_rate = 0.01             #学习率 

#概率估算值需要将预测输出值控制在[0,1]区间内。二元分类问题的目标是正确预测两个可能标签中的一个

#逻辑回归可以用于处理这类问题。二元逻辑回归的损失函数一般采用对数损失函数

#多元分类：逻辑回归可生成介于0到1.0之间的小数。Softmax将这一想法延伸到多类别领域。

#在多类别问题中，Softmax会为每个类别分配一个用小数表示的概率。这些用小数表示的概率相加之和必须是1.0

#交叉熵损失函数：交叉熵是一个信息论的概念，它原来是用来估算平均编码长度的。

#交叉熵刻画的是两个概率分布之间的距离，p代表正确答案，q代表的预测值，交叉熵越小，两个概率的分布越接近

#定义损失函数

loss_function = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))    #交叉熵

#选择优化器

optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_function)     #梯度下降优化器

#定义准确率

# 检查预测类别tf.argmax(pred,1)与实际类别tf.argmax(y,1)的匹配情况

#argmax()将数组中最大值的下标取出来

correct_prediction = tf.equal(tf.argmax(pred,1),tf.argmax(y,1))

#准确率，将布尔值转化为浮点数，并计算平均值    tf.cast()将布尔值投射成浮点数

accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

#声明会话，初始化变量

sess = tf.Session()

init = tf.global_variables_initializer()   #变量初始化

sess.run(init)

#训练模型

for epoch in range(train_epochs):

    for batch in range(total_batch):

        xs,ys = mnist.train.next_batch(batch_size)  #读取批次数据

        sess.run(optimizer,feed_dict={x:xs,y:ys})   #执行批次训练

    #total_batch个批次训练完成后，使用验证数据计算误差与准确率，验证集没有分批

    loss,acc = sess.run([loss_function,accuracy],feed_dict={x:mnist.validation.images,y:mnist.validation.labels})

    #打印训练过程中的详细信息

    if (epoch+1) % display_step == 0:

        print("Train Epoch:",'%02d'%(epoch+1),"Loss=","{:.9f}".format(loss),"Accuracy=","{:.4f}".format(acc))

print("Train Finished!")

#评估模型

#完成训练后，在测试集上评估模型的准确率

accu_test = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})

print("Test Accuracy:",accu_test)

#完成训练后，在验证集上评估模型的准确率

accu_validation = sess.run(accuracy,feed_dict={x:mnist.validation.images,y:mnist.validation.labels})

print("Test Accuracy:",accu_validation)

#完成训练后，在训练集上评估模型的准确率

accu_train = sess.run(accuracy,feed_dict={x:mnist.train.images,y:mnist.train.labels})

print("Test Accuracy:",accu_train)

#应用模型

#在建立模型并进行训练后，若认为准确率可以接受，则可以使用此模型进行预测

#由于pred预测结果是one_hot编码格式，所以需要转换成0~9数字

prediction_result = sess.run(tf.argmax(pred,1),feed_dict={x:mnist.test.images})

#查看预测结果中的前10项

prediction_result[0:10]

#定义可视化函数

def plot_images_labels_prediction(images,labels,prediction,index,num=10):  #参数： 图形列表，标签列表，预测值列表，从第index个开始显示，缺省一次显示10幅

    fig = plt.gcf()             #获取当前图表，Get Current Figure

    fig.set_size_inches(10,12)    #1英寸等于2.45cm

    if num > 25 :      #最多显示25个子图

        num = 25

    for i in range(0,num):

        ax = plt.subplot(5,5,i+1)   #获取当前要处理的子图

        ax.imshow(np.reshape(images[index],(28,28)), cmap = 'binary')              #显示第index个图像

        title = "labels="+str(np.argmax(labels[index]))              #构建该图上要显示的title信息

        if len(prediction)>0:

            title += ",predict="+str(prediction[index])

        ax.set_title(title,fontsize=10)    #显示图上的title信息

        ax.set_xticks([])           #不显示坐标轴

        ax.set_yticks([])

        index += 1

    plt.show()

#可视化预测结果

plot_images_labels_prediction(mnist.test.images,mnist.test.labels,prediction_result,10,10)

Tensorflow之MNIST手写数字识别：分类问题（2）的更多相关文章

Android+TensorFlow+CNN+MNIST 手写数字识别实现
Android+TensorFlow+CNN+MNIST 手写数字识别实现 SkySeraph 2018 Email:skyseraph00#163.com 更多精彩请直接访问SkySeraph个人站 ...
基于tensorflow的MNIST手写数字识别（二）--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型基于tensorflow的MNIST手写数字识 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
Tensorflow之MNIST手写数字识别：分类问题（1）
一.MNIST数据集读取 one hot 独热编码独热编码是一种稀疏向量,其中:一个向量设为1,其他元素均设为0.独热编码常用于表示拥有有限个可能值的字符串或标识符优点: 1.将离散特征的取值扩展 ...
Tensorflow实现MNIST手写数字识别
之前我们讲了神经网络的起源.单层神经网络.多层神经网络的搭建过程.搭建时要注意到的具体问题.以及解决这些问题的具体方法.本文将通过一个经典的案例:MNIST手写数字识别,以代码的形式来为大家梳理一遍神 ...
基于TensorFlow的MNIST手写数字识别-深入
构建多层卷积神经网络时需要多组W和偏移项b,我们封装2个方法来产生W和b 初级MNIST中用0初始化W和b,这里用噪声初始化进行对称打破,防止产生梯度0,同时用一个小的正值来初始化b避免dead ne ...
TensorFlow——MNIST手写数字识别
MNIST手写数字识别 MNIST数据集介绍和下载:http://yann.lecun.com/exdb/mnist/ 一.数据集介绍: MNIST是一个入门级的计算机视觉数据集下载下来的数据集 ...
mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）
前言今天记录一下深度学习的另外一个入门项目——<mnist数据集手写数字识别>,这是一个入门必备的学习案例,主要使用了tensorflow下的keras网络结构的Sequential模型 ...
mnist 手写数字识别
mnist 手写数字识别三大步骤 1.定义分类模型2.训练模型3.评价模型 import tensorflow as tfimport input_datamnist = input_data.rea ...

随机推荐

Nginx 配置详细文件
概述 Nginx 是使用一个 master 进程来管理多个 worker 进程提供服务.master 负责管理 worker 进程,而 worker 进程则提供真正的客户服务,worker 进程的数量 ...
EOJ Monthly 2019.11 E. 数学题（莫比乌斯反演+杜教筛+拉格朗日插值）
传送门题意: 统计$k$元组个数$(a_1,a_2,\cdots,a_n),1\leq a_i\leq n$使得$gcd(a_1,a_2,\cdots,a_k,n)=1$. 定义\(f( ...
二叉搜索树中第K小的元素
给定一个二叉搜索树,编写一个函数 kthSmallest 来查找其中第 k 个最小的元素. 说明:你可以假设 k 总是有效的,1 ≤ k ≤ 二叉搜索树元素个数. 示例 1: 输入: root = [ ...
jinja2模板用法
我不是代码的生产者,我只是知识的搬运工 jinja2模板用法
Collection接口综述
Collection接口 Collection是集合类基本的接口,它不提供具体的实现,集合类都继承自Collection接口,Collection代表的是一种规则,它包含的元素必须符合某种规则,比如有 ...
POJ1961Period(kmp+循环节)
传送门题目大意:输出字符串所有前缀的循环节个数,下标从1开始,i 和1-i循环节的个数题解:网上摘得 KMP最小循环节.循环周期: 定理:假设S的长度为len,则S存在最小循环节,循环节的长度L为 ...
11-Django站点管理
站点管理内容发布的部分由网站的管理员负责,包括查看.添加.修改.删除数据开发这些重复的功能是一件单调乏味.缺乏创造力的工作,为此,Django能够根据定义的模型类自动地生成管理模块在Django ...
【CF1053E】Euler tour
[CF1053E]Euler tour 题面 CF 洛谷大概意思是你有一棵树,然而你并不知道这棵树是啥.给你一个确定了一些位置的欧拉序(就是$ST$表求$LCA$的那个序列),问你是否存在一 ...
JQuery学习笔记（2）——数组属性事件
each遍历 JQueryObjectArray.each(function(index,Element)) $(".myTable").each(function(i,ele){ ...
Java开发桌面程序学习（12）——Javafx 悬浮窗提示 tooptip
Javafx 悬浮窗提示 tooptip 鼠标悬浮在某个控件,弹出提示,效果如下: 代码: //control是某个控件 Tooltip.install(control, new Tooltip(&q ...

Tensorflow之MNIST手写数字识别：分类问题（2）

Tensorflow之MNIST手写数字识别：分类问题（2）的更多相关文章

随机推荐

热门专题