模型:双层神经网络

【一层隐藏层、一层输出层】隐藏层输出用relu函数,输出层输出用softmax函数

过程:

  1. 设置参数
  2. 滑动平均的辅助函数
  3. 训练函数
  • x,y的占位,w1,b1,w2,b2的初始化
  • 前向传播【y = w * x +b,w和b采用滑动平均更新】
  • 后向传播【计算loss(包括交叉熵和正则化loss),采用GD更新参数(学习率使用指数衰减)】
  • 迭代训练数据

代码:

#参数设置
#输入、隐藏层神经元数、输出
samples = 55000
input_size = 784
output_size = 10
cell = 500
#训练次数,batch大小
training_step = 30000
batch_size = 100
#初始学习率、学习率衰减率、滑动平均衰减率、正则化系数
learning_rate = 0.8
learning_rate_decay = 0.99
moving_average_decay = 0.99
regulization_rate = 0.0001 #滑动平均的辅助函数
def moving_average_helper(input_x , ave_class , w1 , b1 , w2 , b2):
if ave_class == None:
layer1 = tf.nn.relu(tf.matmul(input_x,w1) + b1)
y_pre = tf.matmul(layer1,w2) + b2
else:
layer1 = tf.nn.relu(tf.matmul(input_x,ave_class.average(w1)) + ave_class.average(b1))
y_pre = tf.matmul(layer1,ave_class.average(w2)) + ave_class.average(b2)
return y_pre #建立模型、前向传播、后向传播,开始训练
def train(mnist,samples,input_size,output_size,cell,training_step,learning_rate,batch_size,learning_rate_decay,moving_average_decay,regulization_rate): ############################################################################
#输入和输出
x = tf.placeholder(tf.float32, [None,input_size] , name = 'x_input')
y = tf.placeholder(tf.float32, [ None,output_size] , name = 'y_output') #参数
w1 = tf.Variable(tf.truncated_normal([input_size,cell],stddev = 0.1))
b1 = tf.Variable(tf.constant(0.1,shape = [cell])) w2 = tf.Variable(tf.truncated_normal([cell,output_size],stddev = 0.1))
b2 = tf.Variable(tf.constant(0.1,shape = [output_size])) #不使用滑动平均
y_pre = moving_average_helper(x , None , w1 , b1 , w2 , b2)
############################################################################
#使用滑动平均计算预测值
global_step = tf.Variable(0,trainable=False)
ave_class = tf.train.ExponentialMovingAverage(moving_average_decay,global_step)
variable_ave = ave_class.apply(tf.trainable_variables())
moving_y_pre = moving_average_helper(x , ave_class , w1 , b1 , w2 , b2) y_ = moving_y_pre
#计算交叉熵loss
cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y,labels=tf.argmax(y_,1)) #是一个计算softmax且计算交叉熵的函数,其参数第一个为实际的y,第二个为预测的y的最大值索引值
cross_entropy_mean = tf.reduce_mean(cross_entropy) #计算所有样本的交叉熵平均值 #计算l2正则化loss
regularizer = tf.contrib.layers.l2_regularizer(regulization_rate)
regularization = regularizer(w1) + regularizer(w2) #计算loss
loss = cross_entropy_mean + regularization #设置指数衰减的学习率
newlearning_rate = tf.train.exponential_decay(learning_rate,global_step,samples/batch_size,learning_rate_decay) #优化损失函数
train_step = tf.train.GradientDescentOptimizer(newlearning_rate).minimize(loss , global_step = global_step) #同时训练参数和其滑动平均值
#train_op = tf.group(train_step,ave_class) with tf.control_dependencies([train_step, variable_ave]):
train_op = tf.no_op(name='train')
#计算准确度
correct = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct,tf.float32))
###############################################################################
with tf.Session() as sess:
tf.initialize_all_variables().run()
validate_feed = {x:mnist.validation.images,y:mnist.validation.labels}
test_feed = {x:mnist.test.images,y:mnist.test.labels} #循环迭代训练
for i in range(training_step):
if i % 1000 == 0:
validate_acc = sess.run(accuracy,feed_dict=validate_feed)
print('第%d验证集准确度%g:',%(i,validate_acc))
xs , ys = mnist.train.next_batch(batch_size)
sess.run(train_op,feed_dict={x:xs,y:ys})
test_acc = sess.run(accuracy,feed_dict=test_feed)
print("测试集准确度:",test_acc)

结果:

第%d验证集准确度%g: (0, 0.0924)
第%d验证集准确度%g: (1000, 0.0918)
第%d验证集准确度%g: (2000, 0.0922)
第%d验证集准确度%g: (3000, 0.0912)
第%d验证集准确度%g: (4000, 0.0912)
第%d验证集准确度%g: (5000, 0.0916)
第%d验证集准确度%g: (6000, 0.0914)
第%d验证集准确度%g: (7000, 0.0922)
第%d验证集准确度%g: (8000, 0.092)
第%d验证集准确度%g: (9000, 0.0922)
第%d验证集准确度%g: (10000, 0.0914)
第%d验证集准确度%g: (11000, 0.0918)
第%d验证集准确度%g: (12000, 0.092)
第%d验证集准确度%g: (13000, 0.093)
第%d验证集准确度%g: (14000, 0.0934)
第%d验证集准确度%g: (15000, 0.093)
第%d验证集准确度%g: (16000, 0.0928)
第%d验证集准确度%g: (17000, 0.0928)
第%d验证集准确度%g: (18000, 0.0922)
第%d验证集准确度%g: (19000, 0.0932)
第%d验证集准确度%g: (20000, 0.0934)
第%d验证集准确度%g: (21000, 0.094)
第%d验证集准确度%g: (22000, 0.0944)
第%d验证集准确度%g: (23000, 0.0946)
第%d验证集准确度%g: (24000, 0.0936)
第%d验证集准确度%g: (25000, 0.0964)
第%d验证集准确度%g: (26000, 0.097)
第%d验证集准确度%g: (27000, 0.097)
第%d验证集准确度%g: (28000, 0.0974)
第%d验证集准确度%g: (29000, 0.0976)
测试集准确度: 0.0887

常用函数解释:

tf.trainable_variables

返回所有 当前计算图中 在获取变量时未标记 trainable=False 的变量集合。【可用来更新所有参数时使用】

tf.control_dependencies(control_inputs):

此函数指定某些操作执行的依赖关系

返回一个控制依赖的上下文管理器,使用 with 关键字可以让在这个上下文环境中的操作都在 control_inputs 执行

1 with tf.control_dependencies([a, b]):
2 c = ....
3 d = ...

在执行完 a,b 操作之后,才能执行 c,d 操作。意思就是 c,d 操作依赖 a,b 操作

1 with tf.control_dependencies([train_step, variable_averages_op]):
2 train_op = tf.no_op(name='train')

tf.no_op():表示执行完 train_step, variable_averages_op 操作之后什么都不做

tf.group:

用于创造一个操作,可以将传入参数的所有操作进行分组,返回也是一个操作。

ops = tf.group(tensor1, tensor2,...)
其中*inputs是0个或者多个用于组合tensor,一旦ops完成了,那么传入的tensor1,tensor2,...等等都会完成了,经常用于组合一些训练节点,

tf.control_dependencies和tf.group两种机制可以用来实现一次完成多个操作。如以下两个程序是等价的:【为了一次实现train_step, variable_averages_op两个操作】

with tf.control_dependencies([train_step, variable_averages_op]):

        train_op = tf.no_op(name='train')

############################################

train_op = tf.group(train_step,variables_averages_op)

tf.cast()

cast(
x,
dtype,
name=None
)

将x的数据格式转化成dtype.例如,原来x的数据格式是bool, 
那么将其转化成float以后,就能够将其转化成0和1的序列。反之也可以。

TensorFlow+实战Google深度学习框架学习笔记(11)-----Mnist识别【采用滑动平均,双层神经网络】的更多相关文章

  1. [Tensorflow实战Google深度学习框架]笔记4

    本系列为Tensorflow实战Google深度学习框架知识笔记,仅为博主看书过程中觉得较为重要的知识点,简单摘要下来,内容较为零散,请见谅. 2017-11-06 [第五章] MNIST数字识别问题 ...

  2. TensorFlow+实战Google深度学习框架学习笔记(5)----神经网络训练步骤

    一.TensorFlow实战Google深度学习框架学习 1.步骤: 1.定义神经网络的结构和前向传播的输出结果. 2.定义损失函数以及选择反向传播优化的算法. 3.生成会话(session)并且在训 ...

  3. 1 如何使用pb文件保存和恢复模型进行迁移学习(学习Tensorflow 实战google深度学习框架)

    学习过程是Tensorflow 实战google深度学习框架一书的第六章的迁移学习环节. 具体见我提出的问题:https://www.tensorflowers.cn/t/5314 参考https:/ ...

  4. 学习《TensorFlow实战Google深度学习框架 (第2版) 》中文PDF和代码

    TensorFlow是谷歌2015年开源的主流深度学习框架,目前已得到广泛应用.<TensorFlow:实战Google深度学习框架(第2版)>为TensorFlow入门参考书,帮助快速. ...

  5. TensorFlow实战Google深度学习框架10-12章学习笔记

    目录 第10章 TensorFlow高层封装 第11章 TensorBoard可视化 第12章 TensorFlow计算加速 第10章 TensorFlow高层封装 目前比较流行的TensorFlow ...

  6. TensorFlow实战Google深度学习框架5-7章学习笔记

    目录 第5章 MNIST数字识别问题 第6章 图像识别与卷积神经网络 第7章 图像数据处理 第5章 MNIST数字识别问题 MNIST是一个非常有名的手写体数字识别数据集,在很多资料中,这个数据集都会 ...

  7. TensorFlow实战Google深度学习框架1-4章学习笔记

    目录 第1章 深度学习简介 第2章 TensorFlow环境搭建 第3章 TensorFlow入门 第4章 深层神经网络   第1章 深度学习简介 对于许多机器学习问题来说,特征提取不是一件简单的事情 ...

  8. TensorFlow+实战Google深度学习框架学习笔记(10)-----神经网络几种优化方法

    神经网络的优化方法: 1.学习率的设置(指数衰减) 2.过拟合问题(Dropout) 3.滑动平均模型(参数更新,使模型在测试数据上更鲁棒) 4.批标准化(解决网络层数加深而产生的问题---如梯度弥散 ...

  9. TensorFlow实战Google深度学习框架-人工智能教程-自学人工智能的第二天-深度学习

    自学人工智能的第一天 "TensorFlow 是谷歌 2015 年开源的主流深度学习框架,目前已得到广泛应用.本书为 TensorFlow 入门参考书,旨在帮助读者以快速.有效的方式上手 T ...

  10. 实现迁徙学习-《Tensorflow 实战Google深度学习框架》代码详解

    为了实现迁徙学习,首先是数据集的下载 #利用curl下载数据集 curl -o flower_photos.tgz http://download.tensorflow.org/example_ima ...

随机推荐

  1. (28)SpringBoot启动时的Banner设置【从零开始学Spring Boot】

    对于使用过Spring Boot的开发者来说,程序启动的时候输出的由字符组成的Spring符号并不陌生.这个是Spring Boot为自己设计的Banner: 1.    .   ____       ...

  2. 关于c对文件的操作

    要求从键盘输入给定文件的路径,要求将他中的内容读取出来并输入到你需要建的一个文本文档中还要从键盘输入到建的一个文本文当中 #include <stdio.h> int main() { F ...

  3. 洛谷—— P1784 数独

    https://www.luogu.org/problem/show?pid=1784 题目描述 数独是根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行.每一列.每一个粗线宫内的数字 ...

  4. POJ 3710

    树的删边游戏.. 由于题目的特殊性,我们只需计算环的边数值.若为偶环,则直接把环的根节点置0.若为奇环,则留下一条边与根结点相连,并那它们的SG置0: 注意的是,两个点也可构成环,因为允许重边.所以, ...

  5. 【android】uses-permission和permission具体解释

    1.<uses-permission>: 官方描写叙述: If an application needs access to a feature protected by a permis ...

  6. Fitnesse FIT的使用

    FIT是fitnesse使用的默认的引擎(SLIM的使用在上一篇文章中说明),不需要特别声明即可使用执行表格测试,所有编写的fixture都需要继承Fit的Fitxture 编写测试用例前需要先声明c ...

  7. leetcode || 56、 Merge Intervals

    problem: Given a collection of intervals, merge all overlapping intervals. For example, Given [1,3], ...

  8. 扩展欧几里德 poj1061 青蛙的约会

    扩展欧几里德很经典.可是也有时候挺难用的.一些东西一下子想不明确.. 于是来了一个逆天模板..仅仅要能列出Ax+By=C.就能解出x>=bound的一组解了~ LL exgcd(LL a, LL ...

  9. log4net写日志的时间附带时区信息

    <conversionPattern value="%date{yyyy-MM-dd HH:mm:ss.fffzzz} [%thread] %-5level %logger - %me ...

  10. 【撸码caffe 三】 caffe.cpp

    caffe.cpp文件完成对网络模型以及模型配置参数的读入和提取,提供了网络模型训练的入口函数train和对模型的测试入口函数test.文件中使用了很多gflags和glog指令,gflags是goo ...