吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

INPUT_NODE = 784     # 输入节点

OUTPUT_NODE = 10     # 输出节点

LAYER1_NODE = 500    # 隐藏层数       

BATCH_SIZE = 100     # 每次batch打包的样本个数        

# 模型相关的参数

LEARNING_RATE = 0.1

REGULARAZTION_RATE = 0.0001

TRAINING_STEPS = 5000

MOVING_AVERAGE_DECAY = 0.99  

def inference(input_tensor, avg_class, weights1, biases1, weights2, biases2):

    # 不使用滑动平均类

    if avg_class == None:

        layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)

        return tf.matmul(layer1, weights2) + biases2

    else:

        # 使用滑动平均类

        layer1 = tf.nn.relu(tf.matmul(input_tensor, avg_class.average(weights1)) + avg_class.average(biases1))

        return tf.matmul(layer1, avg_class.average(weights2)) + avg_class.average(biases2)  

def train(mnist):

    x = tf.placeholder(tf.float32, [None, INPUT_NODE], name='x-input')

    y_ = tf.placeholder(tf.float32, [None, OUTPUT_NODE], name='y-input')

    # 生成隐藏层的参数。

    weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE], stddev=0.1))

    biases1 = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))

    # 生成输出层的参数。

    weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1))

    biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

    # 计算不含滑动平均类的前向传播结果

    y = inference(x, None, weights1, biases1, weights2, biases2)

    # 定义训练轮数及相关的滑动平均类

    global_step = tf.Variable(0, trainable=False)

    variable_averages = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)

    variables_averages_op = variable_averages.apply(tf.trainable_variables())

    average_y = inference(x, variable_averages, weights1, biases1, weights2, biases2)

    # 计算交叉熵及其平均值

    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))

    cross_entropy_mean = tf.reduce_mean(cross_entropy)

    # 损失函数的计算

    regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)

    regularaztion = regularizer(weights1) + regularizer(weights2)

    loss = cross_entropy_mean + regularaztion

    # 优化损失函数

    train_step = tf.train.GradientDescentOptimizer(LEARNING_RATE).minimize(loss, global_step=global_step)

    # 反向传播更新参数和更新每一个参数的滑动平均值

    with tf.control_dependencies([train_step, variables_averages_op]):

        train_op = tf.no_op(name='train')

    # 计算正确率

    correct_prediction = tf.equal(tf.argmax(average_y, 1), tf.argmax(y_, 1))

    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    # 初始化会话，并开始训练过程。

    with tf.Session() as sess:

        tf.global_variables_initializer().run()

        validate_feed = {x: mnist.validation.images, y_: mnist.validation.labels}

        test_feed = {x: mnist.test.images, y_: mnist.test.labels} 

        # 循环的训练神经网络。

        for i in range(TRAINING_STEPS):

            if i % 1000 == 0:

                validate_acc = sess.run(accuracy, feed_dict=validate_feed)

                print("After %d training step(s), validation accuracy using average model is %g " % (i, validate_acc))

            xs,ys=mnist.train.next_batch(BATCH_SIZE)

            sess.run(train_op,feed_dict={x:xs,y_:ys})

        test_acc=sess.run(accuracy,feed_dict=test_feed)

        print(("After %d training step(s), test accuracy using average model is %g" %(TRAINING_STEPS, test_acc)))

def main(argv=None):

    mnist = input_data.read_data_sets("E:\\MNIST_data\\", one_hot=True)

    train(mnist)

if __name__=='__main__':

    main()

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率的更多相关文章

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用滑动平均
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用隐藏层
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用激活函数
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用正则化
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：全模型
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：花瓣识别
import os import glob import os.path import numpy as np import tensorflow as tf from tensorflow.pyth ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：MNIST最佳实践
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_N ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：卷积层、池化层样例
import numpy as np import tensorflow as tf M = np.array([ [[1],[-1],[0]], [[-1],[2],[1]], [[0],[2],[ ...
吴裕雄--天生自然 Tensorflow卷积神经网络：花朵图片识别
import os import numpy as np import matplotlib.pyplot as plt from PIL import Image, ImageChops from ...

随机推荐

pyautocad
首部必须 #!/usr/bin/env python # -*- coding: utf-8 -*- 导入pyautocad import pyautocad import re # 设置python ...
sqlserver数据库导入大批量数据
参考: https://www.cnblogs.com/zhangliangzlee/p/3585862.html
Documents
centos 7 修改主机名 hostnamectl set-hostname myhostname ansible node -m raw -a "if [[ \$(cat /root/. ...
HTML学习（3）基础
*开始标签常被称为起始标签(opening tag),结束标签常称为闭合标签(closing tag). *虽然有时候忘记写结束标签有的浏览器也能正常显示内容,但有时候会出现不可预料的结果或错误,所以 ...
TCP／IP详解，卷1：协议--1
引言很多不同的厂家生产各种型号的计算机,它们运行完全不同的操作系统,但 T C P / I P 协议族允许它们互相进行通信.这一点很让人感到吃惊,因为它的作用已远远超出了起初的设想. T C P ...
两台linux之间传输文件
scp传输当两台LINUX主机之间要互传文件时可使用SCP命令来实现 scp传输速度较慢,但使用ssh通道保证了传输的安全性复制文件将本地文件拷贝到远程 scp local_file remot ...
bootstrap的网格控制
<div class="container-fluid row m-0 p-0"> <div class="col-2 border"> ...
python 实现 md文档自动编号
目录 1. 原理 2. 运行方法 3. 效果 4. 代码 1. 原理正则匹配对相应字符串进行替换 2. 运行方法 python md_convert.py [a.md, b.md,...] # 转换 ...
ISR模块
SM-SRE-700-K9:先来介绍一下这个模块 Q:它是用来干嘛的?A:思科服务就绪引擎模块是思科集成多业务路由器第2代(ISR G2)的高性能路由器刀片,可提供托管思科,第三方和自定义应用程序的功 ...
Linux - CentOS7 命令行快捷键简介
1. 概述 CentOS7 下输入命令的一些快捷键 2. 快捷键 1. 移动单个字符 ctrl + b/f 单个单词 alt + b/f 行首行尾 ctrl + a/e 2. 编辑删除单个字符 c ...

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率的更多相关文章

随机推荐

热门专题