跟我学算法-tensorflow 实现卷积神经网络附带保存和读取
这里的话就不多说明了,因为上上一个博客已经说明了
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('data/', one_hot=True) # 构造初始化参数, 方差为0.1
n_input = 784
n_output = 10
weights = {
'wc1' : tf.Variable(tf.truncated_normal([3, 3, 1, 64], stddev=0.1)),
'wc2' : tf.Variable(tf.truncated_normal([3, 3, 64, 128], stddev=0.1)),
'wd1' : tf.Variable(tf.truncated_normal([7*7*128, 1024], stddev=0.1)),
'wd2' : tf.Variable(tf.truncated_normal([1024, n_output], stddev=0.1)) } biases = {
'b1' : tf.Variable(tf.truncated_normal([64], stddev=0.1)),
'b2' : tf.Variable(tf.truncated_normal([128], stddev=0.1)),
'bd1' : tf.Variable(tf.truncated_normal([1024], stddev=0.1)),
'bd2' : tf.Variable(tf.truncated_normal([n_output], stddev=0.1)) } def conv_basic(_input, _w, _b, _keepratio): _input_r = tf.reshape(_input, shape=[-1, 28, 28, 1])
#进行卷积操作
_conv1 = tf.nn.conv2d(_input_r, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME')
# 使用激活函数
_conv1 = tf.nn.relu(tf.nn.bias_add(_conv1, _b['bc1']))
# 进行池化操作, padding='SAME', 表示维度不足就补齐
_pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], stride=[1, 2, 2, 1], padding='SAME')
#去除一部分数据
_pool1_dr1 = tf.nn.dropout(_pool1, _keepratio)
#第二次卷积操作
_conv2 = tf.nn.conv2d(_pool1_dr1, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME')
# 使用激活函数
_conv2 = tf.nn.relu(tf.nn.bias_add(_conv1, _b['bc1']))
# 进行池化操作
_pool2 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], stride=[1, 2, 2, 1], padding='SAME')
_pool_dr2 = tf.nn.dropout(_pool1, _keepratio) # 第一次全连接操作
# 对_pool_dr2 根据wd1重新构造函数
_densel = tf.reshape(_pool_dr2, [-1, _w['wd1'].get_shape().as_list()[0]])
_fcl = tf.nn.relu(tf.add(tf.matmul(_densel, _w['wd1'], _b['bd1'])))
_fc_dr1 = tf.nn.dropout(_fcl, _keepratio)
# 第二次全连接
_out = tf.add(tf.matmul(_fc_dr1, _w['wd2']), _b['bd2'])
out = {'input_r': _input_r, 'conv1': _conv1, 'pool1': _pool1, 'pool1_dr1': _pool_dr1,
'conv2': _conv2, 'pool2': _pool2, 'pool_dr2': _pool_dr2, 'dense1': _dense1,
'fcl': _fcl, 'fc_dr1': _fc_dr1, 'out': _out
}
return out x = tf.placeholder(tf.float32, [None, n_input])
y = tf.placeholder(tf.float32, [None, n_output])
keepratio = tf.placeholder(tf.float32) # FUNCTIONS # 构造cost函数
#获得预测结果
_pred =conv_basic(x, weights, biases, keepratio)['out']
# 输入预测结果与真实值构造cost 函数
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(_pred, y))
# 优化函数使得cost最小
optm = tf.train.AdamOptimizer(learning_rate=0.001).minimize(cost)
# 计算准确率
_corr = tf.equal(tf.argmax(_pred, 1), tf.argmax(y, 1))
accr = tf.reduce_mean(tf.cast(_corr, tf.float32))
init = tf.global_variables_initializer() # 进行训练
sess = tf.Session()
sess.run(init)
save_step = 1
# 每次只保存3个值
saver = tf.train.Saver(max_to_keep=3)
#迭代次数
training_epochs = 15
# 每次训练的样本数
batch_size = 16
#循环打印的次数
display_step = 1
do_train = 1
if do_train == 1:
for epoch in range(training_epochs):
avg_cost = 0.
#total_batch = int(mnist.train.num_examples/batch_size)
total_batch = 10
# Loop over all batches
for i in range(total_batch):
# 提取训练数据和标签
batch_xs, batch_ys = mnist.train.next_batch(batch_size)
#训练模型优化参数
sess.run(optm, feed_dict={x: batch_xs, y: batch_ys, keepratio:0.7})
# 加和损失值
avg_cost += sess.run(cost, feed_dict={x: batch_xs, y: batch_ys, keepratio:1.})/total_batch # Display logs per epoch step
if epoch % display_step == 0:
print ("Epoch: %03d/%03d cost: %.9f" % (epoch, training_epochs, avg_cost))
train_acc = sess.run(accr, feed_dict={x: batch_xs, y: batch_ys, keepratio:1.})
print (" Training accuracy: %.3f" % (train_acc))
#test_acc = sess.run(accr, feed_dict={x: testimg, y: testlabel, keepratio:1.})
#print (" Test accuracy: %.3f" % (test_acc))
if epoch % save_step == 0:
saver.save(sess, "save/nets/cnn_mnist_basic.ckpt-" + str(epoch))
print ("OPTIMIZATION FINISHED") if do_train == 0:
epoch = training_epochs - 1
saver.restore(sess, "save/nets/cnn_mnist_basic.ckpt-" + str(epoch))
# 对测试集进行测试
feed_test = {x: mnist.test.images, y: mnist.test.labels, keepratio:1.}
test_acc = sess.run(accr, feed_dict=feed_test)
print(test_acc)
跟我学算法-tensorflow 实现卷积神经网络附带保存和读取的更多相关文章
- 跟我学算法-tensorflow 实现卷积神经网络
我们采用的卷积神经网络是两层卷积层,两层池化层和两层全连接层 我们使用的数据是mnist数据,数据训练集的数据是50000*28*28*1 因为是黑白照片,所以通道数是1 第一次卷积采用64个filt ...
- TensorFlow实现卷积神经网络
1 卷积神经网络简介 在介绍卷积神经网络(CNN)之前,我们需要了解全连接神经网络与卷积神经网络的区别,下面先看一下两者的结构,如下所示: 图1 全连接神经网络与卷积神经网络结构 虽然上图中显示的全连 ...
- 使用TensorFlow的卷积神经网络识别自己的单个手写数字,填坑总结
折腾了几天,爬了大大小小若干的坑,特记录如下.代码在最后面. 环境: Python3.6.4 + TensorFlow 1.5.1 + Win7 64位 + I5 3570 CPU 方法: 先用MNI ...
- tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图
tensorflow CNN 卷积神经网络中的卷积层和池化层的代码和效果图 因为很多 demo 都比较复杂,专门抽出这两个函数,写的 demo. 更多教程:http://www.tensorflown ...
- Python之TensorFlow的卷积神经网络-5
一.卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度 ...
- 吴裕雄 python 神经网络——TensorFlow 使用卷积神经网络训练和预测MNIST手写数据集
import tensorflow as tf import numpy as np from tensorflow.examples.tutorials.mnist import input_dat ...
- TensorFlow构建卷积神经网络/模型保存与加载/正则化
TensorFlow 官方文档:https://www.tensorflow.org/api_guides/python/math_ops # Arithmetic Operators import ...
- Tensorflow之卷积神经网络(CNN)
前馈神经网络的弊端 前一篇文章介绍过MNIST,是采用的前馈神经网络的结构,这种结构有一个很大的弊端,就是提供的样本必须面面俱到,否则就容易出现预测失败.如下图: 同样是在一个图片中找圆形,如果左边为 ...
- 字符型图片验证码,使用tensorflow实现卷积神经网络,进行验证码识别CNN
本项目使用卷积神经网络识别字符型图片验证码,其基于 TensorFlow 框架.它封装了非常通用的校验.训练.验证.识别和调用 API,极大地减低了识别字符型验证码花费的时间和精力. 项目地址: ht ...
随机推荐
- Java研发工程师知识点总结
Java研发工程师知识点总结 最近一次更新2017年12月08日 大纲 一.Java基础(语言.集合框架.OOP.设计模式等) 二.Java高级(JavaEE.框架.服务器.工具等) 三.多线程和并发 ...
- Xcode8出现问题总结
上点干货,目前得知的一些bug解决汇总:iOS10相册相机闪退bughttp://www.jianshu.com/p/5085430b029fiOS 10 因苹果健康导致闪退 crashhttp:// ...
- 获取display:none的元素的宽度和高度
display为none的元素不能通过offsetWidth和offsetHeight来获取宽高(未参与css渲染), 解决方案:可以通过在display为none的元素使用行内样式style设置宽高 ...
- [转载]c语言指针segmentation fault 指针常常错误的小地方
http://www.cnblogs.com/qingjoin/archive/2012/03/20/2408944.html #include <stdio.h> ] = ] = ] = ...
- elasticsearch搜索引擎学习1
用elasticsearch-river-jdbc同步数据到elasticsearch 用elasticsearch-river-jdbc同步数据到elasticsearch 1 插件安装 插件的g ...
- WebGL编程指南案例解析之绘制三个点
//案例2.绘制3个点,将顶点数据存到缓冲区对象(gl.ARRAY_BUFFER)中,然后顶点着色器从里面读数据(3个顶点) //着色器将对这些顶点进行逐个解析, //第一个顶点给到顶点着色器,赋值给 ...
- 在webView 中使用JS 调用 Android / IOS的函数 Function
最近做一个项目,混合了NativeCode 和 HTML,为了便于JS 调用App的一些方法,统一封装一个Js方法,记录如下 Android 端首先要再WebView中允许JS的调用 WebView ...
- HDU3335 Divisibility Dilworth定理+最小路径覆盖
首先需要一些概念: 有向图,最小路径覆盖,最大独立集,Dilworth,偏序集,跳舞链(DLX).... 理解一: 对于DAG图,有:最大独立集=点-二分匹配数,二分匹配数=最小路径覆盖. 而无向图, ...
- animationx详解
animation是CSS3中极其强大的功能,它可以完成许多炫酷有趣的动画效果,网上也有非常不错的类库.下面将做详细介绍. 1.@keyframes:用于定义动画的具体动作(帧动作),一般要加上浏览器 ...
- TCP拥塞控制机制
研究TCP的拥塞机制,不仅仅是想了解TCP如何的精巧,更多的是领悟其设计思想,即在一般情况下,我们该怎样处理问题. 一.拥塞的发生与其不可避免 拥塞发生的主要原因:在于网络能够提供的资源不 ...