tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题

#使用dropout解决overfitting（过拟合）问题

#如果有dropout,在feed_dict的参数中一定要加入dropout的值

import tensorflow as tf

from sklearn.datasets import load_digits

from sklearn.cross_validation import train_test_split

from sklearn.preprocessing import LabelBinarizer

    #load datas 导入klearn中digits手写字体数据集

digits = load_digits()

X = digits.data         #加载从0-9的数字集

y = digits.target       #y为X所对应的标签

    #fit(y) 返回一个实例

    #fit_transform(y) 返回 和y一样的形状

y = LabelBinarizer().fit_transform(y)

    #train_test_split(train_data,train_target,test_size=0.4, random_state=0)

    # 是交叉验证中常用的函数，功能是从样本中随机的按比例选取train_data和test_data

    #参数解释：

    #train_data：所要划分的样本特征集

    #train_target：所要划分的样本结果

    #test_size：样本占比，如果是整数的话就是样本的数量

    #random_state：是随机数的种子。

    #随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。

    # 比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。

    #随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：

    #种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.3)

'''

#fit_transform()、inverse_transform使用的例子

#程序

from sklearn import preprocessing

feature = [[0,1], [1,1], [0,0], [1,0]]

label= ['yes', 'no', 'yes', 'no']

lb = preprocessing.LabelBinarizer() #构建一个转换对象

Y = lb.fit_transform(label)

re_label = lb.inverse_transform(Y)#还原之前的label

print(Y)

print(re_label)

#结果

[[1]

 [0]

 [1]

 [0]]

['yes' 'no' 'yes' 'no']

'''

# 定义一个神经层

def add_layer(inputs, in_size, out_size,layer_name, activation_function=None):

    #add one more layer and return the output of the layer

    Weights = tf.Variable(tf.random_normal([in_size, out_size]))

    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)

    Wx_plus_b = tf.matmul(inputs, Weights) + biases

    Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_pro)#使用dropout机制，解决overfitting问题

    if activation_function is None:

        outputs = Wx_plus_b

    else:

        outputs = activation_function(Wx_plus_b)

    tf.summary.histogram(layer_name+'/output',outputs)

    return outputs

#define placeholder for inputs to network

keep_pro = tf.placeholder(tf.float32)#dropout机制使用

xs = tf.placeholder(tf.float32, [None, 64])  # none表示无论给多少个例子都行，64=8*8

ys = tf.placeholder(tf.float32, [None, 10])  #表示10个需要识别的数字

#add output layer

l1 = add_layer(xs, 64, 50,'l1',activation_function=tf.nn.tanh)

prediction = add_layer(l1, 50, 10,'l2', activation_function=tf.nn.softmax)

#the error between prediction and real data

cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),reduction_indices=[1])) #loss function

tf.summary.scalar('loss',cross_entropy)

train_step = tf.train.GradientDescentOptimizer(0.6).minimize(cross_entropy)

sess = tf.Session()

merged = tf.summary.merge_all()

sess.run(tf.initialize_all_variables())#tf.initialize_all_variables()以被弃用

#sess.run(tf.global_variables_initializer())

#summary writer goes in here

train_writer = tf.summary.FileWriter("../../logs/train",sess.graph)

test_writer = tf.summary.FileWriter("../../logs/test",sess.graph)

for i in range(500):

    sess.run(train_step,feed_dict={xs: X_train, ys: y_train,keep_pro:0.6})#保持0.6的概率不被drop掉

    if i%50 == 0:

        # record loss

        train_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train,keep_pro:1})

        test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test,keep_pro:1})

        train_writer.add_summary(train_result, i)

        test_writer.add_summary(test_result, i)

tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题的更多相关文章

4 TensorFlow入门之dropout解决overfitting问题
------------------------------------ 写在开头:此文参照莫烦python教程(墙裂推荐!!!) ---------------------------------- ...
TensorFlow实战第七课（dropout解决overfitting）
Dropout 解决 overfitting overfitting也被称为过度学习,过度拟合.他是机器学习中常见的问题. 图中的黑色曲线是正常模型,绿色曲线就是overfitting模型.尽管绿色曲 ...
TensorFlow 学习（八）—— 梯度计算（gradient computation）
maxpooling 的 max 函数关于某变量的偏导也是分段的,关于它就是 1,不关于它就是 0: BP 是反向传播求关于参数的偏导,SGD 则是梯度更新,是优化算法: 1. 一个实例 relu = ...
深度学习（一）cross-entropy softmax overfitting regularization dropout
一.Cross-entropy 我们理想情况是让神经网络学习更快假设单模型: 只有一个输入,一个神经元,一个输出简单模型: 输入为1时, 输出为0 神经网络的学习行为和人脑差的很多, 开始学习 ...
tensorflow学习笔记——AlexNet
1,AlexNet网络的创新点 AlexNet将LeNet的思想发扬光大,把CNN的基本原理应用到了很深很宽的网络中.AlexNet主要使用到的新技术点如下: (1)成功使用ReLU作为CNN的激活函 ...
【转载】强化学习（八）价值函数的近似表示与Deep Q-Learning
原文地址: https://www.cnblogs.com/pinard/p/9714655.html ------------------------------------------------ ...
tensorflow学习笔记——使用TensorFlow操作MNIST数据（2）
tensorflow学习笔记——使用TensorFlow操作MNIST数据(1) 一:神经网络知识点整理 1.1,多层:使用多层权重,例如多层全连接方式以下定义了三个隐藏层的全连接方式的神经网络样例 ...
tensorflow学习笔记——图像识别与卷积神经网络
无论是之前学习的MNIST数据集还是Cifar数据集,相比真实环境下的图像识别问题,有两个最大的问题,一是现实生活中的图片分辨率要远高于32*32,而且图像的分辨率也不会是固定的.二是现实生活中的物体 ...
tensorflow学习笔记——自编码器及多层感知器
1,自编码器简介传统机器学习任务很大程度上依赖于好的特征工程,比如对数值型,日期时间型,种类型等特征的提取.特征工程往往是非常耗时耗力的,在图像,语音和视频中提取到有效的特征就更难了,工程师必须在这 ...

随机推荐

Delphi 10.2 新特性之—TFDBatchMoveJSONWriter
RAD Studio 10.2.2 提供从 TDataSet 映射到 JSON ,增加了对JavaScript 客户端支持. RAD Studio 10.2.2 为 FireDAC BatchMove ...
systemctl启动tomcat后，jps看不到进程
centos7 写了tomcat的启动脚本,脚本从网上copy的. [Unit]Description=tomcat-1After=syslog.target network.target remot ...
How to Build a New Habit: This is Your Strategy Guide
How to Build a New Habit: This is Your Strategy Guide by James ClearRead this on JamesClear.com Acco ...
gradle问题汇总
问题:从SVN下载到本地后,gradle无法同步,报错如下:Failed to resolve: support-core-utilsFailed to resolve: support-media- ...
【转】BFG Repo-Cleaner: Removes large or troublesome blobs like git-filter-branch does, but faster.
https://rtyley.github.io/bfg-repo-cleaner/ an alternative to git-filter-branch The BFG is a simpler, ...
转码器ffmpeg安装
网络上很多帖子但是基本上都是没有验证过复制粘贴的以下是我自己装时流程和网络上的差不多但是中间不通的地方已经改正 centos7 1. 安装autoconf cd /App/srcwget http ...
windows下consul利用json文件注册服务
windows下,以开发模式启动consul命令 consul agent -dev -config-dir=D:\tools\consul 人工注册服务,新建一个json文件 ,放到D:\tools ...
Java Script 简介
Java Script 简介 JavaScript 是世界上最流行的编程语言. 这门语言可用于 HTML 和 web,更可广泛用于服务器.PC.笔记本电脑.平板电脑和智能手机等设备.JavaScrip ...
eayUi panel实现上一页下一页
function 是为了第一次加载的时候显示页面 butt1和butt2触发上一页下一页,后面绑定参数即可问题:.panel({href:href})到后台的时候会请求两次,这个问题还没有解决把 ...
MySql数据库执行insert时候报错：Column count doesn't match value count at row 1
遇到这个问题之后,第一反应就是前后列数不等造成的,但是我检查SQL之后,发现列数是相同得,但是插入还是有问题,然后又写了简单得SQL只插入不为空得字段,执行还是报这个错,最后请教了高人,指点之后,大概 ...

tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题

tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题的更多相关文章

随机推荐

热门专题