Tensorflow-逻辑斯蒂回归

1.交叉熵

逻辑斯蒂回归这个模型采用的是交叉熵，通俗点理解交叉熵

推荐一篇文章讲的很清楚：

https://www.zhihu.com/question/41252833

因此，交叉熵越低，这个策略就越好，最低的交叉熵也就是使用了真实分布所计算出来的信息熵，因为此时，交叉熵 = 信息熵。这也是为什么在机器学习中的分类算法中，我们总是最小化交叉熵，因为交叉熵越低，就证明由算法所产生的策略最接近最优策略，也间接证明我们算法所算出的非真实分布越接近真实分布

2.代码解释

 import warnings

 warnings.filterwarnings('ignore')

 import numpy as np

 import tensorflow as tf

 # 样本集

 from tensorflow.examples.tutorials.mnist import input_data

 # 加载数据，目标值变成概率的形式，ont-hot

 mnist = input_data.read_data_sets('./',one_hot=True)

 # 训练数据 (55000, 784)

 mnist.train.images.shape

 # 测试数据 (10000, 784)

 mnist.test.images.shape

 # 目标值 ont-hot形式

 mnist.train.labels[:10]

 # 构建方程

 X = tf.placeholder(dtype=tf.float64,shape = (None,784),name = 'data')

 y = tf.placeholder(dtype=tf.float64,shape = (None,10),name = 'target')

 W = tf.Variable(initial_value=tf.zeros(shape =(784,10),dtype = tf.float64))

 b = tf.Variable(initial_value=tf.zeros(shape = (10),dtype = tf.float64))

 y_pred = tf.matmul(X,W) + b

 # 构建损失函数

 # y 和 y_pred对比

 # y表示是概率 [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.]

 # y_pred,矩阵运算求解的目标值

 # 要将y_pred转化成概率，softmax

 y_ = tf.nn.softmax(y_pred)

 # 此时y和y_表示概率

 # y和y_越接近，说明预测函数越准确

 # 此时分类问题，交叉熵，表示损失函数

 # 熵：表示的系统混乱程度

 # 损失函数，越小越好

 # 平均交叉熵------->可以比较大小的数

 loss = tf.reduce_mean(tf.reduce_sum(tf.multiply(y,tf.log(1/y_)),axis = -1))

 # 最优化

 opt = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

 # 训练

 # 训练次数

 epoches = 100

 # 保存

 saver = tf.train.Saver()

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     for i in range(epoches):

         c = 0

         for j in range(100):

 #      一次取550个，分100次取完数据 next_batch方法

             X_train,y_train = mnist.train.next_batch(550)

             opt_,cost = sess.run([opt,loss],feed_dict = {X:X_train,y:y_train})

             c += cost/100

 #         计算准确率

         X_test,y_test = mnist.test.next_batch(2000)

         y_predict = sess.run(y_,feed_dict={X:X_test})

         y_test = np.argmax(y_test,axis = -1)

         y_predict = np.argmax(y_predict,axis = 1)

         accuracy = (y_test == y_predict).mean()

         print('执行次数：%d。损失函数是：%0.4f。准确率是：%0.4f'%(i+1,c,accuracy))

         if accuracy > 0.91:

             saver.save(sess,'./model/estimator',global_step=i)

             print('---------------------------模型保存成功----------------------------')

保存了模型，在上一次的基础上继续进行学习，这样的话可以直接从上次的准确率开始

 # 其实代码是一样的，只是加了个saver.restore还原

 with tf.Session() as sess:

 #     还原到sess会话中

     saver.restore(sess,'./model/estimator-99')

     for i in range(100,200):

         c = 0

         for j in range(100):

             X_train,y_train = mnist.train.next_batch(550)

             opt_,cost = sess.run([opt,loss],feed_dict = {X:X_train,y:y_train})

             c += cost/100

 #         计算准确率

         X_test,y_test = mnist.test.next_batch(2000)

         y_predict = sess.run(y_,feed_dict={X:X_test})

         y_test = np.argmax(y_test,axis = -1)

         y_predict = np.argmax(y_predict,axis = 1)

         accuracy = (y_test == y_predict).mean()

         print('执行次数：%d。损失函数是：%0.4f。准确率是：%0.4f'%(i+1,c,accuracy))

         if accuracy > 0.91:

             saver.save(sess,'./model/estimator',global_step=i)

             print('---------------------------模型保存成功----------------------------')

Tensorflow-逻辑斯蒂回归的更多相关文章

[置顶] 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法——斯坦福ML公开课笔记3
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9113681 最近在看Ng的机器学习公开课,Ng的讲法循循善诱,感觉提高了不少 ...
【分类器】感知机+线性回归+逻辑斯蒂回归+softmax回归
一.感知机详细参考:https://blog.csdn.net/wodeai1235/article/details/54755735 1.模型和图像: 2.数学定义推导和优化: 3.流程 ...
【转】机器学习笔记之（3）——Logistic回归（逻辑斯蒂回归）
原文链接:https://blog.csdn.net/gwplovekimi/article/details/80288964 本博文为逻辑斯特回归的学习笔记.由于仅仅是学习笔记,水平有限,还望广大读 ...
机器学习之LinearRegression与Logistic Regression逻辑斯蒂回归(三)
一评价尺度 sklearn包含四种评价尺度 1 均方差(mean-squared-error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_v ...
spark机器学习从0到1逻辑斯蒂回归之(四）
逻辑斯蒂回归一.概念逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的,也可以是多分类的.logis ...
python机器学习实现逻辑斯蒂回归
逻辑斯蒂回归关注公众号"轻松学编程"了解更多. [关键词]Logistics函数,最大似然估计,梯度下降法 1.Logistics回归的原理利用Logistics回归进行分类的 ...
【项目实战】pytorch实现逻辑斯蒂回归
视频指导:https://www.bilibili.com/video/BV1Y7411d7Ys?p=6 一些数据集在pytorch框架下,里面面有配套的数据集,pytorch里面有一个torchv ...
【TensorFlow入门完全指南】模型篇·逻辑斯蒂回归模型
import库,加载mnist数据集. 设置学习率,迭代次数,batch并行计算数量,以及log显示. 这里设置了占位符,输入是batch * 784的矩阵,由于是并行计算,所以None实际上代表并行 ...
逻辑斯蒂回归（Logistic Regression）
逻辑回归名字比较古怪,看上去是回归,却是一个简单的二分类模型. 逻辑回归的模型是如下形式: 其中x是features,θ是feature的权重,σ是sigmoid函数.将θ0视为θ0*x0(x0取值为 ...
逻辑斯蒂回归VS决策树VS随机森林
LR 与SVM 不同 1.logistic regression适合需要得到一个分类概率的场景,SVM则没有分类概率 2.LR其实同样可以使用kernel,但是LR没有support vector在计 ...

随机推荐

poj 3735 稀疏矩阵矩阵快速幂
设人数为 $n$,构造 $(n + 1) \times (n + 1)$ 的矩阵得花生:将改行的最后一列元素 $+ 1$ \begin{gather}\begin{bmatrix}1 & 0 ...
【概率论】5-7:Gama分布(The Gamma Distributions Part I)
title: [概率论]5-7:Gama分布(The Gamma Distributions Part I) categories: - Mathematic - Probability keywor ...
从海量文本中统计出前k个频率最高的词语
现有如下题目:有一个海量文本,存储的是汉语词语,要求从中找出前K个出现频率最高的词语,写出最优算法,兼顾时间和空间复杂度. 思路分析:熟悉搜索引擎的程序员,应该不是难题.用传统的HashMap是无法解 ...
启动tomcat闪退
启动tomcat,点击startup.bat闪退使用的Tomcat是免安装版本的. 因为在启动tomcat是需要读取环境变量和配置信息,缺少了这些信息,就不能登记环境变量,导致了tomcat的闪退. ...
JVM synchronized关键字所生成的字节码
一.创建测试类 package com.example.jvm.bytecode; public class MyTest2 { String str = "Welcome"; p ...
编程基础-c语言中指针、sizeof用法总结
1.指针学习 C 语言的指针既简单又有趣.通过指针,可以简化一些 C 编程任务的执行,还有一些任务,如动态内存分配,没有指针是无法执行的.所以,想要成为一名优秀的 C 程序员,学习指针是很有必要的. ...
使用HttpClient访问WebHook
代码: import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.c ...
https://blog.csdn.net/qq_35636311/article/details/78255568 cPython 扩展
https://blog.csdn.net/qq_35636311/article/details/78255568 http://book.pythontips.com/en/latest/pyth ...
VS2019，打开项目之后显示：System.NullReferenceException: 未将对象引用设置到对象的实例
关闭项目,删除项目文件夹下的隐藏文件夹.vs和bin/obj文件夹
SQLServer stuff函数
STUFF ( character_expression , start , length ,character_expression ) 参数 character_expression 一个字符数据 ...

Tensorflow-逻辑斯蒂回归

Tensorflow-逻辑斯蒂回归的更多相关文章

随机推荐

热门专题