跟 Google 学 machineLearning [2] -- 关于 classifier.fit 的 warning

tensorfllow 的进化有点快。学习的很多例子已经很快的过时了，这里记录一些久的例子里被淘汰的方法，供后面参考。

我系统现在安装的是 tensorflow 1.4.1。

主要是使用了下面的代码后，出现 warning:

from tensorflow.contrib import learn

myclassifier = learn.DNNClassifier(hidden_units=[10, 20, 10], n_classes=3)

myclassifier.fit(x_train_array, y_train_array)

warning:

calling fit whith x is deprecated and will be removed after ...

解决方法，按照 warning 里的提示，搜了一下，发现，引入 SKCompat，并通过它来调用 classifier，即可使用原来的 fit 函数：

from tensorflow.contrib.learn.python import SKCompat

feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]

classifier = SKCompat( learn.DNNClassifier(feature_columns=feature_columns,

        hidden_units=[10, 20, 10],

        n_classes=3) )

但是，使用 SKCompat 并没有真正的让 classifier 变成原来那个，只是改变了数据输入方式而已。从 pydoc 看到 SKCompat 共重写了三个函数：

1. fit，可以像原来一样，使用两个 array list 来进行数据填充。

2. predict，并不是原来的 predict，而是新 tensorflow.contrib.learn.Estimator 中的 predict，同样是使用 array 来喂数据。它的返回值也不是一个 array，反正我还没看懂到底它是个啥。

3. score，事实上就是新的 ensorflow.contrib.learn.Evaluable 中的 evaluate，同上，使用 array 来喂数据。

所以，即使使用过 SKCompat 之后，也还是没法用原来 predict 取得 y_test_prediction, 然后与 y_test 做比较。但是，你可以调用 score 得到一个 dic，其中 ["accuracy"]就是准确度评分。

accuracy_score = classifier.score(x_test, y_test)["accuracy"]

使用 predict ，要用下面的方法打印出可以看懂的结果(最新的手册上说 predict 的返回值是个 intertor，要用下面的方式取结果；我实验的结果是，我这里的返回值是个 dict, key 为 'classes'的就是我们要的内容了，具体的见最后的代码，这是我今天实验的最终代码；所以，tensor 又进化了)：

y=classifier.predict(x_test)

predictions = list(p["predictions"] for p in itertools.islice(y, 6))

print("Predictions: {}".format(str(predictions)))

上面的 6 是 x_test 元素的个数。

===================================================

分割线

===================================================

新的 classifer 中，输入全部用的是 input_func 。这是上面报错的根本原因。

为什么要用 input_func 呢？官方给出的说法大概是，array 只适合小数据量时候使用。。。毕竟 array 的大小是有限的。这看起来完全没什么毛病。

官方给出的最新的方法(2017-12-25)是：

import numpy as np

training_set = tf.contrib.learn.datasets.base.load_csv_with_header(

    filename=IRIS_TRAINING, target_dtype=np.int, features_dtype=np.float32)

train_input_fn = tf.estimator.inputs.numpy_input_fn(

    x={"x": np.array(training_set.data)},

    y=np.array(training_set.target),

    num_epochs=None,

    shuffle=True)

classifier.train(input_fn=train_input_fn, steps=)

载入一个 datasets 之后，直接调用 estimator.inputs 中的 numpy.input_fn 来生成需要的 input_fn，后面给 classifier 喂数据，就喂这个 train_input_fn 就可以了。需要注意的是，这里传入的是函数 input_fn=train_input_fn，而不是函数的返回值 input_fn=train_input_fn()。闭包？

或者，你想使用一个可以传递参数的 input_func，官方给出了三种方法（茴香豆的茴字也有三种写法，mmp）：

A）写个 wrapper

def my_input_fn(data_set):

  ...

def my_input_fn_training_set():

  return my_input_fn(training_set)

classifier.train(input_fn=my_input_fn_training_set, steps=)

B）使用 functools.partial

classifier.train(

    input_fn=functools.partial(my_input_fn, data_set=training_set),

    steps=)

C) 使用 lamda

classifier.train(input_fn=lambda: my_input_fn(training_set), steps=2000)

反正，在我看来，是越来越麻烦了，但是，现在它毕竟是一个有用的工具，还是要用的。

============

from sklearn import metrics

from sklearn.model_selection import train_test_split

import tensorflow as tf

from tensorflow.contrib import learn

import numpy as np

from tensorflow.contrib.learn.python import SKCompat

import itertools

iris = learn.datasets.load_dataset('iris')

print iris.data

print iris.target

x_train, x_test, y_train, y_test = train_test_split(

        iris.data, iris.target, test_size=0.2, random_state=42)

feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]

classifier = SKCompat( learn.DNNClassifier(feature_columns=feature_columns,

        hidden_units=[10, 20, 10],

        n_classes=3) )

classifier.fit(x_train, y_train, steps=200)

accuracy_score = classifier.score(x_test, y_test)["accuracy"]

print('Accuracy:{0:f}'.format(accuracy_score))

predictions=classifier.predict(x_test)['classes']

print("Predictions: {}".format(str(predictions)))

跟 Google 学 machineLearning [2] -- 关于 classifier.fit 的 warning的更多相关文章

跟 Google 学 machineLearning [1] -- hello sklearn
时至今日,我才发现 machineLearning 的应用门槛已经被降到了这么低,简直唾手可得.我实在找不到任何理由不对它进入深入了解.如标题,感谢 Google 为这项技术发展作出的贡献.当然,可能 ...
Google机器学习课程基于TensorFlow ： https://developers.google.cn/machine-learning/crash-course
Google机器学习课程基于TensorFlow : https://developers.google.cn/machine-learning/crash-course https ...
学习笔记之Machine Learning Crash Course | Google Developers
Machine Learning Crash Course | Google Developers https://developers.google.com/machine-learning/c ...
Google机器学习笔记（七）TF.Learn 手写文字识别
转载请注明作者:梦里风林 Google Machine Learning Recipes 7 官方中文博客 - 视频地址 Github工程地址 https://github.com/ahangchen ...
机器学习入门 - Google的机器学习速成课程
1 - MLCC 通过机器学习,可以有效地解读数据的潜在含义,甚至可以改变思考问题的方式,使用统计信息而非逻辑推理来处理问题. Google的机器学习速成课程(MLCC,machine-learnin ...
【机器学习】Google机器学习工程的43条最佳实践
https://blog.csdn.net/ChenVast/article/details/81449509 本文档旨在帮助那些掌握机器学习基础知识的人从Google机器学习的最佳实践中获益.它提供 ...
使用Google Colab训练神经网络（二）
Colaboratory 是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果.它是一个 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行.Colaborat ...
【阿里聚安全·安全周刊】Google“手枪”替换 | 伊朗中央银行禁止加密货币
本周七个关键词:Google"手枪"替换丨IOS 漏洞影响工业交换机丨伊朗中央银行禁止加密货币丨黑客针对医疗保健丨付费DDoS攻击丨数据获利的8种方式丨MySQL 8.0 正式版 ...
google学习
https://developers.google.com/machine-learning/crash-course/ https://developers.google.com/machine-l ...

随机推荐

在 Spring 4.3.9下升级 Velocity 1.7.x to Velocity 2.0.x 出现的问题
1: Spring 的 spring-context-support 报错 java.lang.NoClassDefFoundError: org/apache/velocity/runtime/l ...
关于 java,nio,bufferedreader,bytebuffer
有没有一种方法来读取的ByteBuffer有一个BufferedReader,而无需将其转换为String优先?我想读通过一个相当大的 ByteBuffer作为文本行和我想避免它写入磁盘性能方面的原因 ...
[转]专访企业QQ SaaS团队，谈企业级LNMP架构设计
FROM : http://www.csdn.net/article/2014-08-20/2821302-interview-tencent-b-qq-shuai-wang 对比IaaS和PaaS, ...
检测ASP.NET是否是调试模式
在web.config里,可以设置debug为true或者false <system.web> <compilation debug="false" target ...
sqlserver 中WITH NOLOCK、HOLDLOCK、UPDLOCK、TABLOCK、TABLOCKX
https://www.cnblogs.com/sthinker/p/5922967.html SqlServer查询语句中用到的锁作者: wokofo 前段时间**公司DBA来我们这培训.讲了一大 ...
mybatis之foreach用法
在做mybatis的mapper.xml文件的时候,我们时常用到这样的情况:动态生成sql语句的查询条件,这个时候我们就可以用mybatis的foreach了 foreach元素的属性主要有item, ...
Focal Loss(RetinaNet) 与 OHEM
Focal Loss for Dense Object Detection-RetinaNet YOLO和SSD可以算one-stage算法里的佼佼者,加上R-CNN系列算法,这几种算法可以说是目标检 ...
Safari不兼容Javascript中的Date问题
在IOS5以上版本(不包含IOS5)中的Safari浏览器能正确解释出Javascript中的 new Date('2013-10-21') 的日期对象,但是在IOS5版本里面的Safari解释new ...
绝对定位常见误区：position:absolute相对于谁定位、及当溢出时怎么隐藏
1.绝对定位元素溢出父元素,怎么隐藏问题? 通常,为了让DIV子元素超出部分隐藏,都是在父元素设置overflow:hidden,这样即可防止子元素撑开父元素,使子元素能够溢出隐藏! 但是,对于pos ...
MFC增强----任务对话框CTaskDialog类
/** 注意:从Windows Vista系统才开始支持CTaskDialog类,所以在使用时最好调用 CTaskDialog::IsSupported() 方法做判断同时:CTaskDialog类 ...

跟 Google 学 machineLearning [2] -- 关于 classifier.fit 的 warning

跟 Google 学 machineLearning [2] -- 关于 classifier.fit 的 warning的更多相关文章

随机推荐

热门专题