as_matrix、保存训练模型

#-*- coding: utf-8 -*-

#构建并测试CART决策树模型

import pandas as pd #导入数据分析库

from random import shuffle #导入随机函数shuffle，用来打乱数据

import matplotlib.pyplot as plt #导入Matplotlib

datafile = '../data/model.xls' #数据名

data = pd.read_excel(datafile) #读取数据，数据的前三列是特征，第四列是标签

#print(data)

#      电量趋势下降指标  线损指标  告警类指标  是否窃漏电

# 0           4     1      1      1

# 1           4     0      4      1

# 2           2     1      1      1

# 3           9     0      0      0

data = data.as_matrix() #将表格转换为矩阵

#print(data)

# [[4 1 1 1]

#  [4 0 4 1]

#  [2 1 1 1]

shuffle(data) #随机打乱数据

p = 0.8 #设置训练数据比例

train = data[:int(len(data)*p),:] #前80%为训练集

test = data[int(len(data)*p):,:] #后20%为测试集

#构建CART决策树模型

from sklearn.tree import DecisionTreeClassifier #导入决策树模型

treefile = '../tmp/tree.pkl' #模型输出名字

tree = DecisionTreeClassifier() #建立决策树模型

tree.fit(train[:,:3], train[:,3]) #训练

#保存模型

from sklearn.externals import joblib

joblib.dump(tree, treefile)

# from cm_plot import * #导入自行编写的混淆矩阵可视化函数

# cm_plot(train[:,3], tree.predict(train[:,:3])).show() #显示混淆矩阵可视化结果

#注意到Scikit-Learn使用predict方法直接给出预测结果。

from sklearn.metrics import roc_curve #导入ROC曲线函数

fpr, tpr, thresholds = roc_curve(test[:,3], tree.predict_proba(test[:,:3])[:,1], pos_label=1)

plt.plot(fpr, tpr, linewidth=2, label = 'ROC of CART', color = 'green') #作出ROC曲线

plt.xlabel('False Positive Rate') #坐标轴标签

plt.ylabel('True Positive Rate') #坐标轴标签

plt.ylim(0,1.05) #边界范围

plt.xlim(0,1.05) #边界范围

plt.legend(loc=4) #图例

plt.show() #显示作图结果

as_matrix、保存训练模型的更多相关文章

tensorflow 保存训练模型ckpt 查看ckpt文件中的变量名和对应值
TensorFlow 模型保存与恢复一个快速完整的教程,以保存和恢复Tensorflow模型. 在本教程中,我将会解释: TensorFlow模型是什么样的? 如何保存TensorFlow模型? 如 ...
Tensorflow 保存和载入训练过程
本节涉及点: 保存训练过程载入保存的训练过程并继续训练通过命令行参数控制是否强制重新开始训练训练过程中的手动保存保存训练过程前,程序征得同意一.保存训练过程以下方代码为例: import ...
JS做深度学习2——导入训练模型
JS做深度学习2--导入训练模型改进项目前段时间,我做了个RNN预测金融数据的毕业设计(华尔街),当时TensorFlow.js还没有发布,我不得已使用了keras对数据进行了训练,并且拟合好了不 ...
Keras 学习之旅（一）
软件环境(Windows): Visual Studio Anaconda CUDA MinGW-w64 conda install -c anaconda mingw libpython CNTK ...
用TensorFlow教你手写字识别
博主原文链接:用TensorFlow教你做手写字识别(准确率94.09%) 如需转载,请备注出处及链接,谢谢. 2012 年,Alex Krizhevsky, Geoff Hinton, and Il ...
代码详解：TensorFlow Core带你探索深度神经网络“黑匣子”
来源商业新知网,原标题:代码详解:TensorFlow Core带你探索深度神经网络“黑匣子” 想学TensorFlow?先从低阶API开始吧~某种程度而言,它能够帮助我们更好地理解Tensorflo ...
初识spark的MLP模型
初识Spark的MLP模型 1. MLP介绍 Multi-layer Perceptron(MLP),即多层感知器,是一个前馈式的.具有监督的人工神经网络结构.通过多层感知器可包含多个隐藏层,实现对非 ...
用Keras搞一个阅读理解机器人
catalogue . 训练集 . 数据预处理 . 神经网络模型设计(对话集 <-> 问题集) . 神经网络模型设计(问题集 <-> 回答集) . RNN神经网络 . 训练 . ...
TensorFlow下利用MNIST训练模型识别手写数字
本文将参考TensorFlow中文社区官方文档使用mnist数据集训练一个多层卷积神经网络(LeNet5网络),并利用所训练的模型识别自己手写数字. 训练MNIST数据集,并保存训练模型 # Pyth ...

随机推荐

python3 练习题 day01
#练习题:'''1.简述变量命名规范'''#变量名由数字.字母.下划线组成#变量名可以字母和下划线开头,不能以数字开头,并且不能全为数字#变量名不能太长,且要有意义#最好使用驼峰或下划线格式命令#变量 ...
AI 正则化
正则化,是减少泛化误差的技术.
Objective-C 事件响应链
苹果app使用响应者对象(responder object)来接收和处理事件.响应者对象是NSResponder及其子类的实例,如NSView.NSViewController和NSApplicati ...
【Codeforces 1137A】Skyscrapers
Codeforces 1137 A 题意:给一个矩阵,问对于每一个格子\((x,y)\),把第\(x\)行和第\(y\)列的值取出,要求将它们每一个赋上一个正整数,要求同一行.列中大小关系依然相同,问 ...
<转>大型分布式网站术语浅析
夜半睡起看书,看到一篇关于分布式网站性能优化术语的文章,个人觉得不错,分享出来... 原文地址:大型分布式网站术语分析一.I/O优化 1.增加缓存,减少磁盘的访问次数. 2.优化磁盘的管理系统,设计 ...
jdk和cglib简单理解
之前使用cglib的时候不需要将classLoader作为参数传入,但动态代理却要,带着这个疑惑进入这个方法: Proxy.newProxyInstance(classLoader, interfac ...
nginx-haproxy-lvs功能和性能对比 nginx - max-fail + 调度算法
优点(性能和功能两方面分析) 缺点 lvs 工作在4层,可以对http,MySQL等服务负载均衡.负责流量的分发,对io,cpu,mem的消耗少功能比较少,没有正则匹配的功能 nginx 工作在7层 ...
java算法----排序----（3）冒泡排序
package log; public class Test4 { /** * java算法---冒泡排序 * * @param args */ public static void main(Str ...
SSM项目layui分页实例
最近学了layui,发现其中的分页挺有意思的,所以整理了一下,一遍自己随时查看.(官方文档上已经很详细了,当中有不足的地方欢迎大家指出) 关于前台的js文件,css样式,js样式,大家可以到官网下本 ...
React-使用styled-components
1.安装 npm install --save styled-components 2.简单使用 style.js: import styled from 'styled-components'; i ...

as_matrix、保存训练模型

as_matrix、保存训练模型的更多相关文章

随机推荐

热门专题