训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。

比如，我们根据房源样本数据训练了一下房价模型，当用户输入自己的房子后，我们就需要根据训练好的房价模型来预测用户房子的价格。

这样就需要在训练模型后把模型保存起来，在使用模型时把模型读取出来对输入的数据进行预测。

这里保存和读取模型有两种方法，都非常简单，差别在于保存和读取速度的快慢上，因为有一个是利用了多进程机制，下面我们分别来看一下。

创建模型

首先我们创建模型并训练数据：

from sklearn.datasets import load_digits

from sklearn.svm import SVC

# 加载数据

digits = load_digits()

X = digits.data

y = digits.target

model = SVC()

model.fit(X, y)

用pickle读写模型

pickle是python中用于数据序列化的模块，因此，对于模型的序列化也可以用此模块来进行：

import pickle

# 以写二进制的方式打开文件

file = open("D:/data/python/model.pickle", "wb")

# 把模型写入到文件中

pickle.dump(model, file)

# 关闭文件

file.close()

这样会创建D:/data/python/model.pickle的文件，大家可以自己去尝试下看看，我这边生成的文件大概1M左右。

有了模型文件之后，在进行预测时我们就不需要进行训练了，而只要把这个训练好的模型文件读取出来，然后直接进行预测就可以：

import pickle

# 以读二进制的方式打开文件

file = open("D:/data/python/model.pickle", "rb")

# 把模型从文件中读取出来

model = pickle.load(file)

# 关闭文件

file.close()

# 用模型进行预测

from sklearn.datasets import load_digits

digits = load_digits()

X = digits.data

y = digits.target

print("预测值：", model.predict(X[15:20]))

print("实际值：", y[15:20])

输出为：

预测值： [5 6 7 8 9]

实际值： [5 6 7 8 9]

用joblib进行模型的读写

直接上代码：

from sklearn.datasets import load_digits

from sklearn.svm import SVC

# 用模型进行训练

digits = load_digits()

X = digits.data

y = digits.target

model = SVC()

model.fit(X, y)

# 用joblib保存模型

from sklearn.externals import joblib

joblib.dump(model, "D:/data/python/model.joblib")

这样就会生成D:/data/python/model.joblib文件，看起来比pickle生成的文件大一点点。

读取模型：

# 用joblib读取模型

from sklearn.externals import joblib

model = joblib.load("D:/data/python/model.joblib")

# 对数据进行预测

from sklearn.datasets import load_digits

digits = load_digits()

X = digits.data

y = digits.target

print("预测值：", model.predict(X[15:20]))

print("实际值：", y[15:20])

输出为：

预测值： [5 6 7 8 9]

实际值： [5 6 7 8 9]

看起来也很简单，同pickle的区别是joblib会以多进程方式来进行，据说性能会好些。

转sklearn保存模型的更多相关文章

sklearn保存模型-【老鱼学sklearn】
训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步. 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要 ...
sklearn保存模型的两种方式
sklearn 中模型保存的两种方法一. sklearn中提供了高效的模型持久化模块joblib,将模型保存至硬盘. from sklearn.externals import joblib # ...
sklearn保存模型
# View more python tutorials on my Youtube and Youku channel!!! # Youtube video tutorial: https://ww ...
【sklearn】from sklearn.extermals import joblib（保存模型和加载模型）
原创博文,转载请注明出处! sklearn中保存和加载模型的方法 1.载入模块 from sklearn.externals joblib. model = joblib. # -*- coding: ...
Python 3 利用 Dlib 19.7 和 sklearn机器学习模型实现人脸微笑检测
0.引言利用机器学习的方法训练微笑检测模型,给一张人脸照片,判断是否微笑: 使用的数据集中69张没笑脸,65张有笑脸,训练结果识别精度在95%附近: 效果: 图1 示例效果工程利用pytho ...
caffe使用ctrl-c不能保存模型
caffe使用Ctrl-c 不能保存模型: 是因为使用的是 tee输出日志解决方法:kill -s SIGINT <proc_id> 或者使用 GLOG_log_dir=/path/to ...
pytorch加载和保存模型
在模型完成训练后,我们需要将训练好的模型保存为一个文件供测试使用,或者因为一些原因我们需要继续之前的状态训练之前保存的模型,那么如何在PyTorch中保存和恢复模型呢? 方法一(推荐): 第一种方法也 ...
PyTorch保存模型与加载模型+Finetune预训练模型使用
Pytorch 保存模型与加载模型 PyTorch之保存加载模型参数初始化参数的初始化其实就是对参数赋值.而我们需要学习的参数其实都是Variable,它其实是对Tensor的封装,同时提供了da ...
（原）tensorflow保存模型及载入保存的模型
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/7198773.html 参考网址: http://stackoverflow.com/questions ...

随机推荐

srv.exe蠕虫病毒~
你是否在电脑使用过程中遇到过这样的问题: 1.文件运行后,同目录下会出现一个原名 srv.exe的文件 2.文件运行后会把浏览器打开 3.电脑上的html文件末尾会增加一大堆东西完了,电脑中了srv ...
mysql中使用show variables同时查询多个参数值?show variables的使用?
需求描述: 今天在查mysq关于连接数的问题,想要通过一个show variables命令同时查出来多个值.在此记录下. 操作过程: 1.通过show variables语句的like可以匹配多个值或 ...
【11-13】A股主要指数的市盈率(PE)估值高度
全指材料(SH000987) - 2018-11-13日,当前值:12.4646,平均值:30.54,中位数:26.09865,当前接近历史新低.全指材料(SH000987)的历史市盈率PE详情内 ...
python--文件I/O--11
原创博文,转载请标明出处--周学伟http://www.cnblogs.com/zxouxuewei/ 本章只讲述所有基本的的I/O函数,更多函数请参考Python标准文档. 一.打印到屏幕最简单的 ...
Get started with ros -- 1
原创博文:转载请标明出处(周学伟):http://www.cnblogs.com/zxouxuewei/tag/ 一.Introduction: 机器人操作系统(ROS)是使机器人系统的不同部分能够发 ...
PopupWindow错误:PopupWindow$1.onScrollChanged 出现 NullPointerException和PopupViewContainer.dispatchKeyEvent 出现 NullPointerException【转载】
PopupWindow错误:PopupWindow$1.onScrollChanged 出现 NullPointerException和PopupViewContainer.dispatchKeyEv ...
Linux+Redis实战教程_day02_消息订阅与发布_多数据库_redis批量操作-事务_redis持久化
5.扩展知识-消息订阅与发布(了解) 订阅新闻,新闻发布 subscribe channel:订阅频道,例:subscribe mychat,订阅mychat这个频道 psubscribe chann ...
logback -- 配置详解 -- 三 -- <encoder>
附: logback.xml实例 logback -- 配置详解 -- 一 -- <configuration>及子节点 logback -- 配置详解 -- 二 -- <appen ...
UTF8 & GBK之间的转换
使用lua的时候,在lua中给字符串赋值的中文,但是在C中读出来的就是乱码,是因为在lua中使用的是UTF8编码,而在C(windows下面)中使用的是GBK编码,将UTF8转成GBK就可以了,下面的 ...
存储过程中SELECT INTO的使用
在MySQL存储过程中使用SELECT …INTO语句为变量赋值: 用来将查询返回的一行的各个列值保存到局部变量中. 要求: 查询的结果集中只能有1行. SELECT col_name[,...] I ...

转sklearn保存模型

创建模型

用pickle读写模型

用joblib进行模型的读写

转sklearn保存模型的更多相关文章

随机推荐

热门专题