sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做

Having said that, you can query sklearn.preprocessing.StandardScaler for the fit parameters:

scale_ : ndarray, shape (n_features,) Per feature relative scaling of the data. New in version 0.17: scale_ is recommended instead of deprecated std_. mean_ : array of floats with shape [n_features] The mean value for each feature in the training set.

The following short snippet illustrates this:

from sklearn import preprocessing

import numpy as np

s = preprocessing.StandardScaler()

s.fit(np.array([[1., 2, 3, 4]]).T)

>>> s.mean_, s.scale_

(array([ 2.5]), array([ 1.11803399]))

参考：https://stackoverflow.com/questions/35944783/how-to-store-scaling-parameters-for-later-use

解法：

>>> from sklearn import preprocessing

>>> import numpy as np

>>>

>>> s = preprocessing.StandardScaler()

>>> s.fit(np.array([[1., 2, 3, 4]]).T)

StandardScaler(copy=True, with_mean=True, with_std=True)

>>> s.mean_, s.scale_

(array([2.5]), array([1.11803399]))

>>> s.transform(np.array([[1., 2, 3, 4]]).T)

array([[-1.34164079],

       [-0.4472136 ],

       [ 0.4472136 ],

       [ 1.34164079]])

>>> (1-s.mean_)/s.scale_

array([-1.34164079])

>>> a=np.array([1,2,3])

>>> b=np.array([1,2,3])

>>> a==b

array([ True,  True,  True])

(np.array([1., 2, 3, 4])-s.mean_)/s.scale_
array([-1.34164079, -0.4472136 , 0.4472136 , 1.34164079]) 和transform效果一样。

可以看到，离线使用StandardScaler时，只需要s.mean_, s.scale_这两个关键参数即可！

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做的更多相关文章

sklearn.preprocessing.StandardScaler数据标准化
原文链接:https://blog.csdn.net/weixin_39175124/article/details/79463993 数据在前处理的时候,经常会涉及到数据标准化.将现有的数据通过某种 ...
Python数据预处理(sklearn.preprocessing)—归一化(MinMaxScaler)，标准化(StandardScaler)，正则化(Normalizer, normalize)
关于数据预处理的几个概念归一化 (Normalization): 属性缩放到一个指定的最大和最小值(通常是1-0)之间,这可以通过preprocessing.MinMaxScaler类实现. 常 ...
数据规范化——sklearn.preprocessing
sklearn实现---归类为5大类 sklearn.preprocessing.scale()(最常用,易受异常值影响) sklearn.preprocessing.StandardScaler() ...
sklearn preprocessing （预处理）
预处理的几种方法:标准化.数据最大最小缩放处理.正则化.特征二值化和数据缺失值处理. 知识回顾: p-范数:先算绝对值的p次方,再求和,再开p次方. 数据标准化:尽量将数据转化为均值为0,方差为1的数 ...
【sklearn】数据预处理 sklearn.preprocessing
数据预处理标准化 (Standardization) 规范化(Normalization) 二值化分类特征编码推定缺失数据生成多项式特征定制转换器 1. 标准化Standardization ...
sklearn学习笔记（一）——数据预处理 sklearn.preprocessing
https://blog.csdn.net/zhangyang10d/article/details/53418227 数据预处理 sklearn.preprocessing 标准化 (Standar ...
The sklearn preprocessing
Recently, I was writing module of feature engineering, i found two excellently packages -- tsfresh a ...
sklearn.preprocessing.LabelBinarizer
sklearn.preprocessing.LabelBinarizer
sklearn.preprocessing.LabelEncoder的使用
在训练模型之前,我们通常都要对训练数据进行一定的处理.将类别编号就是一种常用的处理方法,比如把类别"男","女"编号为0和1.可以使用sklearn.prepr ...

随机推荐

斯坦福大学Andrew Ng - 机器学习笔记（5） -- 支持向量机（SVM）
大概用了一个月,Andrew Ng老师的机器学习视频断断续续看完了,以下是个人学习笔记,入门级别,权当总结.笔记难免有遗漏和误解,欢迎讨论. 鸣谢:中国海洋大学黄海广博士提供课程视频和个人笔记,在此深 ...
matlab学习笔记之基础知识（一）
一.两种特殊数据类型 1.元胞数组元胞数组是MATLAB的一种特殊数据类型,可以将元胞数组看做一种无所不包的通用矩阵,或者叫做广义矩阵.组成元胞数组的元素可以是任何一种数据类型的常数或者常量,每 ...
002-maven修改仓库以及镜像地址
1.将下载好的maven,修改配置 <localRepository>G:\mavenrepository-idea</localRepository> 2.修改增加镜像地址 ...
R语言中abline和lines的区别
函数lines()其作用是在已有图上加线,命令为lines(x,y),其功能相当于plot(x,y,type="1")函数abline()可以在图上加直线,其使用方法有四种格式.( ...
"深入理解C语言" 指针
本文对coolshell中的"深入理解C语言"这篇文章中提到的指针问题, 进行简要的分析. #include <stdio.h> int main(void){ ]; ...
python并发编程之多线程2---（死锁与递归锁，信号量等）
一.死锁现象与递归锁进程也是有死锁的所谓死锁: 是指两个或两个以上的进程或线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用, 它们都将无法推进下去.此时称系统处于死锁状态或系统 ...
Python Streaming实战2: Join的实现与数据过滤
Hadoop Join 与 Not In的实现 (一)源数据与要实现的查询 1. 要实现的查询 select a.sid ,a.name ,b.course ,b.score from Studen ...
uCOS-II的学习笔记（共九期）和例子（共六个）
源:uCOS-II的学习笔记(共九期)和例子(共六个) 第一篇 :学习UCOS前的准备工作http://blog.sina.com.cn/s/blog_98ee3a930100w0eu.html 第二 ...
MACHINE_START-内核板级初始化实现机制（linux3.1.0）
转:https://blog.csdn.net/charliewangg12/article/details/41518549 在驱动开发时,我们都是以一块开发板为基础移植驱动程序.每一块开发板对应一 ...
PHP面试题汇总一
1.表单中 get与post提交方法的区别? 答:get是发送请求HTTP协议通过url参数传递进行接收,而post是实体数据,可以通过表单提交大量信息. 2.session与cookie的区别? 答 ...

sklearn.preprocessing.StandardScaler 离线使用 不使用pickle如何做

sklearn.preprocessing.StandardScaler 离线使用 不使用pickle如何做的更多相关文章

随机推荐

热门专题

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做

sklearn.preprocessing.StandardScaler 离线使用不使用pickle如何做的更多相关文章