参考网页:http://sklearn.apachecn.org/cn/0.19.0/ 其中提供了中文版的文件说明,较为清晰. from sklearn.linear_model import LinearRegression as lr import matplotlib.pyplot as plt import numpy as np x = np.array([3.6,4.5,2.6,4.9,2.5,3.5]).reshape(-1,1) y = np.array([9.7,8.1,7.6
1.移除低方差的特征(Removing features with low variance) VarianceThreshold 是特征选择中的一项基本方法.它会移除所有方差不满足阈值的特征.默认设置下,它将移除所有方差为0的特征,即那些在所有样本中数值完全相同的特征. 这里的方差是特征值的方差,当特征值都是离散型变量的时候这种方法才能用,如果是连续型变量,就需要将连续变量离散化之后才能用,而且实际当中,一般不太会有95%以上都取某个值的特征存在,所以这种方法虽然简单但是不太好用. 如果先对某