Sklearn库例子3：分类——岭回归分类（Ridge Regression ）例子

为了解决数据的特征比样本点还多的情况，统计学家引入了岭回归。

岭回归通过施加一个惩罚系数的大小解决了一些普通最小二乘的问题。回归系数最大限度地减少了一个惩罚的误差平方和。

这里是一个复杂的参数，用来控制收缩量，其值越大，就有更大的收缩量，从而成为更强大的线性系数。

Ridge和Line_Model一样，用fit(x,y)来训练模型，回归系数保存在coef_成员中

例子：

在这个例子使用岭回归作为估计器。结果中的每个颜色表示的系数向量的一个不同的功能，这是显示作为正则化参数的函数。在路径的最后，作为α趋于零和解决方案往往对普通最小二乘，系数表现出大的振荡。

代码如下：

#-*- encoding:utf-8 -*-

"""

岭回归example1

@Dylan

"""

import numpy as np

import matplotlib.pyplot as plt

from sklearn import linear_model

#x是10*10 的Hilbert 矩阵

x=1./(np.arange(1,11)+np.arange(0,10)[:,np.newaxis])

# print(x)

y=np.ones(10)

#####compute path

n_alphas=200

alphas=np.logspace(-10,-2,n_alphas)

# print(alphas)

clf=linear_model.Ridge(fit_intercept=False)

coefs=[]

for a in alphas:

    clf.set_params(alpha=a)

    clf.fit(x,y)

    coefs.append(clf.coef_)

###展示结果

ax=plt.gca()

ax.set_color_cycle(['b','r','g','c','k','y','m'])

ax.plot(alphas,coefs)

ax.set_xscale('log')

ax.set_xlim(ax.get_xlim()[::-1])

plt.xlabel('alpha')

plt.ylabel('weights')

plt.title('ridge coefficients as a function of reqularization')

plt.axis('tight')

plt.show()

其中 x为hilbert矩阵，生成方式值得借鉴。np.logspace()函数文档链接如下：here

结果如下：

Sklearn库例子3：分类——岭回归分类（Ridge Regression ）例子的更多相关文章

机器学习：模型泛化（岭回归：Ridge Regression）
一.基础理解模型正则化(Regularization) # 有多种操作方差,岭回归只是其中一种方式: 功能:通过限制超参数大小,解决过拟合或者模型含有的巨大的方差误差的问题: 影响拟合曲线的两个因子 ...
线性回归——lasso回归和岭回归（ridge regression）
目录线性回归--最小二乘 Lasso回归和岭回归为什么 lasso 更容易使部分权重变为 0 而 ridge 不行? References 线性回归很简单,用线性函数拟合数据,用 mean squ ...
scikit-learn中的岭回归（Ridge Regression）与Lasso回归
一.岭回归模型岭回归其实就是在普通最小二乘法回归(ordinary least squares regression)的基础上,加入了正则化参数λ. 二.如何调用 class sklearn.lin ...
python机器学习sklearn 岭回归（Ridge、RidgeCV）
1.介绍 Ridge 回归通过对系数的大小施加惩罚来解决普通最小二乘法的一些问题. 岭系数最小化的是带罚项的残差平方和, 其中,α≥0α≥0 是控制系数收缩量的复杂性参数: αα 的值越大,收缩量 ...
岭回归和lasso回归（转）
回归和分类是机器学习算法所要解决的两个主要问题.分类大家都知道,模型的输出值是离散值,对应着相应的类别,通常的简单分类问题模型输出值是二值的,也就是二分类问题.但是回归就稍微复杂一些,回归模型的输出值 ...
在线场景感知：图像稀疏表示—ScSPM和LLC总结(以及lasso族、岭回归)
前言: 场景感知其实不分三维场景和二维场景,可以使用通用的方法,不同之处在于数据的形式,以及导致前期特征提取及后期在线场景分割过程.场景感知即是场景语义分析问题,即分析场景中物体的特征组合与相应场景的 ...
多元线性回归模型的特征压缩：岭回归和Lasso回归
多元线性回归模型中,如果所有特征一起上,容易造成过拟合使测试数据误差方差过大:因此减少不必要的特征,简化模型是减小方差的一个重要步骤.除了直接对特征筛选,来也可以进行特征压缩,减少某些不重要的特征系数 ...
sklearn学习笔记之岭回归
岭回归岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息.降低精度为代价获得回归系数更为符合实际.更可靠的回归方法,对病 ...
AI - TensorFlow - 分类与回归（Classification vs Regression）
分类与回归分类(Classification)与回归(Regression)的区别在于输出变量的类型.通俗理解,定量输出称为回归,或者说是连续变量预测:定性输出称为分类,或者说是离散变量预测. 回归 ...

随机推荐

Ubuntu 14.10 下安装Synergy，不同电脑之间公用一套键盘鼠标
因为工作时候有多台电脑放在一起,如果每个用一套键盘鼠标很是不方便,所以希望能够不用电脑之间公用一套键盘鼠标. Synergy可以实现不同电脑之间公用一套键盘鼠标,并且支持简单的复制粘贴.很好用. 它还 ...
windows-ubuntu环境变量的设置格式的不同
1 在Ubuntu下输出环境变量,比如JAVA_HOME, 使用cat或者echo $JAVA_HOME即可,但是在windows下不可以, windows不支持cat命令,只能使用echo %JA ...
Ubuntu安装软件提示”需要安装不能信任的软件包”解决办法
用 Ubuntu 安装输入法软件包时提示"需要安装不能信任的软件包","这个动作需要从没有授权的软件源来安装软件包",赋予权限执行仍然无法安装,上网查了一下,只 ...
BZOJ 1042 硬币购物
先不考虑限制,那么有dp[i]表示i元钱的方案数. 然后考虑限制,发现可以容斥. 其实整个题就是两个容斥原理.感觉出的蛮好的. #include<iostream> #include< ...
BZOJ 2296 随机种子
RT. #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> ...
安装webmin
wget http://nchc.dl.sourceforge.net/project/webadmin/webmin/1.740/webmin-1.740.tar.gz 解压缩文件,命令是:tar ...
java作业2
(一) 仔细阅读示例: EnumTest.java,运行它,分析运行结果? 你能得到什么结论?你掌握了枚举类型的基本用法了吗? 结论:枚举不属于原始数据类型,它的每个具体值都引用一个特定的对象.相同的 ...
GridView分页操作
1.html <PagerStyle HorizontalAlign="Center" /> <PagerTemplate> 第: <asp:Labe ...
Disable Portrait in app
I had this problem as well as I wanted to constrain my game to only landscape mode. I put this in my ...
C++学习笔记12：运算符重载（赋值操作符1）
为数偶类定义专用的赋值操作符 class Couple { public: Couple(, ) :_a(a), _b(b) {} Couple(const Couple &c):_a(c._ ...

Sklearn库例子3：分类——岭回归分类（Ridge Regression ）例子

Sklearn库例子3：分类——岭回归分类（Ridge Regression ）例子的更多相关文章

随机推荐

热门专题