线性回归 Linear regression(4) 局部加权回归

这篇文章将介绍过拟合和欠拟合的概念，并且介绍局部加权回归算法。

过拟合和欠拟合

之前在线性回归中，我们总是将单独的x作为我们的特征，但其实我们可以考虑将 $x^2$ ，甚至x的更高次作为我们的特征，那么我们通过线性回归得到的就将是一个多次函数了。

我们可以想象当我们只用x作为我们的特征的时候，我们的数据可能实际呈现的样子是一个二次函数的样子，也就是说我们的假设有一定的问题，那么我们求得的最小二乘值将相当的大了。但是如果我们有10组样本，我们选择一个10次方的特征，那么可以想象，最后我们得到的曲线将是一个能经过所有的10组样本的曲线，也就是说最小二乘的值直接等于0了。

可以看出左边的图和右边的图都有一定问题，而其实中间建立的二次模型假设才是我们想要的。

所以，对于一个监督学习模型来说，过小的特征集合使得模型过于简单，过大的特征集合使得模型过于复杂。

对于特征集过小的情况，称之为欠拟合（underfitting）；

对于特征集过大的情况，称之为过拟合（overfitting）

解决此类学习问题的方法：

1) 特征选择算法：一类自动化算法，在这类回归问题中选择用到的特征

2) 非参数学习算法：缓解对于选取特征的需求，引出局部加权回归

局部加权回归

局部加权回归就是一种非参数学习算法，非参数学习算法的定义是：一个参数数量会随m（训练集大小）增长的算法。通常定义为参数数量随m线性增长。换句话说，就是算法所需要的东西会随着训练集合线性增长，算法的维持是基于整个训练集合的，即使是在学习以后。

局部加权回归的意思就是：对于一个确定的询问点x，我们都要进行一次局部加权回归求得相应的Θ，算法流程是：

找到合适的Θ，最小化 $\sum_{i=1}^{m}\omega ^{(i)}(y^{(i)}-\theta^Tx^{(i)})^2$ ， $y=\theta ^ Tx$ 就是我们对于当前x这个询问求得的线性回归y。

其中 $\omega ^{(i)}$ 表示对于每一个样本的权值，可以有多种取值，

一种相对标准公平的选择是： $\omega ^{(i)} = exp(-\frac{(x^{(i)}-x)^2}{2\tau ^2})$

$\tau$ 被称作波长函数，它控制了权值随距离下降的速率。它越小，钟形越窄，ω衰减的很快；它越大，衰减的就越慢。

而ω可以简单的看出当样本距离询问点比较接近时，权值就是越大，相反越远就会越小。

这个算法的优缺点也很容易被看出来：

优点就是，局部加权回归缓解了特征选择的需要，很大程度上缓解了欠拟合的问题。

缺点就是，每一次有个新的询问，我们都有重新遍历样本，重新收敛参数θ，这样对于效率来说会非常的慢。

线性回归 Linear regression(4) 局部加权回归的更多相关文章

Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现
鲁棒局部加权回归 [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 算法参考文献: (1) Robust L ...
机器学习方法：回归（一）：线性回归Linear regression
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 开一个机器学习方法科普系列:做基础回顾之用,学而时习之:也拿出来与大家分享.数学水平有限,只求易懂,学习与工 ...
斯坦福CS229机器学习课程笔记 Part1：线性回归 Linear Regression
机器学习三要素机器学习的三要素为:模型.策略.算法. 模型:就是所要学习的条件概率分布或决策函数.线性回归模型策略:按照什么样的准则学习或选择最优的模型.最小化均方误差,即所谓的 least-sq ...
Ng第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 2.4 梯度下降 2.5 梯度下 ...
斯坦福第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 I 2.4 代价函数的直观理解 I ...
机器学习 (一) 单变量线性回归 Linear Regression with One Variable
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔 ...
Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
(一)局部加权回归通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...
第三集欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来.如图所示,更适合这组数据的应该是而不是一条直线. 过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质 ...
机器学习（三）--------多变量线性回归(Linear Regression with Multiple Variables)
机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 同样是预测房价问题如果有多个特征值那么这种情况下假设h表示 ...

随机推荐

TSP - 状态压缩dp
2017-08-11 21:10:21 艾教写的 #include<iostream> #include<cstdio> #include<cstring> #in ...
Vjudge - E - 这是高中数学向量题
2017-07-15 22:29:06 writer:pprp 评价,用到了叉乘,很麻烦,C++构造知识必须扎实题目如下: 我们用逆时针方向的顶点序列来表示,我们很想了解这块地的基本情况,现在请你编 ...
Extjs的form跨域提交文件时，无法获取返回结果
form文件表单跨域提交时,无法获取远程服务器的返回结果,form提交代码如下: form.submit({ url:'http://{remoteUrl}/hgisserver/wrds/file' ...
codeforces776D The Door Problem
本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000 作者博客:http://www.cnblogs.com/ljh2000-jump/ ...
1.JSON 转换对象失败问题 2.spring注入失效
今天做项目中将一个json 字符串转换为对象,但结果怎么都转换不了!——————最后发现问题,原来是因为这个类我给他添加了带参数的构造器!导致转换失败! 在添加一个无参的构造器就好了! 第二个:今天调 ...
web项目整合Shiro框架
1.修改pom.xml文件 <dependency> <groupId>org.apache.shiro</groupId> <artifactId>s ...
vs 2017 保存文件 utf8
vs 2017 保存文件 utf8 转自:https://blog.csdn.net/jiegemena/article/details/79369650
如何在Ubuntu Linux上安装Oracle Java
不错文档,希望地址永久可用,url:http://zh.wikihow.com/%E5%9C%A8Ubuntu-Linux%E4%B8%8A%E5%AE%89%E8%A3%85Oracle-Java
SpringIOC源码分析总结
大致的加载过程: spring ioc容器的加载,大体上经过以下几个过程: 资源文件定位.解析.注册.实例化 1.资源文件定位:主要发生在ApplicationContext中,由于applicati ...
11.深入理解读写锁ReentrantReadWriteLock
protected final int tryAcquireShared(int unused) { /* * Walkthrough: * 1. If write lock held by anot ...

线性回归 Linear regression(4) 局部加权回归

线性回归 Linear regression(4) 局部加权回归的更多相关文章

随机推荐

热门专题