课程大纲

欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来。如图所示,更适合这组数据的应该是而不是一条直线。

过拟合的概念(非正式)算法拟合出的结果仅仅反映了所给的特定数据的特质。

非参数学习方法

线性回归是参数学习方法,有固定数目的参数以用来进行数据拟合的学习型算法算法称为参数学习方法。对于非参数学习方法来讲,其参数的数量随着训练样本的数目m线性增长;换句话来说,就是算法所需要的东西会随着训练集合线性增长。局部加权回归算法是非参数学习方法的一个典型代表。

局部加权回归算法(Loess算法)

与线性回归算法相比,其最大的特点是注重对临近点而不是所有训练样本的精确拟合,它同时忽略那些与要估计的输入距离很远的点的贡献。局部加权回归算法描述如下:

其中X是指输入到输出函数h(x)中进行预测的新数据。是波长函数,它控制了权值随距离下降的速率。很小时,下降很快;很大时,下降很慢。(个人感觉类似于方差)。

很小,说明两点很近,趋近于1,权值很大。若很大,说明两点很远,趋近于0,贡献可以忽略。这样就可以实现对临近点的精确拟合。

对线性回归模型的概率解释

假设:

为误差项,这个误差项可以理解为其他没有考虑到模型中的特征或者随机噪声造成的影响。假设满足均值为0的高斯分布(这样的假设是很有道理的,因为绝大多数情况均服从高斯分布,且由中心极限定理也可以证明)。所以概率分布函数如下:

其中第二个式子中的分号代表以为参数。由于之间是相互独立的,在这里引出的似然函数:

这时我们的目标是使P最大化也就是最大化,我们要求出合适的来实现这一目标。为了方便计算,引入如下函数:

为了最大化这个函数,其实就是使这一项最小化,而这个式子正好等于之前提到过的。下面可以用梯度下降的方法解出解析解。这就是对线性模型的概率解释。

分类算法

在分类算法中y的取值只有0和1两种,是二元分类。则可设。对于可以令其为sigmod函数(也可叫做logistic函数),,其图像如下所示:

由于y只能取0和1,则概率密度函数可以表示成如下形式:

那么,与上面对线性回归的概率解释形式相似,我们可以推导出如下式子:

若想使这个函数最大化,我们可以采用上节课讲过的梯度下降方法,当然在这里是梯度上升,下式中的“+”与上节课的梯度下降的“—”正好相反,在这里我们是要求最大化,所以用“+”。

如上式所示,参数可以通过概率的方式求解出来。

感知器算法



感知器算法与logistic回归相似,但是g(z)函数变成了如下形式:

其余均与logistic回归相似,参数的解为:

版权声明:本文为博主原创文章,未经博主允许不得转载。

第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法的更多相关文章

  1. Stanford大学机器学习公开课(三):局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法

    (一)局部加权回归 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...

  2. 局部加权回归、欠拟合、过拟合(Locally Weighted Linear Regression、Underfitting、Overfitting)

    欠拟合.过拟合 如下图中三个拟合模型.第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大.如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些.图中第三个是一个包含5阶多 ...

  3. 局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3

    本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合 例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...

  4. 过拟合/欠拟合&logistic回归等总结(Ng第二课)

    昨天学习完了Ng的第二课,总结如下: 过拟合:欠拟合: 参数学习算法:非参数学习算法 局部加权回归 KD tree 最小二乘 中心极限定律 感知器算法 sigmod函数 梯度下降/梯度上升 二元分类 ...

  5. DL基础补全计划(三)---模型选择、欠拟合、过拟合

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  6. Pytorch_第八篇_深度学习 (DeepLearning) 基础 [4]---欠拟合、过拟合与正则化

    深度学习 (DeepLearning) 基础 [4]---欠拟合.过拟合与正则化 Introduce 在上一篇"深度学习 (DeepLearning) 基础 [3]---梯度下降法" ...

  7. 机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合

    分享一下 线性回归中 欠拟合 和 过拟合 是怎么回事~为了解决欠拟合的情 经常要提高线性的次数建立模型拟合曲线, 次数过高会导致过拟合,次数不够会欠拟合.再建立高次函数时候,要利用多项式特征生成器 生 ...

  8. Java 使用 Apache commons-math3 线性拟合、非线性拟合实例(带效果图)

    Java 使用 CommonsMath3 的线性和非线性拟合实例,带效果图 例子查看 GitHub Gitee 运行src/main/java/org/wfw/chart/Main.java 即可查看 ...

  9. 浅谈Logistic回归及过拟合

    判断学习速率是否合适?每步都下降即可.这篇先不整理吧... 这节学习的是逻辑回归(Logistic Regression),也算进入了比较正统的机器学习算法.啥叫正统呢?我概念里面机器学习算法一般是这 ...

随机推荐

  1. ExtJs之单选及多选框

    坚持 <!DOCTYPE html> <html> <head> <title>ExtJs</title> <meta http-eq ...

  2. hdu 4068 SanguoSHA

    搜索下就可以了…… 代码如下: #include<iostream> #include<cstring> #include<cstdio> #include< ...

  3. Linux之select系统调用_1

    SYNOPSIS /* According to POSIX.1-2001 */ #include <sys/select.h> /* According to earlier stand ...

  4. poj 3635(bfs+优先队列)

    题目链接:http://poj.org/problem?id=3635 思路:本题主要运用的还是贪心思想,由于要求st->ed的最小花费,那么每经过一个城市,能不加油就尽量不加油,用dp[i][ ...

  5. 数学+dp HDOJ 5317 RGCDQ

    题目传送门 /* 题意:给一个区间,问任意两个数的素数因子的GCD最大 数学+dp:预处理出f[i],发现f[i] <= 7,那么用dp[i][j] 记录前i个f[]个数为j的数有几个, dp[ ...

  6. lintcode:最小编辑距离

    最小编辑距离 给出两个单词word1和word2,计算出将word1 转换为word2的最少操作次数. 你总共三种操作方法: 插入一个字符 删除一个字符 替换一个字符 样例 给出 work1=&quo ...

  7. ARP欺骗与中间人攻击

    前言: 上一篇WPA/WAP2wifi 密码破解笔记说到如何探测附近开放的AP并且破解进入,那么进入别人据局域网我们能干些什么呢?换句话说如果别人进入了我们内部网络,会有什么影响?本文简要介绍了ARP ...

  8. 基于Mongodb的轻量级领域驱动框架(序)

    混园子也有些年头了,从各个大牛那儿学了很多东西.技术这东西和中国的料理一样,其中技巧和经验,代代相传(这不是舌尖上的中国广告).转身回头一望,几年来自己也积累了一些东西,五花八门涉猎到各种方向,今日开 ...

  9. Maven的安装

    我对maven的了解,仅仅局限在百度百科. 由于近期公司需求,我找到了个maven教程:http://wentao365.iteye.com/blog/903396 安装maven其实很简单,就是在A ...

  10. 解密ThreadLocal

    原文:http://qifuguang.me/2015/09/02/%5BJava%E5%B9%B6%E5%8F%91%E5%8C%85%E5%AD%A6%E4%B9%A0%E4%B8%83%5D%E ...