【机器学习基石笔记】九、LinearRegression

【一】

线性回归直觉上的解释

得到Ein = mean(y - wx)^2

【二】

w的推导

Ein = 1/N || xw - y||^2

连续、可微、凸函数

在各个方向的偏微分都是0

Ein = 1/N (wTxTxw - 2wTxTy + yTy)

Ein := 1/N (wTaw - 2wTb + c)

向量求导，aw - b = 0

xTxw = xTy

w = (xTx)^-1(xTy)

xTx的维度为dxd, x是nxd, y是nx1

可定义为 w = x^{+} y

那么有yHat = xx^{+} y

hat matrix: xx^{+}, H

【三】

没有学习过程，close-form solution, No！

计算逆矩阵的过程就是在学习。只要Eout是好的，学习这件事情就已经发生了。

从另一个角度看Eout会很好：（第一角度：vc dimension）

之前vc的观点：某些点，现在的观点：平均

几何解释：

样本数量的维度，y是n维向量，x是d个n维向量，展开。

H算子的作用，作用在y上，得到在x展开空间中的向量

（I - H）算子的作用，得到与x垂直的向量

trace(I-H) = n-d+1

可以认为Ein就是y-yHat，就是noise在垂直方向的投影，就等于（I-H）noise

Ein = 1/N ||y - yHat|| = 1 - (d+1)/n * noiseLevel

同理，Eout = 1/N ||y-yHat|| = 1 + (d-1)/n * noiseLevel

Ein 和 Eout的差距，2(d+1)/n

【四】

linear classification和linear regression的差别

EReg > ECls

EClsOut < EClsIn + c < ERegIn + c

因此一个lr解也是一个比较好的lc的解

【机器学习基石笔记】九、LinearRegression的更多相关文章

机器学习基石笔记：01 The Learning Problem
原文地址:https://www.jianshu.com/p/bd7cb6c78e5e 什么时候适合用机器学习算法? 存在某种规则/模式,能够使性能提升,比如准确率: 这种规则难以程序化定义,人难以给 ...
机器学习基石笔记：04 Feasibility of Learning
原文地址:https://www.jianshu.com/p/f2f4d509060e 机器学习是设计算法\(A\),在假设集合\(H\)里,根据给定数据集\(D\),选出与实际模式\(f\)最为相近 ...
林轩田机器学习基石笔记4—Feasibility of Learning
上节课介绍了机器学习可以分为不同的类型.其中,监督式学习中的二元分类和回归分析是最常见的也是最重要的机器学习问题.本节课,我们将介绍机器学习的可行性,讨论问题是否可以使用机器学习来解决. 一.Lear ...
林轩田机器学习基石笔记3—Types of Learning
上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA.PLA能够在平面中选择一条直线将样本数据完全正确分类.而对于线性不可分的情况,可以使用Pocket Algorithm来处理.本节课将主要 ...
林轩田机器学习基石笔记2—Learning to Answer Yes/No
机器学习的整个过程:根据模型H,使用演算法A,在训练样本D上进行训练,得到最好的h,其对应的g就是我们最后需要的机器学习的模型函数,一般g接近于目标函数f.本节课将继续深入探讨机器学习问题,介绍感知机 ...
林轩田机器学习基石笔记1—The Learning Problem
机器学习分为四步: When Can Machine Learn? Why Can Machine Learn? How Can Machine Learn? How Can Machine Lear ...
机器学习基石笔记：Homework #1 PLA&PA相关习题
原文地址:http://www.jianshu.com/p/5b4a64874650 问题描述程序实现 # coding: utf-8 import numpy as np import matpl ...
机器学习基石笔记：03 Types of Learning
原文地址:https://www.jianshu.com/p/86b2a9cef742 一.学习的分类根据输出空间\(Y\):分类(二分类.多分类).回归.结构化(监督学习+输出空间有结构): 根据 ...
机器学习基石笔记：02 Learning to Answer Yes/No、PLA、PA
原文地址:https://www.jianshu.com/p/ed0aee74523f 一.Perceptron Learning Algorithm (一)算法原理 PLA本质是二元线性分类算法,即 ...

随机推荐

SQL JOIN使用方法
(转自W3School相关教程:http://www.w3school.com.cn,W3School是不错的在线教程,简洁高效!) 下面列出不同的SQL JOIN类型,以及他们之间的差异: JOIN ...
boost atomic
文档: http://www.boost.org/doc/libs/1_53_0/doc/html/atomic.html Presenting Boost.Atomic Boost.Atomic i ...
python全栈开发从入门到放弃之列表的内置方法
1.列表切片 l=['a','b','c','d','e','f'] print(l[1:5]) # 根据索引号来切片,但顾头不顾尾 ['b', 'c', 'd', 'e'] print(l[1:5: ...
虚拟环境virtualenv和virtualenvwrapper(转)
virtualenv是用来创建一个独立的Python虚拟环境的工具,通过virtualenv可以创建一个拥有独立的python版本和安装库的虚拟开发环境.这样一来我们就可以在虚拟环境中安装各种各种所需 ...
python中json怎么转换成字典
json的标准格式:要求必须只能使用双引号作为键或者值的边界符号,不能使用单引号,而且“键”必须使用边界符(双引号)
前端 and css小技巧
随意更改网页重新格式化代码,解决缩进问题 https://q1mi.github.io/PythonBlog/post/about_frontend/ css margin: 0 auto 居中文 ...
hadoop22---wait，notify
vv wait和notify,是要加syschronized的,是要获取锁的,wait是释放控制权,别的线程就可以执行了,notify和notifyall是通知其他线程执行.
web API help pages with Swagger / OpenAPI
https://docs.microsoft.com/en-us/aspnet/core/tutorials/web-api-help-pages-using-swagger?view=aspnetc ...
C# 打开电子邮件软件
使用客户端打开指定的URL 使用Process.Start方法可以在浏览器打开指定的URL.代码如下所示. [C#] //使用客户端打开“http://www.baidu.com” System.Di ...
matplotlib之散点图
环境:windows系统,anaconda3 64位,python 3.6 1.初认识基本代码如下: import numpy as np import matplotlib.pyplot as p ...

【机器学习基石笔记】九、LinearRegression

【机器学习基石笔记】九、LinearRegression的更多相关文章

随机推荐

热门专题