KNN与SVM对比&SVM与逻辑回归的对比

首先说一下两种学习方式： lazy learning 和 eager learning。

先说 eager learning, 这种学习方式是指在进行某种判断（例如，确定一个点的分类或者回归中确定某个点对应的函数值）之前，先利用训练数据进行训练得到一个目标函数，待需要时就只利用训练好的函数进行决策，这是一种一劳永逸的方法， SVM 就属于这种学习方式；

而 lazy learning 是指只有到了需要决策时才会利用已有数据进行决策，而在这之前不会经历eager learning 所拥有的训练过程， KNN 属于这种方式。

Eager learning 考虑到了所有训练样本，说明它是一个全局的近似，优点是虽然它需要耗费训练时间，可是它的决策时间基本为 0。

Lazy learning 在决策时虽然需要计算所有样本与查询点的距离，但是在真正做决策时却只用了局部的几个训练数据，所以它是一个局部的近似，然而虽然不需要训练，它的复杂度还是需要 O(n),n 是训练样本的个数。

Lazy learning 的缺点： 1. 需要的存储空间比较大 2. 决策过程比较慢。

针对全局和局部的问题，我想了一个实际的例子。假设，现在我们要针对中国各地区的贫富问题进行划分，已经知道西部大部分地方比较贫穷，少部分地方富裕；而东部大部分地方富裕，少部分地方贫穷。首先，我们使用 SVM进行求解，按照 SVM 的思想，最后的结果一定是沿着中国地图无情的划一条线，而用KNN 时，东部城市中北京，上海等算是富裕的，而菏泽啊这样的就不太富裕；西部呢，像成都啊（不知道算不算西部，就假设算吧）算是富裕的，西宁啊这样的算是不太富裕的。

使用应用KNN算法时，我们无法对预测的误差有一个统计意义上的估计，结果的波动可能很大，这通常不是我们希望看到的。但是KNN的实现简单，使用灵活，也有自己的用武之地。

参考：http://www.52ml.net/10152.html

因此：

SVM需要训练过程，预测效率高。

KNN计算复杂度高，但是需要调的参比较小。

至于逻辑回归和SVM，一个统计的方法，一个几何的方法，逻辑回归对于每一个样本都有考虑，而SVM只考虑了支持向量。

同样的线性分类情况下，如果异常点较多的话，无法剔除，由于LR中每个样本都是有贡献的，因此分类效果会受到影响，可能存在过拟合。

LR模型找到的那个超平面，是尽量让所有点都远离他，而SVM寻找的那个超平面，是只让最靠近中间分割线的那些点尽量远离，即只用到那些支持向量的样本。

理由：因为训练样本数量特别大，使用复杂核函数的SVM会导致运算很慢，因此应该考虑通过引入更多特征，然后使用线性核函数的SVM或者lr来构建预测性更好的模型。

SVM有多种核可以选择，可以处理各种非线性问题（条件是选对核函数）。大多数情况准确率都比LR要高，但是模型较大，训练效率低。

KNN与SVM对比&SVM与逻辑回归的对比的更多相关文章

线性模型之逻辑回归(LR)(原理、公式推导、模型对比、常见面试点)
参考资料(要是对于本文的理解不够透彻,必须将以下博客认知阅读,方可全面了解LR): (1).https://zhuanlan.zhihu.com/p/74874291 (2).逻辑回归与交叉熵 (3) ...
通俗地说逻辑回归【Logistic regression】算法（二）sklearn逻辑回归实战
前情提要: 通俗地说逻辑回归[Logistic regression]算法(一) 逻辑回归模型原理介绍上一篇主要介绍了逻辑回归中,相对理论化的知识,这次主要是对上篇做一点点补充,以及介绍sklear ...
机器学习---逻辑回归（二）（Machine Learning Logistic Regression II）
在<机器学习---逻辑回归(一)(Machine Learning Logistic Regression I)>一文中,我们讨论了如何用逻辑回归解决二分类问题以及逻辑回归算法的本质.现在 ...
机器学习之感知器和线性回归、逻辑回归以及SVM的相互对比
线性回归是回归模型感知器.逻辑回归以及SVM是分类模型线性回归:f(x)=wx+b 感知器:f(x)=sign(wx+b)其中sign是个符号函数,若wx+b>=0取+1,若wx+b< ...
逻辑回归（LR）和支持向量机（SVM）的区别和联系
1. 前言在机器学习的分类问题领域中,有两个平分秋色的算法,就是逻辑回归和支持向量机,这两个算法个有千秋,在不同的问题中有不同的表现效果,下面我们就对它们的区别和联系做一个简单的总结. 2. LR和 ...
感知器、逻辑回归和SVM的求解
这篇文章将介绍感知器.逻辑回归的求解和SVM的部分求解,包含部分的证明.本文章涉及的一些基础知识,已经在<梯度下降.牛顿法和拉格朗日对偶性>中指出,而这里要解决的问题,来自<从感知器 ...
线性回归,逻辑回归,神经网络,SVM的总结
目录线性回归,逻辑回归,神经网络,SVM的总结线性回归,逻辑回归,神经网络,SVM的总结详细的学习笔记. markdown的公式编辑手册. 回归的含义: 回归就是指根据之前的数据预测一个准确的输 ...
kaggle信用卡欺诈看异常检测算法——无监督的方法包括：基于统计的技术，如BACON *离群检测多变量异常值检测基于聚类的技术；监督方法：神经网络 SVM 逻辑回归
使用google翻译自:https://software.seek.intel.com/dealing-with-outliers 数据分析中的一项具有挑战性但非常重要的任务是处理异常值.我们通常将异 ...
Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS
Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...

随机推荐

P2073 送花
P2073 送花题目背景小明准备给小红送一束花,以表达他对小红的爱意.他在花店看中了一些花,准备用它们包成花束. 题目描述这些花都很漂亮,每朵花有一个美丽值W,价格为C. 小明一开始有一个空的花 ...
js判断当前页面是顶级窗口
<script> if(top.location!=self.location){ alert("不是顶层窗口"); }else{ alert("是顶层窗口& ...
MySQL和Sql Server的sql语句区别
1.自增长列的插入:SQLServer中可以不为自动增长列插入值,MySQL中需要为自动增长列插入值. 2.获取当前时间函数:SQLServer写法:getdate()MySQL写法:now() 3. ...
li分两列显示
只要控制了li的宽度,利用浮动就能实现<style type="text/css"> .my ul { width: 210px; } .my li { width: ...
[转载]jdk环境变量配置方法
JDK下载在安装完jdk后,还需要对jdk的环境变量进行配置才能正常使用,下面教大家如何配置jdk环境变量: 1.右键选择计算机→属性→高级系统设置→高级→环境变量 2.系统变量→新建变量名:J ...
aps.net webform框架下页面服务器端控件和html控件用法
(1)select 下拉框前端: <select name="gameserverlist" id="gameserverlist" runat=&qu ...
springcloud使用Hystrix实现微服务的容错处理
使用Hystrix实现微服务的容错处理容错机制如果服务提供者相应非常缓慢,那么消费者对提供者的请求就会被强制等待,知道提供者相应超时.在高负载场景下,如果不作任何处理,此类问题可能会导致服务消费者 ...
centos memcached
2014年1月19日 16:58:37 memcached 是基于libevent事件监听功能的,所以要安装 libevent 和 libevent-devel 启动命令 ./memcached -d ...
Java继承概述
继承概述 : 父类(超类,基类): 子类(派生类): extends 只能继承一个类,Java不支持多重继承: 子类继承父类之后,子类可以调用父类的属性和方法, 也可以重写父类的属性和方法,还可以增加 ...
python的mock功能，感觉入门了~~~
主要实现语法有patch, patch.object, Mock(). 下面的测试太赤裸裸了,只是为了熟悉语法. import unittest from unittest.mock import p ...

KNN与SVM对比&SVM与逻辑回归的对比

KNN与SVM对比&SVM与逻辑回归的对比的更多相关文章

随机推荐

热门专题