svm、logistic regression对比

相同点：都是线性分类算法

不同点：

1、损失函数不同

LR：基于“给定x和参数，y服从二项分布”的假设，由极大似然估计推导

SVM： hinge loss ＋ L2 regularization的标准表示，基于几何间隔最大化原理推导

$\sum^N_{i=1}[1 - y_i(w*x_i + b)]_+ + \lambda ||w||^2$

这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。SVM的处理方法是只考虑support vectors（$W^*$，$b^*$只依赖于训练数据中对应于$a_i > 0$的样本点，其他样本点对w，b没有影响，将训练数据中对应于$a_i > 0$的实例点称为支持向量。由KKT对偶互补条件可知，支持向量一定在间隔边界上），也就是和分类最相关的少数点，去学习分类器。而逻辑回归通过非线性映射，大大减小了离分类平面($wx = 0$)较远的点的权重，相对提升了与分类最相关的数据点的权重。

w*x可以看做是函数距离，当||w||=1时，w*x就是几何距离，即样本点到分类平面的距离，Sigmoid函数是有上下界的，而w*x的范围是（负无穷，正无穷），也就是说随着自变量（的绝对值）的增加，Sigmoid函数的值越来越接近上下界，不能同等程度地反映自变量的变化幅度

2、支持向量机只考虑局部的间隔边界附近的点，而逻辑回归考虑全局（远离的点对边界线的确定也起作用）。支持向量机改变非支持向量样本并不会引起分离超平面的变化

3、SVM的损失函数自带正则（损失函数中的1/2||w||^2项），这就是为什么SVM是结构风险最小化算法的原因！！！而LR必须另外在损失函数上添加正则项！！！结构风险最小化，意思就是在训练误差和模型复杂度之间寻求平衡，防止过拟合。

4、优化方法：LR一般基于梯度下降法， SVM基于SMO

5、对于非线性可分问题，SVM的扩展性比LR强

如何选择两个模型？

假设： n = 特征数量，m = 训练样本数量

1）如果n相对于m更大，比如 n = 10,000，m = 1,000，则使用lr

理由：特征数相对于训练样本数已经够大了，使用线性模型就能取得不错的效果，不需要过于复杂的模型；

2）如果n较小，m比较大，比如n = 10，m = 10,000，则使用SVM（高斯核函数）

理由：在训练样本数量足够大而特征数较小的情况下，可以通过使用复杂核函数的SVM来获得更好的预测性能，而且因为训练样本数量并没有达到百万级，使用复杂核函数的SVM也不会导致运算过慢；

3）如果n较小，m非常大，比如n = 100, m = 500,000，则应该引入／创造更多的特征，然后使用lr或者线性核函数的SVM

理由：因为训练样本数量特别大，使用复杂核函数的SVM会导致运算很慢，因此应该考虑通过引入更多特征，然后使用线性核函数的SVM或者lr来构建预测性更好的模型。

svm、logistic regression对比的更多相关文章

logistic regression与SVM
Logistic模型和SVM都是用于二分类,现在大概说一下两者的区别 ① 寻找最优超平面的方法不同形象点说,Logistic模型找的那个超平面,是尽量让所有点都远离它,而SVM寻找的那个超平面,是只 ...
Logistic Regression vs Decision Trees vs SVM: Part II
This is the 2nd part of the series. Read the first part here: Logistic Regression Vs Decision Trees ...
Logistic Regression Vs Decision Trees Vs SVM: Part I
Classification is one of the major problems that we solve while working on standard business problem ...
Probabilistic SVM 与 Kernel Logistic Regression（KLR）
本篇讲的是SVM与logistic regression的关系. (一) SVM算法概论首先我们从头梳理一下SVM(一般情况下,SVM指的是soft-margin SVM)这个算法. 这个算法要实现 ...
logistic regression svm hinge loss
二类分类器svm 的loss function 是 hinge loss:L(y)=max(0,1-t*y),t=+1 or -1,是标签属性. 对线性svm,y=w*x+b,其中w为权重,b为偏置项 ...
SVM: 相对于logistic regression而言SVM的 cost function与hypothesis
很多学习算法的性能都差不多,关键不是使用哪种学习算法,而是你能得到多少数据量和应用这些学习算法的技巧(如选择什么特征向量,如何选择正则化参数等) SVM在解决非线性问题上提供了强大的方法. logis ...
Coursera台大机器学习技法课程笔记05-Kernel Logistic Regression
这一节主要讲的是如何将Kernel trick 用到 logistic regression上. 从另一个角度来看soft-margin SVM,将其与 logistic regression进行对比 ...
逻辑回归Logistic Regression 之基础知识准备
0. 前言这学期 Pattern Recognition 课程的 project 之一是手写数字识别,之二是做一个网站验证码的识别(鸭梨不小哇).面包要一口一口吃,先尝试把模式识别的经典问题—— ...
通俗地说逻辑回归【Logistic regression】算法（二）sklearn逻辑回归实战
前情提要: 通俗地说逻辑回归[Logistic regression]算法(一) 逻辑回归模型原理介绍上一篇主要介绍了逻辑回归中,相对理论化的知识,这次主要是对上篇做一点点补充,以及介绍sklear ...

随机推荐

【Java_多线程并发编程】JUC原子类——原子类中的volatile变量和CAS函数
JUC中的原子类是依靠volatile变量和Unsafe类中的CAS函数实现的. 1. volatile变量的特性内存可见性(当一个线程修改volatile变量的值后,另一个线程就可以实时看到此变量 ...
十：MYSQL中的事务
前言: 因为没有多少时间和精力,目前无法深入研究数据库中的事务,比如但是,对于事务的一些基本知识,还是需要牢牢掌握的,做到了解事务的基本常识,在实际开发中能够理解各个持久层框架对事务的处理一:是么 ...
shell 管道导致的变量重置问题
测试脚本: #!/bin/sh flag= func() { flag= } main() { func | echo "flag=$flag" } 输出显示的flag=0! 参考 ...
perl学习笔记之：模式匹配，模块，文档
Perl语言的最大特点,也是Perl作为CGI首选语言的最大特点,是它的模式匹配操作符.Perl语言的强大的文本处理能力正是通过其内嵌的对模式匹配的支持体现的.模式通过创建正则表达式实现.Perl的正 ...
XML,面向对象基础
什么是XML XML与JSON的对比 XML文档格式使用XML模块解析一,什么是XML ''' XML 全称可扩展标记语言 <tag></tag> 双标签 <tag/ ...
python 有4个数字1234，能组成多少个互不相同且无重复的三位数数字。
def output(): count = 0 for i in range(1,5): for j in range(1, 5): for k in range(1, 5): if i==j or ...
Mac版有道云笔记不能自动同步
删除本地资源文件夹 /Users/xxxx/Library/Containers/com.youdao.note.YoudaoNoteMac 直接删除整个文件夹,之后重新登录账号.
WordPress 多语言支持（本地化）
本博客将介绍WordPress的多语言制作首先需要在wp-content目录下创建一个languages文件夹,用于存放语言包文件. 然后在模板目录下的functions.php,然后在代码中添加函 ...
NYOJ 311 完全背包
完全背包时间限制:3000 ms | 内存限制:65535 KB 难度:4 描述直接说题意,完全背包定义有N种物品和一个容量为V的背包,每种物品都有无限件可用.第i种物品的体积是c,价值是 ...
js对文字进行编码
js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent 1 ...

svm、logistic regression对比

svm、logistic regression对比的更多相关文章

随机推荐

热门专题