12.支持向量机

觉得有用的话,欢迎一起讨论相互学习~Follow Me

参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广

12.2 大间距的直观理解- Large Margin Intuition

人们有时将支持向量机看作是大间距分类器。在这一部分，我将介绍其中的含义，这有助于我们直观理解 SVM 模型的假设是什么样的。以下图片展示的是SVM的代价函数:

最小化SVM代价函数的必要条件
如果你有一个正样本,y=1,则只有在z>=1时代价函数\(cost_1(z)\)才等于0。反之,如果y=0,只有在z<=-1的区间里\(cost_0(z)\)函数值为0。这是 支持向量机 的一个有趣性质。
事实上，如果你有一个正样本y=1,则仅仅要求\(\theta^{T}x\ge0\),就能将该样本恰当分出.类似地，如果你有一个负样本，则仅需要\(\theta^{T}x\le0\)就可以将负例正确分离。
但是，支持向量机的要求更高，对于正样本不仅仅要能正确分开输入的样本，即不仅仅要求\(\theta^{T}x\ge0\)还需要的是比0值大很多，比如大于等于1。对于负样本，SVM也想\(\theta^{T}x\)比0小很多，比如我希望它小于等于-1，这就相当于在支持向量机中嵌入了一个额外的安全因子。或者说安全的间距因子。

正则化参数C与决策边界与决策间距
假设把C即正则化参数设定为一个很大的常数，那么为了优化整个SVM损失函数需要把损失项降到最小，即会尽量使乘积项为0，这会使其严格满足以下的约束条件：
\[min\ (C*0+\frac{1}{2}\sum^{n}_{i=1}\theta_j^2)\]
线性可分-决策边界
可以找到一条直线将正样本和负样本完美地划分开，此例中可以找到多条直线将其分开，下图中的 红线，绿线，黑线 都能将图中点很好的分开，当 正则化参数 很大时则边界线的 间距(margin) 就会很大，即会选择下图中的黑线作为边界线。这使得SVM具有良好的鲁棒性，即会尽量使用大的间距去分离。所以SVM也被称为 大间距分类器(Large margin classifier)
当C非常大时，SVM会使用最大的间距将正负样本分开，如下图中的黑线
但是当C非常大时，SVM为了保证大的边距，对异常点非常敏感，此时边界会变为下图中的紫红色直线，如果此时C没有那么大，SVM不会使用那么大的边距，则边界可能还是黑线
当 C 不是非常非常大的时候，它可以忽略掉一些异常点的影响，得到更好的决策界。甚至当你的数据不是线性可分的时候，支持向量机也可以给出好的结果。
回顾 C=1/λ，因此：
- C 较大时，相当于 λ 较小，可能会导致过拟合，高方差。
- C 较小时，相当于 λ 较大，可能会导致低拟合，高偏差。

[吴恩达机器学习笔记]12支持向量机2 SVM的正则化参数和决策间距的更多相关文章

[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.5 SVM参数细节标记点选取标记点(landma ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...
[吴恩达机器学习笔记]12支持向量机1从逻辑回归到SVM/SVM的损失函数
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.1 SVM损失函数从逻辑回归到支持向量机为了描述 ...
[吴恩达机器学习笔记]12支持向量机6SVM总结
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 12.6SVM总结推荐使用成熟的软件包用以解决 SVM 最优化问题的软件很复杂,且已经有研究者做了很多年数值优化.因此强烈 ...
[吴恩达机器学习笔记]12支持向量机4核函数和标记点kernels and landmark
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 12.4 核函数与标记点- Kernels and landmarks 问题引入如果你有以下的训练集,然后想去拟合其能够分开 ...
吴恩达机器学习笔记（六） —— 支持向量机SVM
主要内容: 一.损失函数二.决策边界三.Kernel 四.使用SVM (有关SVM数学解释:机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机) 一.损失函数二.决策边界对于: 当C非常 ...
吴恩达机器学习笔记45-使用支持向量机（Using A SVM）
本篇我们讨论如何运行或者运用SVM. 在高斯核函数之外我们还有其他一些选择,如:多项式核函数(Polynomial Kernel)字符串核函数(String kernel)卡方核函数( chi-squ ...
Coursera-AndrewNg(吴恩达)机器学习笔记——第一周
一.初识机器学习何为机器学习?A computer program is said to learn from experience E with respect to some task T an ...
Machine Learning——吴恩达机器学习笔记（酷
[1] ML Introduction a. supervised learning & unsupervised learning 监督学习:从给定的训练数据集中学习出一个函数(模型参数), ...

随机推荐

tcp三次握手四次挥手（转）
转自: http://blog.csdn.net/whuslei/article/details/6667471 建立TCP需要三次握手才能建立,而断开连接则需要四次握手.整个过程如下图所示: 先来看 ...
lamp一键配置 --转自秋水
https://teddysun.com/lamp LAMP一键安装脚本最后修改于:2015年11月08日 / 秋水逸冰 / 54,300 次围观 973 本脚本适用环境: 系统支持:CentOS/ ...
Scrum立会报告+燃尽图（十月十七日总第八次）：分配Alpha阶段任务
此作业要求参见:https://edu.cnblogs.com/campus/nenu/2018fall/homework/2246 项目地址:https://git.coding.net/zhang ...
关于虚拟机安装mac os 教程详解
环境搭建 VMware下载百度云盘下载:链接:http://pan.baidu.com/s/1pK8RcLl 密码:5jc5 Unlocker208 百度云盘下载:链接:http://pan.bai ...
OSG学习：使用OSG中预定义的几何体
常用的内嵌几何体包括: osg::Box //正方体 osg::Capsule //太空舱 osg::Cone //椎体 osg::Cylinder //柱体 osg::HeightField //高 ...
Docker 技术介绍
https://github.com/docker/docker 实现用户空间隔离的技术:名称空间(NameSpace),CGroup(控制组) 什么是NameSpace::简单的理解就是,每一个虚拟 ...
spring复杂数据类型传递
1.VO对象与PO对象的区别: PO(persistant object) 持久对象:通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO ...
学生导师互选系统(php代码规范)
学生导师互选系统(php代码规范) php编码规范组名:一不小心就火了负责项目:学生导师互选系统(安卓端) 编写目的为了更好的提高团队的的合作效率,保证开发的有效性和合理性,并可最大程度的提高程 ...
CCF——相邻数对201409-1
问题描述给定n个不同的整数,问这些数中有多少对整数,它们的值正好相差1. 输入格式输入的第一行包含一个整数n,表示给定整数的个数. 第二行包含所给定的n个整数. 输出格式输出一个整数,表示值正好 ...
CNN误差反传时旋转卷积核的简明分析（转）
CNN(卷积神经网络)的误差反传(error back propagation)中有一个非常关键的的步骤就是将某个卷积(Convolve)层的误差传到前一层的池化(Pool)层上,因为在CNN中是2D ...

[吴恩达机器学习笔记]12支持向量机2 SVM的正则化参数和决策间距

12.支持向量机

觉得有用的话,欢迎一起讨论相互学习~Follow Me

12.2 大间距的直观理解- Large Margin Intuition

最小化SVM代价函数的必要条件

正则化参数C与决策边界与决策间距

[吴恩达机器学习笔记]12支持向量机2 SVM的正则化参数和决策间距的更多相关文章

随机推荐

热门专题