线性可分支持向量机与软间隔最大化--SVM(2)

hichens 2024-11-07 01:46:15 原文

线性可分支持向量机与软间隔最大化--SVM

给定线性可分的数据集

假设输入空间(特征向量)为，输出空间为。
输入
表示实例的特征向量，对应于输入空间的点；
输出
表示示例的类别。

我们说可以通过间隔最大化或者等价的求出相应的凸二次规划问题得到的分离超平面

以及决策函数：

但是，上述的解决方法对于下面的数据却不是很友好，例如，下图中黄色的点不满足间隔大于等于1的条件

这样的数据集不是线性可分的，但是去除少量的异常点之后，剩下的点都是线性可分的，因此，我们称这样的数据集是近似线性可分的。
对于近似线性可分的数据集，我们引入了松弛变量，使得函数间隔加上松弛变量大于等于1。这样就得到了下面的解决方案：

其中，每个样本点都对应一个松弛变量， C > 0 称为惩罚参数。C越大，对误分类的点的惩罚越大。
这个解决方案旨在使得间隔最大化的同时减少误分类个数。下图是C对分类的影响，左图是大C，右图是小C：

可以证明w是唯一的，但是b不唯一，而是存在一个区间

下面来解决这个问题

首先引入拉格朗日函数（Lagrange Function）：

他的对偶问题(参考拉格朗日对偶性(Lagrange duality))是极大极小问题，首先求。对求导，解法如下：

代入得到：

问题转化为：

怎么求最优的w， b呢？
我们来看，原问题的KKT条件如下：

根据KKT条件的性质可以知道（参考拉格朗日乘子（Lagrange multify）和KKT条件)：

所以可以求得：

综上，引入松弛变量后线性支持向量机算法为：

.

*我们引入的松弛变量去哪里了呢？为什么算法中没有了？
其实，松弛变量在通过惩罚参数C隐式的作用。
我们可以改变C值，看看改变C哪些变量会随着改变。
增大C，由知，就更有可能大于0，再根据，松弛变量取0就更简单，这样就没有约束作用了。对整个数据集来说相当于是小的约束作用。
反之也可推出约束作用更强。
可以用这张图来解释：

线性可分支持向量机与软间隔最大化--SVM(2)的更多相关文章

统计学习：线性可分支持向量机(SVM)
模型超平面我们称下面形式的集合为超平面 \[\begin{aligned} \{ \bm{x} | \bm{a}^{T} \bm{x} - b = 0 \} \end{aligned} \tag{ ...
svm 之线性可分支持向量机
定义:给定线性可分训练数据集,通过间隔最大化或等价的求解凸二次规划问题学习获得分离超平面和分类决策函数,称为线性可分支持向量机. 目录: • 函数间隔 • 几何间隔 • 间隔最大化 • 对偶算法 1. ...
统计学习2：线性可分支持向量机(Scipy实现)
1. 模型 1.1 超平面我们称下面形式的集合为超平面 \[\begin{aligned} \{ \bm{x} | \bm{a}^{T} \bm{x} - b = 0 \} \end{aligned ...
线性可分支持向量机--SVM（1）
线性可分支持向量机--SVM (1) 给定线性可分的数据集假设输入空间(特征向量)为,输出空间为. 输入表示实例的特征向量,对应于输入空间的点: 输出表示示例的类别. 线性可分支持向量机的定义: ...
SVM中的软间隔最大化与硬间隔最大化
参考文献:https://blog.csdn.net/Dominic_S/article/details/83002153 1.硬间隔最大化对于以上的KKT条件可以看出,对于任意的训练样本总有ai= ...
软间隔分类——SVM
引入:1. 数据线性不可分:2. 映射到高维依然不是线性可分3. 出现噪声.如图: 对原始问题变形得到#2: 进行拉格朗日转换: 其中α和r是拉格朗日因子,均有不小于0的约束.按照之前的对偶问题的推导 ...
SVM中的间隔最大化
参考链接: 1.https://blog.csdn.net/TaiJi1985/article/details/75087742 2.李航<统计学习方法>7.1节线性可分支持向量机与硬间 ...
支持向量机(SVM)的推导(线性SVM、软间隔SVM、Kernel Trick)
线性可分支持向量机给定线性可分的训练数据集,通过间隔最大化或等价地求解相应的凸二次规划问题学习到的分离超平面为 \[w^{\ast }x+b^{\ast }=0\] 以及相应的决策函数 \[f\le ...
5. 支持向量机（SVM）软间隔
1. 感知机原理(Perceptron) 2. 感知机(Perceptron)基本形式和对偶形式实现 3. 支持向量机(SVM)拉格朗日对偶性(KKT) 4. 支持向量机(SVM)原理 5. 支持向量 ...

随机推荐

linux下安装mysql5.7（centos6.0）
注:因为网络原因,这个mysql安装是我以前在学校的时候找到的一个安装包,不过也找到了下载的地址:http://www.itmop.com/downinfo/143061.html下载完成后,把文件上 ...
二十三、JavaScript之html事件
一.代码如下二.效果如下三.点击之后 <!DOCTYPE html> <html> <meta http-equiv="Content-Type" ...
gem5-gpu全系统模式
# 注意:安装好gem5-gpu后再配置全系统环境 # 下载全系统模拟需要的工具,详见http://gem5.org/Running_gem5#Full_System_.28FS.29_Mode,将L ...
ajax异步提交有时会出现无bug的数据处理异常-----debug没有问题，正常运行却数据处理不正确，极少机会会出现正常的处理结果
ajax 被使用时,常默认的就使用了异步处理. 当遇到后面的代码对同样的数据进行处理或要依赖前面ajax处理的结果时,就会导致数据处理结果不正确,未达到预期值. 且,debug时却能正常完成功能 ...
细说 OLAP 与 OLTP
OLAP (Online analytical processing)[联机分析处理] 起源数据库概念最初源于1962年Kenneth Iverson发表的名为"A Programming ...
es6 part 1 //const let
1. let 命令 ES6 新增了let命令,用来声明变量.它的用法类似于var,但是所声明的变量,只在let命令所在的代码块内有效. { let a = 10; var b = 1; } a // ...
【golang】golang文本处理
golang文本字符串操作:包含合并连接分割取索引前缀后缀检测消除字符串消除空格 golang字符串操作需要用到 strings这个包 str := "hello world& ...
Vulkan SDK 之 Instance
上一篇 Vulkan SDK Demo 熟悉粗略的了解了下,一个app是如何调用vulkan的api来展示一个立方体的,但是对其中的每一个api了解并不深刻,后面的系列会根据sample的tutor ...
JMP CALL RET
一.JMP指令(修改EIP的值)(第一个修改EIP的指令) 三种方法 :JMP 立即数 JMP 寄存器 JMP 内存 EIP 之前介绍过,EIP存放的值就是cpu下一次要执行的地址 1.之前学过要 ...
安装Linux系统Centos6版本
1.下载VMware软件 2.下载Centos6文件 http://archive.kernel.org/centos-vault/6.8/isos/x86_64/CentOS-6.8-x86_64- ...