注：关于支持向量机系列文章是借鉴大神的神作，加以自己的理解写成的；若对原作者有损请告知，我会及时处理。转载请标明来源。

序：

我在支持向量机系列中主要讲支持向量机的公式推导，第一部分讲到推出拉格朗日对偶函数的对偶因子α；第二部分是SMO算法对于对偶因子的求解；第三部分是核函数的原理与应用，讲核函数的推理及常用的核函数有哪些；第四部分是支持向量机的应用，按照机器学习实战的代码详细解读。

机器学习之支持向量机（一）：支持向量机的公式推导

机器学习之支持向量机（二）：SMO算法

机器学习之支持向量机（三）：核函数和KKT条件的理解

机器学习之支持向量机（四）：支持向量机的Python语言实现

1 SMO算法的概念

这里补充一点，后面的K () 函数是核函数，是把低维度的数据投射到高维度中，即把非线性转换成线性分类。知道k 是核函数就可以了，后面会再详细讲解k 函数。我们在上篇中得到关于对偶因子的式子，对其求 α 极大，现在添加符号转化成求极小，两者等价。

转化后的目标函数：

其中约束条件中 C 是惩罚系数，由对非线性加上松弛因子得到的。

1998年，由Platt提出的序列最小最优化算法(SMO)可以高效的求解上述SVM问题，它把原始求解N个参数二次规划问题分解成很多个子二次规划问题分别求解，每个子问题只需要求解2个参数，方法类似于坐标上升，节省时间成本和降低了内存需求。每次启发式选择两个变量进行优化，不断循环，直到达到函数最优值。

2 SMO算法原理分析

我们的目标：求解对偶因子 α （α₁, α₂, ... , α_N）

2.1 目标函数化成二元函数

SMO算法是通过一定的规定选择两个参数进行优化，并固定其余 N - 2 个参数，假如选取优化的参数是 α₁, α_{2 ，}固定α₃, α₄ , .., α_N，对目标函数进行化简成二元函数得：

这里强调一下，式子中的 K_ij是核函数，知道意思就可以，不了解不太影响SMO算法的推导。

2.2 将二元函数化成一元函数

约束条件：

得到，其中 ζ 是一个定值。

让两边同时乘以y₁,化简得到：

将（2）式带入到（1）中可得：

2.3 对一元函数求极值点

对（3）式求导并等于0，得：

假设求解得到的值，记为α₁^new、α₂^new 优化前的解记为α₁^old、α₂^old ，由约束条件知：

得到：

再设支持向量机超平面模型为：f (x) = ω^Tx + b , ω = Σ α_iy_i x_i 即 f (x_i) 为样本x_i 的预测值，y_i 表示 x_i 的真实值，则令E_i 表示误差值。

由于可得：

将上面的式子（4）（6）（7）带入求导公式中，此时解出的 α₂^new 没有考虑到约束条件，先记为 α₂^{new unclipped} ，得：

带入（5）式子，得：

2.4 求得最终的对偶因子

以上求得的 α₂^{new unclipped}没考虑约束条件：

当和异号时，也就是一个为1，一个为-1时，他们可以表示成一条直线，斜率为1。

横轴是，纵轴是，和既要在矩形方框内，也要在直线上，因此 L <= α₂^new <= H

最终得到的值：

再根据得到 α₁^new：

2.5 临界情况的求值

对于大部分情况 η = K₁₁ + K₂₂ - 2K₁₂ > 0 ,求解方式如上；但 η <= 0 , α₂^new取临界点L或H。

当η<0时，目标函数为凸函数，没有极小值，极值在定义域边界处取得。
当η=0时，目标函数为单调函数，同样在边界处取极值。

计算方法：

3 启发式选取变量

3.1 对第一个变量的选取

第一个变量的选择称为外循环，首先遍历整个样本集，选择违反KKT条件的αi作为第一个变量，接着依据相关规则选择第二个变量(见下面分析),对这两个变量采用上述方法进行优化。当遍历完整个样本集后，遍历非边界样本集(0<αi<C)中违反KKT的αi作为第一个变量，同样依据相关规则选择第二个变量，对此两个变量进行优化。当遍历完非边界样本集后，再次回到遍历整个样本集中寻找，即在整个样本集与非边界样本集上来回切换，寻找违反KKT条件的αi作为第一个变量。直到遍历整个样本集后，没有违反KKT条件α_i，然后退出。

3.2 对第二个变量的选取

SMO称第二个变量的选择过程为内循环，假设在外循环中找个第一个变量记为α₁，第二个变量的选择希望能使α2有较大的变化，由于α₂是依赖于|E₁−E₂|,当E1为正时，那么选择最小的E_i作为E₂,如果E₁为负，选择最大E_i作为E₂，通常为每个样本的E_i保存在一个列表中，选择最大的|E₁−E₂|来近似最大化步长。

4 阈值b的计算

每完成两个变量的优化后，都要对阈值 b 进行更新，因为关系到 f(x) 的计算，即关系到下次优化时计算。

这部分结束了，通过SMO算法解出的对偶因子的值，可以得到最优的超平面方程 f (x) = ω_Tx + b ，即对样本能够划分。以上大多借鉴了勿在浮沙筑高台的blog 文章，他写的已经很清晰，我只是在他的基础上

增加或删去不好理解的内容。下篇是对核函数和KKT条件的解释。

机器学习之支持向量机（一）：支持向量机的公式推导

机器学习之支持向量机（二）：SMO算法

机器学习之支持向量机（三）：核函数和KKT条件的理解

机器学习之支持向量机（四）：支持向量机的Python语言实现

参考：

51227754

2 支持向量机（五）SMO算法

3 支持向量机通俗导论（理解SVM的三层境界）

机器学习之支持向量机（二）：SMO算法的更多相关文章

SVM-非线性支持向量机及SMO算法
SVM-非线性支持向量机及SMO算法如果您想体验更好的阅读:请戳这里littlefish.top 线性不可分情况线性可分问题的支持向量机学习方法,对线性不可分训练数据是不适用的,为了满足函数间隔大 ...
【机器学习详解】SMO算法剖析（转载）
[机器学习详解]SMO算法剖析转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/51227754 CSDN−勿在浮沙筑高台本文力 ...
机器学习算法整理（七）支持向量机以及SMO算法实现
以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 在监督学习中,许多学习算法的性能都非常类似,因此,重要的不是你该选择使用学习算法A还 ...
支持向量机的smo算法（MATLAB code）
建立smo.m % function [alpha,bias] = smo(X, y, C, tol) function model = smo(X, y, C, tol) % SMO: SMO al ...
机器学习-SVM中的SMO算法详解
【机器学习】支持向量机（SVM）的优化算法——序列最小优化算法（SMO）概述
SMO算法是一一种启发式算法,它的基本思路是如果所有变量的解的条件都满足最优化问题的KKT条件,那么这个最优化问题的解就得到了.因为KKT条件是该优化问题的充分必要条件. 整个SMO算法包括两个部分: ...
机器学习——支持向量机(SVM)之Platt SMO算法
Platt SMO算法是通过一个外循环来选择第一个alpha值的,并且其选择过程会在两种方式之间进行交替: 一种方式是在所有数据集上进行单遍扫描,另一种方式则是在非边界alpha中实现单遍扫描. 所谓 ...
统计学习方法ｃ++实现之六支持向量机（SVM）及SMO算法
前言支持向量机(SVM)是一种很重要的机器学习分类算法,本身是一种线性分类算法,但是由于加入了核技巧,使得SVM也可以进行非线性数据的分类:SVM本来是一种二分类分类器,但是可以扩展到多分类,本篇不 ...
支持向量机SMO算法实现（注释详细）
一:SVM算法 (一)见西瓜书及笔记 (二)统计学习方法及笔记 (三)推文https://zhuanlan.zhihu.com/p/34924821 (四)推文支持向量机原理(一) 线性支持向量机 ...

随机推荐

SpringMVC的filter怎么使用Autowired依赖注入bean
有的时候根据我们业务的需要,我们需要在web项目中定义一个自己的filter,并想在这个filter中使用@Autowired注入bean供我们使用.如果直接使用的话是不行的,需要我们在xml文件 ...
Hi，WeTest限免开放Android Oreo云真机，Android 8.1可开测！
2017年末,谷歌在印度正式发布 Android Oreo 8.1,向实现"为所有人打造由 AI 驱动的全覆盖移动平台"这一愿景迈进.Android 8.1在引入对 Android ...
junit源码解析--捕获测试结果
OK,前面的博客我们整理了junit运行完了所有的测试用例,那么OK了,现在开始该收集测试结果了. 在这最后一步中,junit主要是玩一个类,TestResult.这里类中封装了几个参数,在初始化这个 ...
php中urldecode()和urlencode()起什么作用
urlencode()函数原理就是首先把中文字符转换为十六进制,然后在每个字符前面加一个标识符%.urldecode()函数与urlencode()函数原理相反,用于解码已编码的 URL 字符串,其原 ...
PHP的CI框架流程基本熟悉
CI框架是PHP的一个快速开发框架,我是目前的公司项目后台语言用的PHP,因为我做前端开发,需要用php去填充页面数据,所以就开始去了解这个框架,学习了一些php和数据库的东西,这篇文章先具体介绍CI ...
Android开发之蓝牙Socket
蓝牙Server端就是通过线程来注册一个具有名称和唯一识别的UUID号的BluetoothServerSocket, 然后就一直监听Client端(BluetoothSocket)的请求,并对这些请求 ...
python-networkx学习（1）
介绍: networkx是python的一个库,它为图的数据结构提供算法.生成器以及画图工具.近日在使用ryu进行最短路径获取,可以通过该库来简化工作量.该库采用函数方式进行调用相应的api,其参数类 ...
日常API之图灵聊天机器人
机器人是什么?可以吃吗? 嗯,他可以和你聊天,不能吃哦. 首先需要到www.tuling123.com注册一只KEY,你才能调用机器人API哦一.布局 (控制台程序可以跳过这一步)本文以WPF为示例 ...
Java基础教程1：环境配置及第一个HelloWorld.java
本文主要介绍JDK环境配置.Sublime Text3配置及第一个HelloWorld.Java程序.运行环境为Win10系统,使用JDK1.8版本. 1. JDK下载及环境配置 1.1 JDK下载 ...
图说：为什么Java中的字符串被定义为不可变的
8张图,看懂Java字符串的不变性字符串,想必大家最熟悉不过了,通常我们在代码中有几种方式可以创建字符串,比如:String s = "Hollis";这时,其实会在堆内存中创建 ...

机器学习之支持向量机（二）：SMO算法

序：

1 SMO算法的概念

2 SMO算法原理分析

2.1 目标函数化成二元函数

2.2 将二元函数化成一元函数

2.3 对一元函数求极值点

2.4 求得最终的对偶因子

2.5 临界情况的求值

3 启发式选取变量

3.1 对第一个变量的选取

3.2 对第二个变量的选取

4 阈值b的计算

1 【机器学习详解】SMO算法剖析 http://blog.csdn.net/luoshixian099/article/details/51227754

2 支持向量机（五）SMO算法

机器学习之支持向量机（二）：SMO算法的更多相关文章

随机推荐

热门专题