【Dual Support Vector Machine】林轩田机器学习技法

这节课内容介绍了SVM的核心。

首先，既然SVM都可以转化为二次规划问题了，为啥还有有Dual啥的呢？原因如下：

如果x进行non-linear transform后，二次规划算法需要面对的是d`+1维度的N个变量，以及N个约束

如果d`的维度超大，那么二次规划解起来的代价就太大了。因此，SVM的精髓就在于做了如下的问题转化：

不需要问太深奥的数学，知道为啥要dual的motivation就可以了。

这里再次搬出前人的智慧：Lagrange Multipliers

但是这里跟ridge regression不太一样：一个约束条件配一个拉格朗日乘子；每个乘子是未知的，需要求解的变量。

如上图，首先把原问题的N个不等式约束条件，通过拉格朗日乘子给弄到等式中。

问题困惑：原来的目标函数是min (b,W) 0.5W'W，而且还是min；为啥用Lagrange Fucntion转换后，还搞出来一个max呢？背后的原因是啥呢？

我的理解：这里max的目的是把违背约束条件的(b,W)的值无限放大

　　（1）违背约束条件：alpha后面的值是正数，那么max必然是alpha取无限大的情况；这样经过外层的min操作，必然过滤掉了

　　（2）符合约束条件：alpha后面的值是非正，那么max必然是alpha取零的情况；这样min里面剩下的项就是原目标函数了；

综合（1）（2）来看，拉格朗日乘子起到这样的作用：

　　　　a. 把不等式约束给弄到等式中

　　　　b. 把违背约束的项目给弄到无限大

　　　　c. 如果符合约束条件，等式中的拉格朗日项目就没有了；这样剩下的自然就是原来需要min的目标函数

综合b,c来看，拉格朗日乘子用一种特殊的方式把违背约束条件的（b,W)给排除了，把符合约束条件的（b,W)给留在了候选集合中。

这样转换后的问题就跟原问题等价了；约束条件藏在了max里面。

接下需要进一步转化：

交换min和max的顺序：

（1）原来的max里面（b,W)是受到约束条件限制的

（2）交换min和max后，（b,W)可以不受到约束条件限制

转换后的问题，叫Lagrange dual problem。

光大于等于还不行，最好能等于：

要想是强对偶问题，QP需要满足：

（1）原问题是convex的

（2）原问题是feasible的（即线性可分）

（3）约束条件是线性的

于是，就可以放心大胆地取等号了。

分别对b和W求导，获得梯度为零的条件。

通过梯度为0的条件，把min里的b和W都替换掉了；由于min的变量是(b,W)，但现在变量只剩下alpha了，所以min也可以直接去掉了。

这里涉及到一些矩阵微分的内容（http://blog.sciencenet.cn/blog-849193-653656.html）

关于b的梯度求解很直观。

关于W的梯度求解，可以转化成矩阵向量表示。

（1）二次项求导的结果就是W

（2）一次项求导可以做如下的变换，以及最终的表达式如下。

这样W就完全用y,z,alpha表示出来了；另外，从这可以看出来W其实是输入向量Z的线性组合，每个Zn前面的系数就是alphan yn。

以上一系列转化的背后是KKT条件。

有了KKT条件，只要求出来最优的alpha就相当于间接求出来了（b,W).

KKT里面后两个条件比较重要：

（1）dual problem的inner部分要满足梯度为0（即取得最优化的值）

（2）原问题取得最优化值的同时，其中的拉格朗日乘子必须disappear

最终，转化为对偶问题后的最优化问题，就保持了N个变量（alpha）,N+1个约束条件。对比原问题，变量的维度控制在了1（原来的维度是d`+1）。

直接套用QP Solver即可

目标函数：

（1）二次项系数qn,m = ynymZn'Zm

（2）一次项系数-IN

约束条件：

（1）等于0的情况可以用“大于等于∩小于等于”来代替

（2）对于alphan大于等0的情况，用n那个单位方向向量做系数（[1,0.....] [0,1,0,....], .... , [0,....,0,1]）

这里提到了一个东西：输入变量d`+1维度的代价哪去了？其实，转化到了qn,m中去了。

其实到这里，还是对为何要转成dual problem不十分确定，只能说是计算的代价发生了变化。

转化后约束条件的系数变得简单了，但是样本维度N一般都会大于输入维度d'很多啊，相当于目标函数复杂了一些。这样计算代价真的降低了么？

估计要想明白这个问题，还得看看QP问题是怎么求解的，后续再看吧。

总之，这里的Q矩阵依然是个N×N的矩阵，如果N很大占用的内存非常多，因此需要把特殊的求解工具才能搞定。

前面一大堆推导，后面的结论就是：

（1）最后只有alpha大于0的点被成为支撑向量（SV）

（2）最终W由所有支撑向量决定

（3）任意一个支撑向量都可以算出来b

这里回顾了之前讲过线性分类模型：W都可以看成输入数据的线性组合；SVM之所以好，是因为W只用支撑向量的线性组合就可以表示了。

这里留了一个问题：如果输入数据经过比较复杂的tranform了，还是比较难搞的，怎么能让算法摆脱d'的限制？

【Dual Support Vector Machine】林轩田机器学习技法的更多相关文章

【Linear Support Vector Machine】林轩田机器学习技法
首先从介绍了Large_margin Separating Hyperplane的概念. (在linear separable的前提下)找到largest-margin的分界面,即最胖的那条分界线.下 ...
【Support Vector Regression】林轩田机器学习技法
上节课讲了Kernel的技巧如何应用到Logistic Regression中.核心是L2 regularized的error形式的linear model是可以应用Kernel技巧的. 这一节,继续 ...
【Matrix Factorization】林轩田机器学习技法
在NNet这个系列中讲了Matrix Factorization感觉上怪怪的,但是听完第一小节课程就明白了. 林首先介绍了机器学习里面比较困难的一种问题:categorical features 这种 ...
【Deep Learning】林轩田机器学习技法
这节课的题目是Deep learning,个人以为说的跟Deep learning比较浅,跟autoencoder和PCA这块内容比较紧密. 林介绍了deep learning近年来受到了很大的关注: ...
【Radial Basis Function Network】林轩田机器学习技法
这节课主要讲述了RBF这类的神经网络+Kmeans聚类算法,以及二者的结合使用. 首先回归的了Gaussian SVM这个模型: 其中的Gaussian kernel又叫做Radial Basis F ...
【Neural Network】林轩田机器学习技法
首先从单层神经网络开始介绍最简单的单层神经网络可以看成是多个Perception的线性组合,这种简单的组合可以达到一些复杂的boundary. 比如,最简单的逻辑运算AND OR NOT都可以由多 ...
【Random Forest】林轩田机器学习技法
总体来说,林对于random forest的讲解主要是算法概况上的:某种程度上说,更注重insights. 林分别列举了Bagging和Decision Tree的各自特点: Random Fores ...
【Decision Tree】林轩田机器学习技法
首先沿着上节课的AdaBoost-Stump的思路,介绍了Decision Tree的路数: AdaBoost和Decision Tree都是对弱分类器的组合: 1)AdaBoost是分类的时候,让所 ...
【Adaptive Boosting】林轩田机器学习技法
首先用一个形象的例子来说明AdaBoost的过程: 1. 每次产生一个弱的分类器,把本轮错的样本增加权重丢入下一轮 2. 下一轮对上一轮分错的样本再加重学习,获得另一个弱分类器经过T轮之后,学得了T ...

随机推荐

【HHHOJ】ZJOI2019模拟赛（十二）03.03 解题报告
点此进入比赛得分: \(0+77+20=97\) 排名: \(Rank\ 5\) \(Rating\):\(+46\) \(T1\):[HHHOJ178]依神(点此看题面) 这套题目中的唯一一道传统 ...
create-react-app项目使用假数据
做新项目的时候,前端每次要等后端接口准备好再开始,就会延期,等后端接口准备好了,前端这边的项目又会相互紧张,如果前端跟后端同时进行,前期将框架,基础做好,定好接口文档,前端在后端没准备好接口的时候使用 ...
【转】Android xml资源文件中@、@android:type、@*、？、@+含义和区别
一.@代表引用资源 1.引用自定义资源.格式:@[package:]type/name android:text="@string/hello" 2.引用系统资源.格式:@andr ...
Max answer(The Preliminary Contest for ICPC China Nanchang National Invitational)
Alice has a magic array. She suggests that the value of a interval is equal to the sum of the values ...
matlab所需插件
1
php curl使用总结（一）
今天和第三方支付做对接的时候,在本地用wamp(php版本5.4.14)运行他们的支付demo的时候,报了一个错误.loadXML函数中不能传空值.排查代码的时候,发现他们用了curl,我以前也接触过 ...
第25章串行FLASH文件系统FatFs—零死角玩转STM32-F429系列
第25章串行FLASH文件系统FatFs 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.c ...
数据库MySQL基本介绍安装使用及文件导入导出
1.数据库(data base) 1.1 简述把文件存储在一台电脑上(服务器),其他电脑用户可以通过账号密码登陆,通过网络去访问这台电脑上的文件,但是由于每个人的数据是不同的,所以你只能通过自己的账 ...
重新认识下数组的concat方法
最近在学习react,看官方文档的时候,有一个例子中的一句话让我困惑.就是讲todoList的例子 concat不是连接数组的吗?看了一下concat的介绍数组虽然是对象类型,但是对象毕竟不是数组啊 ...
Linux文件系统与目录结构
在Linux系统中,目录被组织成一个:单根倒置树结构,文件系统从根目录开始,用/来表示.文件名称区分大小写( 大小写敏感还需要看具体的文件系统格式 ),以.开头的为隐藏文件,路径用/来进行分割(win ...

【Dual Support Vector Machine】林轩田机器学习技法

【Dual Support Vector Machine】林轩田机器学习技法的更多相关文章

随机推荐

热门专题