【Kernal Support Vector Machine】林轩田机器学习技术

考虑dual SVM 问题：如果对原输入变量做了non-linear transform，那么在二次规划计算Q矩阵的时候，就面临着：先做转换，再做内积；如果转换后的项数很多（如100次多项式转换），那么耗费的时间就比较多。

能否在计算Q矩阵这一步的时候，把transform+inner product合成一步呢？

这里就用到了一些kernel trick。

简单来说：某些特殊形式的transfrom，利用kernel trick就是只用计算一次transform之前的输入向量内积（X'X），transform之后的内积结果可以用X'X来表示，这样计算复杂度就维持在了O(d)。

如下的2nd order polynomial transform为例：

只要能用上kernel trick，所有Z'Z都可以用K(X,X')来代替。

接下来看，如果能使用上kernel trick，计算dual SVM的时候会带来哪些好处。

可以用上K(X,X')的地方有：

（1）计算qn,m的时可以直接用

（2）计算bias b的时候可以用上

（3）当输入一个测试样本的时候，可以直接用上（否则先得做转换，再用求出来的公式）

因此，Kernel SVM的QP过程可以利用kernel trick在各个环节都获得简化。

下面分别介绍几个常用的kernel类型。

General Poly-2 Kernel

上面这种K2 kernel的好处：

（1）在计算上非常简洁，只需要计算一次X'X，加1再平方就OK了。

（2）又不失一般性，因为在QP的过程中，常数项、一次项、二次项前面的系数会随着优化而吃掉

但是K2 kernel前面的系数也不能乱选，因为这影响到了最终的W是多少（即margin definition）

K2不同的系数，选择的SV也不同。

一般先从最简单的SVM开始试验，然后再逐渐复杂。

Gaussian SVM

Gaussian SVM是一个无穷维的多项式变换。

无穷维的好处就是学习power增强了，缺点就是参数选的不好就....

即使是SVM 过拟合依然会出现，要慎用Gaussian SVM。

几种Kernel各有好处，但原则还是要慎用，能用简单的不用复杂的。

【Kernal Support Vector Machine】林轩田机器学习技术的更多相关文章

【Soft-Margin Support Vector Machine】林轩田机器学习技术
Hard-Margin的约束太强了:要求必须把所有点都分开.这样就可能带来overfiiting,把noise也当成正确的样本点了. Hard-Margin有些“学习洁癖”,如何克服这种学习洁癖呢? ...
【Kernel Logistic Regression】林轩田机器学习技术
最近求职真慌,一方面要看机器学习,一方面还刷代码.还是静下心继续看看课程,因为觉得实在讲的太好了.能求啥样搬砖工作就随缘吧. 这节课的核心就在如何把kernel trick到logistic regr ...
【Gradient Boosted Decision Tree】林轩田机器学习技术
GBDT之前实习的时候就听说应用很广,现在终于有机会系统的了解一下. 首先对比上节课讲的Random Forest模型,引出AdaBoost-DTree(D) AdaBoost-DTree可以类比Ad ...
（转载）林轩田机器学习基石课程学习笔记1 — The Learning Problem
(转载)林轩田机器学习基石课程学习笔记1 - The Learning Problem When Can Machine Learn? Why Can Machine Learn? How Can M ...
【Linear Support Vector Machine】林轩田机器学习技法
首先从介绍了Large_margin Separating Hyperplane的概念. (在linear separable的前提下)找到largest-margin的分界面,即最胖的那条分界线.下 ...
【Dual Support Vector Machine】林轩田机器学习技法
这节课内容介绍了SVM的核心. 首先,既然SVM都可以转化为二次规划问题了,为啥还有有Dual啥的呢?原因如下: 如果x进行non-linear transform后,二次规划算法需要面对的是d`+1 ...
【Support Vector Regression】林轩田机器学习技法
上节课讲了Kernel的技巧如何应用到Logistic Regression中.核心是L2 regularized的error形式的linear model是可以应用Kernel技巧的. 这一节,继续 ...
【Matrix Factorization】林轩田机器学习技法
在NNet这个系列中讲了Matrix Factorization感觉上怪怪的,但是听完第一小节课程就明白了. 林首先介绍了机器学习里面比较困难的一种问题:categorical features 这种 ...
【Radial Basis Function Network】林轩田机器学习技法
这节课主要讲述了RBF这类的神经网络+Kmeans聚类算法,以及二者的结合使用. 首先回归的了Gaussian SVM这个模型: 其中的Gaussian kernel又叫做Radial Basis F ...

随机推荐

POJ-2481 Cows---树状数组的运用
题目链接: https://vjudge.net/problem/POJ-2481 题目大意: if Si <= Sj and Ej <= Ei and Ei - Si > Ej - ...
codeforces 600E Lomsat gelral
题面:codeforces600E 学习一下$dsu \ on \ tree$.. 这个东西可以处理很多无修改子树问题,复杂度通常为$O(nlogn)$. 主要操作是:我们先把整棵树链剖一下,然后每次 ...
【LOJ6513】「雅礼集训 2018 Day10」足球大战（数学题）
点此看题面大致题意: 已知主队每秒进球概率为$p$,客队每秒进球概率为$q$,求主队进球数大于客队的概率. 推式子考虑枚举主队进球数$i$,则客队进球数必然小于$i$,因此可再枚举 ...
使用 NetBackup 命令创建 Hyper-V 策略（命令创建其他策略也是如此）
Veritas NetBackup™ for Hyper-V 管理指南 Product(s): NetBackup (8.1) 使用 NetBackup 命令创建 Hyper-V 策略本主题介绍如何 ...
phpmyadmin 打开数据表较多，数据量较大的数据库时出现超时的解决办法
用phpmyadmin打开数据表较多,数据量较大的数据库时,会出现超时,或者等半天打开了说数据库没有表.并且即便打开了,再进行其他浏览,编辑,sql等操作,页面也是相当慢的,慢等几乎无法忍受.这里慢也 ...
问题 A: E2 驾驭const
题目描述引入了const关键词,用于指定“常”对象及“常”对象成员,提供了对数据的一种保护机制,这C++语言的特色之一.但由此,也引出了一些语法上的要求.这些语法要求,实际上有一套完善的原则,需要熟 ...
2017.9.21 HTML学习总结---多媒体播放系统设计
1.题目:整个页面被划分三个子窗口,上面窗口为页面功能提示区, 下左部分为不同类型播放的功能选项,下右部分为播放系统显示播放信息窗口. (1)网页设计框架: <html> <head ...
Linux(三) - 文件操作相关命令
Ctl-A 光标移动到行首 Ctl-C 终止命令 Ctl-D 注销登录 Ctl-E 光标移动到行尾 Ctl-U 删除光标到行首的所有字符,在某些设置下,删除全行 Ctl-W 删除当前光标到前边的最近一 ...
移动页面请使用CSS3动画
说到动画,我们一般会使用jQuery 中的animate(); 在PC浏览器中,是很方便的,由于PC的高性能,这种不断修改DOM的做法确实不会出现太大的问题,但是在手机端就不同了. 手机上使用jQue ...
史上最简单的SpringCloud教程 | 第十一篇: docker部署spring cloud项目
转载请标明出处: 原文首发于:https://www.fangzhipeng.com/springcloud/2017/07/12/sc11-docker/ 本文出自方志朋的博客一.docker简介 ...

【Kernal Support Vector Machine】林轩田机器学习技术

【Kernal Support Vector Machine】林轩田机器学习技术的更多相关文章

随机推荐

热门专题