今天是机器学习专题的第34篇文章,我们继续来聊聊SVM模型. 我们在上一篇文章当中推导了SVM模型在硬间隔的原理以及公式,最后我们消去了所有的变量,只剩下了\(\alpha\).在硬间隔模型当中,样本是线性可分的,也就是说-1和1的类别可以找到一个平面将它完美分开.但是在实际当中,这样的情况几乎是不存在的.道理也很简单,完美是不存在的,总有些样本会出错. 那针对这样的问题我们应该怎么解决呢? 软间隔 在上文当中我们说了,在实际的场景当中,数据不可能是百分百线性可分的,即使真的能硬生生地找到这样的…
大家好,欢迎大家阅读周二机器学习专题,今天的这篇文章依然会讲SVM模型. 也许大家可能已经看腻了SVM模型了,觉得我是不是写不出新花样来,翻来覆去地炒冷饭.实际上也的确没什么新花样了,不出意外的话这是本专题最后一篇文章了.下周我们就要开始深度学习之旅了,我相信很多同学期待这一天已经很久了,实际上我也一样,因为这个专题里讲的大部分内容已经只在面试环节会用到,而我已经很久没有面试了.所以让我们收拾一下激动的心情,来把SVM最后剩下的一点内容讲完. 虽然只剩下最后一点内容了,但是今天的内容非常重要,可…
[机器学习详解]SMO算法剖析 转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/51227754 CSDN−勿在浮沙筑高台 本文力求简化SMO的算法思想,毕竟自己理解有限,无奈还是要拿一堆公式推来推去,但是静下心看完本篇并随手推导,你会迎刃而解的.推荐参看SMO原文中的伪代码. 1.SMO概念 上一篇博客已经详细介绍了SVM原理,为了方便求解,把原始最优化问题转化成了其对偶问题,因为对偶问题是一个凸二次规划问题,这样的凸二次规…
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第31篇文章,我们一起继续来聊聊GBDT模型. 在上一篇文章当中,我们学习了GBDT这个模型在回归问题当中的原理.GBDT最大的特点就是对于损失函数的降低不是通过调整模型当中已有的参数实现的,若是通过训练新的CART决策树来逼近的.也就是说是通过增加参数而不是调整参数来逼近损失函数最低点. 如果对于这部分不是很理解的话,可以通过下方的链接回顾一下之前的内容: 机器学习 | 详解GBDT梯度提升树原理,看完再也不怕面试…
SupportVector Machines are learning models used forclassification: which individuals in a population belong where? 支持向量机(SVM)定义:支持向量机是主要用于解决分类问题的学习模型. 感知机 在讲解SVM之前我们先回到1956年达特矛斯会议之后,在会议中确定了我们学科的名字AI的同时,也激起了一片人工智能热,正是在这次浪潮中出现了一个人-罗森布拉特. 他是一位心理医生,在神经感知…
html文字滚动代码 <marquee style="WIDTH: 388px; HEIGHT: 200px" scrollamount="2" direction="up" > <div align="left" ><br /> </div > <center ><font face="黑体" color="#008000&quo…
今天是机器学习专题的第33篇文章,我们继续来聊聊SVM模型. 在上一篇文章当中我们推到了SVM模型在线性可分的问题中的公式推导,我们最后得到的结论是一个带有不等式的二次项: \[\left\{\begin{align*} &\min_{\omega , b} \frac{1}{2}||\omega||^2\\ s.t.& \quad y_i(\omega^Tx + b) \ge 1, &i=1,2,3\ldots,m\\ \end{align*}\right.\] 想要了解具体推导…
引自:http://blog.csdn.net/taily_duan/article/details/54584040 人脸对齐之SDM(Supervised Descent Method) 人脸对齐之LBF(Local Binary Features) 人脸识别技术大总结(1):Face Detection & Alignment Real-time Expression Transfer for Facial Reenactment https://www.youtube.com/watch…
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第12篇文章,我们一起来看下Kmeans聚类算法. 在上一篇文章当中我们讨论了KNN算法,KNN算法非常形象,通过距离公式找到最近的K个邻居,通过邻居的结果来推测当前的结果.今天我们要来看的算法同样非常直观,也是最经典的聚类算法之一,它就是Kmeans. 我们都知道,在英文当中Means是平均的意思,所以也有将它翻译成K-均值算法的.当然,含义是一样的,都是通过求均值的方式来获取样本的类簇. 既然知道Kmeans算法…
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习的第15篇文章,之前的文章当中讲了Kmeans的相关优化,还讲了大名鼎鼎的EM算法.有些小伙伴表示喜欢看这些硬核的,于是今天上点硬菜,我们来看一个机器学习领域经常用到的数据结构--KD-Tree. 从线段树到KD树 在讲KD树之前,我们先来了解一下线段树的概念.线段树在机器学习领域当中不太常见,作为高性能维护的数据结构,经常出现在各种算法比赛当中.线段树的本质是一棵维护一段区间的平衡二叉树. 比如下图就是一个经典的线段树:…