【python与机器学习实战】感知机和支持向量机学习笔记(一)
对《Python与机器学习实战》一书阅读的记录,对于一些难以理解的地方查阅了资料辅以理解并补充和记录,重新梳理一下感知机和SVM的算法原理,加深记忆。
1.感知机
感知机的基本概念
感知机是运用梯度下降学习过程的最简单的机器学习算法之一,是神经网络和支持向量机的基础。具体提出是由Rosenblatt这个人提出的,具体背景略。这里仅对感知机算法进行介绍:
对于二分类问题,假设一个数据集D={(x1,y1),...,(xN,yN)},存在一个平面(超平面)wx+b=0将数据分成两类,使得:
则称数据为线性可分的,否则为线性不可分。那么,感知机的算是函数可以表示为:
其中E表示误分类的集合,即:
那么利用梯度下降法,对参数进行更新,更新过程如下:
值得一提的是,考虑到计算速度问题,可采用随机梯度下降(SGD)或批量梯度下降(BGD)进行参数更新,若为随机梯度下降,随机选取一个被误分类的样本进行参数的更新,则偏导数为:
上述即为感知机的学习算法过程,最终学习的模型为:
感知机的对偶形式
对偶形式通常是为了解决原始问题较为复杂,经转换为对偶形式后能够方便求解,对于特定问题原始算法的对偶形式存在一些共性。虽然感知机的原始形式比较简单,但为了便于后面SVM算法的对偶形式的理解,这里对感知机的对偶形式的转化过程进行讲述。
上述参数更新过程每一次选取一个分错的样本点对参数进行更新,假设在最终训练结束后,样本点(xi,yi)共被选取到了ni次,那么最终参数更新为:
设αi=ηni,则上式改写为:
那么误分类集合E可表示为:
当存在有误分类的点时,随机选取xi对应下标的αi进行更新(随机梯度下降),从而对α进行更新:
这里需要说明的是:
即实际上参数的更新就是对选取到样本点xi的次数ni进行更新。
2.从感知机到支持向量机
在二分类情况下,感知机所关注的主要是将样本分成两类即可,理论上讲,只要是线性可分的数据集,只要迭代次数足够大,就一定能够将样本分开。但这对于最终模型的泛化能力没有保证,换句话说就是“虽然分开了,但是哪种分开的情况下才是最好呢?”,如图所示:
图中蓝线和红线都将样本分成两类(假设红色为class1,蓝色为class2),但对于一个新的样本(绿色),采用蓝线时,新样本属于class1,而采用红线划分时,新样本属于class2。
因此,SVM就是为了解决这样的问题的一种改进的方法。显然对于上图中直觉上红线的划分效果最好,保证了两边的数据点被划分时有较大的“间隔”,这也是SVM算法的主旨思想,即:在进行划分的过程中使距离分离超平面最近的点的距离最大。具体数学描述如下:
假设分离超平面为wx+b=0,那么样本点(xi,yi)距离平面的距离(这里距离指的是几个间隔,区别于函数间隔,该距离还有一个推导过程,某度可查)可以表示为:
(因在正侧为正,在负一侧为负,因此乘以yi即可)
那么,使得距离分离超平面距离最小的样本点的距离最大的数学描述为:
这里不妨令函数间隔为1(具体为什么设为1,一方面是便于推导,另一方面对于目标函数的优化没有影响,详细证明过程暂不考究),即:
那么问题转化为:
上述即为SVM算法的基本概述,至于如何求解,后文再说。
对于线性可分的数据采用上述约束条件能够将数据完美分开,这就是硬间隔SVM基于该假设进行的,而通常数据中存在一定的噪音,并不能完全是线性可分的,此时将采用软间隔的方法对数据进行训练。所谓软间隔,就是在划分数据时给予一定的容忍,同时为了限制这个容忍度,在目标函数中加上一定的惩罚,来制衡这种容忍程度,这里容忍度称之为松弛变量,记为ξ,具体描述如下:
将约束条件加上一个松弛变量,即为:
同时在目标函数中加入惩罚项,来约束松弛变量:
那么,根据约束条件,引入Hinge损失,记为l,则l可以表示为:
那么最终的目标函数变为:
接下来就是如何求解SVM的问题,一种是采用梯度下降的直接进行参数迭代求解,另一种是转换为求解问题的对偶形式,在进行求解。
利用梯度下降算法求解SVM
将上式作为损失函数进行求解,记为:
那么分别对w,b进行求导,则有:
根据每一次迭代的误差项e,误差项计算公式为:
选择误差项最大的一项对应的样本点进行参数更新,即:
然后选取(xi,yi)对参数进行更新,更新过程为:
最终输出模型:
SVM初步的介绍就先写到这里,后续将对SVM的对偶形式及其求解,以及核方法在SVM的运用进一步进行梳理。
参号文献:
何宇健 《Python与机器学习实战》
【python与机器学习实战】感知机和支持向量机学习笔记(一)的更多相关文章
- 【Python机器学习实战】感知机和支持向量机学习笔记(三)之SVM的实现
前面已经对感知机和SVM进行了简要的概述,本节是SVM算法的实现过程用于辅助理解SVM算法的具体内容,然后借助sklearn对SVM工具包进行实现. SVM算法的核心是SMO算法的实现,首先对SMO算 ...
- 《Node.js开发实战详解》学习笔记
<Node.js开发实战详解>学习笔记 ——持续更新中 一.NodeJS设计模式 1 . 单例模式 顾名思义,单例就是保证一个类只有一个实例,实现的方法是,先判断实例是否存在,如果存在则直 ...
- 《Cocos2d-x游戏开发实战精解》学习笔记4--实战一个简单的钢琴
上一节学习了使用Cocos2d-x播放音乐的方法,但是那种方法一般只适合于播放较大的音乐,而一般比较短小的音乐(如游戏中的打斗.按键音效等)则要通过playEffect来播放.本节使用该方法以及之前学 ...
- 《Cocos2d-x游戏开发实战精解》学习笔记3--在Cocos2d-x中播放声音
<Cocos2d-x游戏开发实战精解>学习笔记1--在Cocos2d中显示图像 <Cocos2d-x游戏开发实战精解>学习笔记2--在Cocos2d-x中显示一行文字 之前的内 ...
- Spring实战第六章学习笔记————渲染Web视图
Spring实战第六章学习笔记----渲染Web视图 理解视图解析 在之前所编写的控制器方法都没有直接产生浏览器所需的HTML.这些方法只是将一些数据传入到模型中然后再将模型传递给一个用来渲染的视图. ...
- Spring实战第五章学习笔记————构建Spring Web应用程序
Spring实战第五章学习笔记----构建Spring Web应用程序 Spring MVC基于模型-视图-控制器(Model-View-Controller)模式实现,它能够构建像Spring框架那 ...
- Spring实战第四章学习笔记————面向切面的Spring
Spring实战第四章学习笔记----面向切面的Spring 什么是面向切面的编程 我们把影响应用多处的功能描述为横切关注点.比如安全就是一个横切关注点,应用中许多方法都会涉及安全规则.而切面可以帮我 ...
- K近邻 Python实现 机器学习实战(Machine Learning in Action)
算法原理 K近邻是机器学习中常见的分类方法之间,也是相对最简单的一种分类方法,属于监督学习范畴.其实K近邻并没有显式的学习过程,它的学习过程就是测试过程.K近邻思想很简单:先给你一个训练数据集D,包括 ...
- Python、机器学习、计算机视觉、深度学习入门
1.简明Python教程 2.Python计算机视觉编程 3.机器学习实践 4.吴恩达机器学习 5.李飞飞深度学习与计算机视觉
随机推荐
- Springboot下载Excel的3种方式
Springboot下载Excel的3种方式 汇总一下浏览器下载和代码本地下载实现的3种方式. (其实一般都是在代码生成excel,然后上传到oss,然后传链接给前台,但是我好像没有实现过直接点击就能 ...
- 流程自动化RPA,Power Automate Desktop系列 - DotNet Core打包并发布Nuget Package
一.背景 DotNet Core通常基于Nuget来实现包管理,如果你想要把自己的实现共享给其他人,通常我们需要把本地项目打包好,然后发布到对应的Nuget Server上,以便于其他人可以查找.安装 ...
- AcWing 244. 谜一样的牛
有n头奶牛,已知它们的身高为 1~n 且各不相同,但不知道每头奶牛的具体身高. 现在这n头奶牛站成一列,已知第i头牛前面有a头牛比它低,求每头奶牛的身高. #include<bits/stdc+ ...
- Springboot:SpringBoot2.0整合WebSocket,实现后端数据实时推送!
一.什么是WebSocket? B/S结构的软件项目中有时客户端需要实时的获得服务器消息,但默认HTTP协议只支持请求响应模式,这样做可以简化Web服务器,减少服务器的负担,加快响应速度,因为服务器不 ...
- php安裝7.3版本
CentOS 安装 EPEL 源: yum install epel-release 安装 REMI 源: CentOS 7: yum install http://rpms.remirepo.net ...
- SpringBoot 如何统一后端返回格式?老鸟们都是这样玩的!
大家好,我是飘渺. 今天我们来聊一聊在基于SpringBoot前后端分离开发模式下,如何友好的返回统一的标准格式以及如何优雅的处理全局异常. 首先我们来看看为什么要返回统一的标准格式? 为什么要对Sp ...
- 锐捷RG-S2951G-EV3 ACL 禁止端口
(config)ip access-list extended 199 (config)10 deny tcp any any eq 2425 (config)20 deny udp any any ...
- python 交换变量的值 不需要借助第三个变量
>>> a,b,c,d=1,2,3,4>>> a,b,c,d=d,c,b,a>>> print(a,b,c,d)4 3 2 1>>&g ...
- [刘阳Java]_Spring AOP入门_第7讲
AOP技术个人认为是能够完善(改善)面向对象编程OOP.为什么这么说,我们得先从AOP的概念说起,然后通过一段简单的例子加以佐证.这样子大家就可以慢慢地了解AOP 1. AOP概念 AOP为Aspec ...
- 微信小程序云开发-数据库-商品列表数据显示N条数据
一.wxml文件 在wxml文件中,写页面和点击事件,添加绑定事件limitGoods 二.js文件 在js文件中写limitGoods(),使用.limit(3)表示只显示3条数据