统计学习方法 AdaBoost

提升方法的基本思路

在概率近似正确（probably approximately correct，PAC）学习的框架中，

一个概念（一个类），如果存在一个多项式的学习算法能够学习它，并且正确率很高，那么就称这个概念是强可学习的；

一个概念，如果存在一个多项式的学习算法能够学习它，学习的正确率仅比随机猜测略好，那么就称这个概念是弱可学习的。

Schapire后来证明强可学习与弱可学习是等价的，也就是说，在PAC学习的框架下，

一个概念是强可学习的充分必要条件是这个概念是弱可学习的。

对于分类问题而言，给定一个训练样本集，求比较粗糙的分类规则（弱分类器）要比求精确的分类规则（强分类器）容易得多。

提升方法就是从弱学习算法出发，反复学习，得到一系列弱分类器（又称为基本分类器），然后组合这些弱分类器，构成一个强分类器。

大多数的提升方法都是改变训练数据的概率分布（训练数据的权值分布），针对不同的训练数据分布调用弱学习算法学习一系列弱分类器。

对提升方法来说，有两个问题需要回答：

一是在每一轮如何改变训练数据的权值或概率分布；

二是如何将弱分类器组合成一个强分类器。

个问题，AdaBoost的做法是，提高那些被前一轮弱分类器错误分类样本的权值，而降低那些被正确分类样本的权值。

那些没有得到正确分类的数据，由于其权值的加大而受到后一轮的弱分类器的更大关注。于是，分类问题被一系列的弱分类器"分而治之"。

个问题，即弱分类器的组合，AdaBoost采取加权多数表决的方法。

加大分类误差率小的弱分类器的权值，使其在表决中起较大的作用，'

减小分类误差率大的弱分类器的权值，使其在表决中起较小的作用。

AdaBoost算法

训练数据集

初始化训练数据的权值分布
对M＝1,2,…,m

使用具有权值分布Dm的训练数据集学习，得到基本分类器：

计算G_m(x)在训练数据集上的分类误差率：

计算G_m(x)的系数

更新训练数据集的权值分布：

Z_m是规范化因子：
构建基本分类器的线性组合

AdaBoost说明：

假设训练数据集具有均匀的权值分布，即每个训练样本在基本分类器的学习中作用相同，

步能够在原始数据上学习基本分类器G₁(x)
AdaBoost反复学习基本分类器，在每一轮m＝1,2,…,M顺次地执行下列操作：

1.使用当前分布Dm加权的训练数据集，学习基本分类器Gm(x)。

2.计算基本分类器G_m(x)在加权训练数据集上的分类误差率：

这里，w_mi表示第m轮中第i个实例的权值.

这表明，G_m(x)在加权的训练数据集上的分类误差率是被G_m(x)误分类样本的权值之和，

由此可以看出数据权值分布D_m与基本分类器G_m(x)的分类误差率的关系

3. 计算基本分类器G_m(x)的系数am。am表示G_m(x)在最终分类器中的重要性。

当e_m≤1/2时，a_m≥0，并且a_m随着e_m的减小而增大，

所以分类误差率越小的基本分类器在最终分类器中的作用越大。

4.更新训练数据的权值分布为下一轮作准备

被基本分类器Gm(x)误分类样本的权值得以扩大，而被正确分类样本的权值却得以缩小

误分类样本在下一轮学习中起更大的作用。

不改变所给的训练数据，而不断改变训练数据权值的分布，使得训练数据在基本分类器的学习中起不同的作用

线性组合f(x)实现M个基本分类器的加权表决。

AdaBoost的例子

弱分类器由x<v或x>v产生, 其阈值v使该分类器在训练数据集上分类误差率最低.

初始化数据权值分布

对于m＝1

在权值分布为D₁的训练数据上，阈值v取2.5时分类误差率最低，故基本分类器为

G₁(x)在训练数据集上的误差率e₁＝P(G₁(x_i)≠y_i)＝0.3。

计算G₁(x)的系数：

更新训练数据的权值分布：

个误分类点。

对于m= 2

在权值分布为D₂的训练数据上，阈值v是8.5时分类误差率最低，基本分类器为

G₂(x)在训练数据集上的误差率e₂＝0.2143

计算a₂＝0.6496

更新训练数据权值分布:

个误分类点。

对于m = 3：

在权值分布为D₃的训练数据上，阈值v是5.5时分类误差率最低，基本分类器为

计算a₃＝0.7514

更新训练数据的权值分布

D₄＝(0.125,0.125,0.125,0.102,0.102,0.102,0.065,0.065,0.065,0.125)

得到：

AdaBoost算法的训练误差分析

AdaBoost算法最终分类器的训练误差界为：

这表明在此条件下AdaBoost的训练误差是以指数速率下降的

AdaBoost算法的解释

可以认为AdaBoost算法是

模型为加法模型

损失函数为指数函数

学习算法为前向分步算法

的二分类学习方法

加法模型

其中b(x；γ_m)为基函数的参数，β_m是基函数的系数。

如上式所示为一加法模型。

在给定训练数据及损失函数L(Y,f(X))的条件下，学习加法模型f(x)成为经验风险极小化即损失函数极小化问题：

前向分步算法（forward stagewise algorithm）求解这一优化问题的想法是

因为学习的是加法模型，如果能够从前向后，每一步只学习一个基函数及其系数，

逐步逼近优化目标函数式（8.14），那么就可以简化优化的复杂度。

就是优化如下函数：

，对m＝1,2,…,M，极小化损失函数

计算得到γ_m，β_m

更新f_m

获得加法模型

前向分步算法与AdaBoost

由前向分步算法可以推导出AdaBoost

AdaBoost算法是前向分歩加法算法的特例。

这时，模型是由基本分类器组成的加法模型，损失函数是指数函数。

统计学习方法 AdaBoost的更多相关文章

Adaboost算法的一个简单实现——基于《统计学习方法(李航)》第八章
最近阅读了李航的<统计学习方法(第二版)>,对AdaBoost算法进行了学习. 在第八章的8.1.3小节中,举了一个具体的算法计算实例.美中不足的是书上只给出了数值解,这里用代码将它实现一 ...
【NLP】基于统计学习方法角度谈谈CRF（四）
基于统计学习方法角度谈谈CRF 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务 ...
统计学习方法 --- 感知机模型原理及c++实现
参考博客 Liam Q博客和李航的<统计学习方法> 感知机学习旨在求出将训练数据集进行线性划分的分类超平面,为此,导入了基于误分类的损失函数,然后利用梯度下降法对损失函数进行极小化,从而 ...
统计学习方法笔记--EM算法--三硬币例子补充
本文,意在说明<统计学习方法>第九章EM算法的三硬币例子,公式(9.5-9.6如何而来) 下面是(公式9.5-9.8)的说明, 本人水平有限,怀着分享学习的态度发表此文,欢迎大家批评,交流 ...
统计学习方法：KNN
作者:桂. 时间:2017-04-19 21:20:09 链接:http://www.cnblogs.com/xingshansi/p/6736385.html 声明:欢迎被转载,不过记得注明出处哦 ...
统计学习方法：罗杰斯特回归及Tensorflow入门
作者:桂. 时间:2017-04-21 21:11:23 链接:http://www.cnblogs.com/xingshansi/p/6743780.html 前言看到最近大家都在用Tensor ...
统计学习方法：核函数（Kernel function）
作者:桂. 时间:2017-04-26 12:17:42 链接:http://www.cnblogs.com/xingshansi/p/6767980.html 前言之前分析的感知机.主成分分析( ...
统计学习方法学习（四）--KNN及kd树的java实现
K近邻法 1基本概念 K近邻法,是一种基本分类和回归规则.根据已有的训练数据集(含有标签),对于新的实例,根据其最近的k个近邻的类别,通过多数表决的方式进行预测. 2模型相关 2.1 距离的度量方式 ...
李航《统计学习方法》CH01
CH01 统计学方法概论前言章节目录统计学习监督学习基本概念问题的形式化统计学习三要素模型策略算法模型评估与模型选择训练误差与测试误差过拟合与模型选择正则化与交叉验证正则 ...

随机推荐

MSSQL 获取汉字全拼和汉字首字母
--获取全拼 DECLARE @str VARCHAR(max) SET @str= [dbo].[fn_Getquanpin]('中山') PRINT(@str) )) ) as begin ),) ...
51nod 1290 Counting Diff Pairs 莫队 + bit
一个长度为N的正整数数组A,给出一个数K以及Q个查询,每个查询包含2个数l和r,对于每个查询输出从A[i]到A[j]中,有多少对数,abs(A[i] - A[j]) <= K(abs表示绝对值) ...
python（23）re函数：compile、match、search、findall
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
使用 Sublime、WebStorm 开发 Jade
Sublime.WebStorm (PhpStorm) 是前端开发者的得力工具,开发 Jade 也不例外. 在配置这些软件的 Jade 开发环境前,请先在系统中安装 Node.js 和 Jade : ...
CRM 2016 subgrid 的显示隐藏
function OnLoad() { //这里隐藏添加子记录的(+) 号按钮 hide_add_btn(); //这里隐藏鼠标在子记录上时的(删除)按钮 hide_del_btn(); //这里处理 ...
ThinkPHP的路由形式
首先解释一下,这里路由的意思是:系统从URL参数中分析出当前请求的分组.控制器.操作 .另外我的网址根目录是放在article目录下的,Thinkphp主要有下面几种路由形式 1.pathinfo路径 ...
VBS基本知识
由于一些需要,开始学习VBS了.此篇文章一直将处于编辑添加状态. 1.VBS简介 VBS 即VBScript(Microsoft Visual Basic Script Editon),是微软开发的一 ...
maven仓库介绍《本地仓库、远程仓库》
在Maven中,任何一个依赖.插件或者项目构建的输出,都可以称之为构件.Maven在某个统一的位置存储所有项目的共享的构件,这个统一的位置,我们就称之为仓库.(仓库就是存放依赖和插件的地方)任何的构件 ...
openldap主机访问控制（基于hostname）
http://mayiwei.com/2013/03/21/centos6-openldap/ http://www.zytrax.com/books/ldap/ch11/dynamic.html h ...
3dsMax脚本插件开发之路
经过这两个月的努力,RDF2.1的升级开发已经基本完成,只待过些天正式发布.所以现在总算有时间思考,来整理一下自己的思路,以及今后的方向. 回顾当初,1.0是纯Maxscript编写的,一机一码的方式 ...

统计学习方法 AdaBoost

统计学习方法 AdaBoost的更多相关文章

随机推荐

热门专题