一、Decision Stumps：

Decision Stumps称为单层分类器，主要用作Ensemble Method的组件（弱分类器）。一般只进行一次判定，可以包含两个或者多个叶结点。对于离散数据，可以选取该属性的任意一个数据作为判定的分割点；对于连续数据，可以选择属性的一个阈值做为分割点进行判定（大于该阈值分配到一类，小于该阈值分配到另一类；当然也可以选取多个阈值并由此得到多个叶结点）。

二、AdaBoost的理解：

1、基本流程

简单的说，AdaBoost框架就是根据指定的参数，进行轮训练得到个弱分类器及每个弱分类器对应的权重，最后将这些弱分类器的结果进行线性组合得到最终的结果。

关于多属性数据集的处理：

在每一轮训练过程中，在每个属性上根据分割的阈值不同得到多个单层分类器。在这些从所有属性上得到的分类器中选取一个带权误差率最小的单层分类器作为该轮训练的弱分类器。

2、带权分类误差

在进行训练之前，为训练集中的每个样本分配一个权重，使用向量表示。在第轮训练结束后，根据得到的弱分类器的性能计算该分类器对应的权值，并由的在训练集上的分类结果对权重向量进行更新。

分类器的性能度量和该分类器在训练集上的结果，都是通过计算该分类器在训练集上的带权分类误差获取。所谓带权分类误差，是指将待分类的样本包含的权重（此处的权重就是之前为该样本分配的权重），结合在该数据集上的分类误差得到分类器在该数据集上的一个考虑样本权重的分类误差，其定义如下：

(1.1)

其中，表示第个弱分类器的带权分类误差值，表示第次更新后样本的权重，表示使用第个弱分类器对样本的分类结果，表示样本的真实标签，是一个指示函数，其值如下：

(1.2)

通过公式（1.1）和（1.2）可以看出带权分类误差与两方面的因素相关：

1) 分类器在样本上的误差值；

2) 样本集中每个样本的权重；

注意：AdaBoost就是通过该值与弱分类器产生关系。

3、带权分类误差再分析

以DS（Decision Stumps）弱分类器为例，对于一个数据集包含多个属性，要在该数据集上学习一个DS，可以使用不同的属性作为分割判断条件。对于同一个属性，也可以选择多个不同的分割点（离散型）/阈值（连续性）作为判断条件。因此，对于一个数据集实质上可以产生很多不同的DS，那么究竟选择哪一个DS作为我们从该数据集上最终学习得到的弱分类器？

很直观的想法，我们可以使用穷举产生所有的DS，然后分别计算每个DS的分类误差，选择具有最小分类误差的DS作为从该数据集上学习到的弱分类器。然而，问题出在我们学习的这个数据集中的所有样本权重（此处可以理解为每个样本的价值、贡献度等）并不相同。我们在考虑选择哪个DS最为最终的弱分类器时不但要考虑该DS的分类错误率，还要考虑每个样本的权重问题，因为将高权重的样本分错造成的后果远比将低权重样本分错更为严重。

考虑公式（1.1）中带权分类误差的定义，该指标有效的将分类器的分类误差和待分类样本的权重结合起来，因此可以作为选择弱分类器时的一个标准使用。

总结起来简单的说，带权分类误差将分类器的分类误差和样本本身的权重进行结合，可以作为模型选择的一个标准使用。

4、弱分类器的权重计算

弱分类器对应的权重与其本身的带权分类误差相关，其计算公式如下：

(1.3)

通过简单分析可以知道，带权分类误差的范围是[0,1]，绘制分类器的权重函数的图像，如下所示：

Fig. 1. 弱分类器权重函数分布

由Fig. 1.可以看出，弱分类器的权重与其对应的带权分类误差呈反比关系，即就是带权分类误差越小，该分类器对应的权值越大；反之亦然。

5、训练样本的权重更新

训练得到新的弱分类器后需要对样本权值进行更新，更新的公式如下：

(1.4)

公式（1.4）定义了计算弱分类器对应的权值后，对样本的权重更新过程。如果该分类器在该样本上分类正确，则降低该样本的权值；如果分类错误，则提高该样本的权值。公式中前半部分主要用于对整个权值向量进行归一化，以使其和为1。

6、参考

维基百科关于AdaBoost算法的介绍：

用 xⁱ 和 y_i 表示原始样本集D的样本点和它们的类标（注意，y_i的取值只能是+1或-1）。用 W_k(i) 表示第k次迭代时全体样本的权重分布。这样就有如下所示的AdaBoost算法：

1. begin initial D={x¹，y₁，...，xⁿ，y_n}，k_max(最大循环次数)，W_k(i)=1/n，i=1，...，n

2. k ← 0

3. do k ← k+1

4. 训练使用按照 W_k(i) 采样的 D 的弱学习器 C_k

5. E_k ← 对使用 W_k(i) 的 D 测量的 C_k 的训练误差

8. until k=k_max

9. return C_k和α_k，k=1，...，k_max（带权值分类器的总体）

10. end

注意第5行中，当前权重分布必须考虑到分类器 C_k 的误差率。在第7行中， Z_k 只是一个归一化系数，使得 W_k(i) 能够代表一个真正的分布，而 h_k(xⁱ) 是分量分类器 C_k 给出的对任一样本点 xⁱ 的标记（+1或-1），h_k(xⁱ) = y_i 时，样本被正确分类。第8行中的迭代停止条件可以被换为判断当前误差率是否小于一个阈值。

最后的总体分类的判决可以使用各个分量分类器加权平均来得到：

这样，最后对分类结果的判定规则是:

三、整体流程再梳理

按照自己的理解将AdaBoost的框架再进行梳理一遍，整个Boost框架分为两部分：训练和分类。

假设样本的类别为：

1、训练部分

a) 为训练集中每个样本分配权重；

b) 训练弱分类器；

c) 计算带权分类误差；

d) 计算弱分类器对应的权重

e) 更新样本权重

最终得到个不同的弱分类器及其对应的权重。

2、分类部分

a) 对待分类样本计算函数

b) 对该样本最终的分类结果为

四、核心问题再讨论

1、带权分类误差的作用：

在第二部分详细讨论了带权样本误差的生成机制问题，描述了如何计算带权样本误差和它怎样对AdaBoost框架产生影响。这里，将带权样本误差的作用再做以简单的总结，带权分类误差的主要作用有两个：

1、在训练弱分类器时，使用该指标在训练的多个DS中选择带权分类误差最小的最为该轮训练的弱分类器；

2、在AdaBoost框架中，使用该指标计算该轮训练得到的弱分类器对应的权值；

2、弱分类器的误差和AdaBoost框架的误差：

实质上，在整个训练的过程中，每轮训练得到的弱分类器可能一直会存在分类错误的问题（不论训练了多少轮，生成的单个弱分类器都有分类错误），然而整个AdaBoost框架却有可能快速收敛（整个AdaBoost框架的错误率为0）。造成这个现象的原因是：

每轮训练结束后，AdaBoost框架会对样本的权重进行调整，该调整的结果是越到后面被错误分类的样本权重会越高。这样到后面，单个弱分类器为了达到较低的带权分类误差都会把样本权重高的样本分类正确。虽然单独来看，单个弱分类器仍会造成分类错误，但这些被错误分类的样本的权重都较低，在AdaBoost框架的最后输出时会被前面正确分类的高权重弱分类器“平衡”掉。这样造成的结果就是，虽然每个弱分类器可能都有分错的样本，然而整个AdaBoost框架却能保证对每个样本进行正确分类，从而实现快速收敛。

【原】关于AdaBoost的一些再思考的更多相关文章

问题：一球从某高度自由落下，每次落地后反跳回原高度的一半；再落下，求它在第n次落地时，共经过多少米？第n次反弹多高？
import java.util.Scanner; //题目:一球从100米高度自由落下,每次落地后反跳回原高度的一半:再落下,求它在第10次落地时,共经过多少米?第10次反弹多高? public c ...
HDU 5135(再思考)
题意略. 思路:再思考后发现,为了构造出最大的三角形面积和,我们应该尽量让长的棍子相组合,这样构造出的三角形面积和最大,贪心能解. #include<bits/stdc++.h> usin ...
EventBus/EventQueue 再思考
EventBus/EventQueue 再思考 Intro 之前写过两篇文章,造轮子系列的 EventBus/EventQueue,回想起来觉得当前的想法有点问题,当时对 EvenStore 可能有点 ...
一球从100米高度自由落下，每次落地后反跳回原高度的一半；再落下，求它在第n次落地时，共经过多少米？第n次反弹多高？（n<=10）
单纯考逻辑题目: 一球从100米高度自由落下,每次落地后反跳回原高度的一半:再落下,求它在第n次落地时,共经过多少米?第n次反弹多高?(n<=10) 输入描述: 一行,一个整数n (1< ...
Web系统开发构架再思考-前后端的完全分离
前言前后端完全分离其实一直是Web开发人员的梦想,也一直是我的梦想,遥想当年,无论是直接在代码里面输出HTML,还是在HTML里面嵌入各种代码,都不能让人感到满意.期间的痛苦和纠结,我想所有Web开 ...
GPU计算的十大质疑—GPU计算再思考
http://blog.csdn.NET/babyfacer/article/details/6902985 原文链接:http://www.hpcwire.com/hpcwire/2011-06-0 ...
开源应用框架BitAdminCore重构再思考
索引 NET Core应用框架之BitAdminCore框架应用篇系列框架演示:https://www.bitadmincore.com 框架源码:https://github.com/chenyi ...
【Python3练习题 015】一球从100米高度自由落下，每次落地后反跳回原高度的一半，再落下。求它在第10次落地时，共经过多少米？第10次反弹多高？
a = [100] #每个‘反弹落地’过程经过的路程,第1次只有落地(100米) h = 100 #每个‘反弹落地’过程,反弹的高度,第1次为100米 print('第1次从%s米高落地,走过%s ...
22.一个球从100m高度自由下落，每次落地后返跳回原高度的一半，再反弹。求它在第10次落地时，共经过多少米，第10次反弹多高。
#include <stdio.h> #include <stdlib.h> int main() { ,hn=sn/; int i; ;i<=;i++) //注意i是从 ...

随机推荐

算法进阶面试题03——构造数组的MaxTree、最大子矩阵的大小、2017京东环形烽火台问题、介绍Morris遍历并实现前序/中序/后序
接着第二课的内容和带点第三课的内容. (回顾)准备一个栈,从大到小排列,具体参考上一课.... 构造数组的MaxTree [题目] 定义二叉树如下: public class Node{ public ...
go语言学习-数组-切片-map
数组 go语言中数组的特点: 数组的长度是固定的,并且长度也是数组类型的一部分是值类型,在赋值或者作为参数传递时,会复制整个数组,而不是指针定义数组的语法: var arr1 = [5]int{1 ...
JS-最全的创建对象的方式
JS最全创建对象方式汇总 1.最简单的方式--创建一个Object实例 var person = new Object(); //创建实例 person.name = "BlueBeginn ...
WinForm timer 控件
timer 控件:按用户定义的时间间隔引发的事件属性: Enabled 是否启用: Interval 事件发生的事件间隔,单位是毫秒事件只有一个:Tick 事件经过指定的时间间隔发生打开一个窗口 ...
潭州课堂25班：Ph201805201 并发（协程）第十五课 (课堂笔记)
#斐波那契 def fid(n): res = [] indx = 0 a = 0 b = 1 while indx < n : res.append(b) a,b = b,a+b indx + ...
git恢复某个已修改的文件--备忘
checkout 恢复某个已修改的文件(撤销未提交的修改): $ Git checkout file-name revert 还原已提交的修改(已经提交过的修改,可以反悔-) 还原最近一次提交的修改: ...
pycharm工具下代码下面显示波浪线的去处方法
近期安装了python后,发现使用pycharm工具打开代码后发现代码下边会有波浪线的显示:但是该代码语句确实没有错误,通过查询发现了两种方法去掉该波纹的显示,下面就具体说明一下: 方法一: 打开py ...
吴伯凡：VUCA时代的自我迭代
吴伯凡:VUCA时代的自我迭代 https://mp.weixin.qq.com/s?src=3&timestamp=1506588223&ver=1&signature=nv ...
三大分析法——SWOT、PEST、波特五力
SWOT分析法「SWOT分析模型简介」 (也称TOWS分析法.道斯矩阵).在现在的战略规划报告里,SWOT分析应该算是一个众所周知的工具.来自于麦肯锡咨询公司的SWOT分析,包括分析企业的优势(St ...
每次运行caffe代码之前需要考虑修改的地方
Train阶段: (1) train.sh中的solver.prototxt路径 (2) train.sh中的caffemodel路径 (3) train.sh中的 ...

【原】关于AdaBoost的一些再思考