Adaptive Boosting

Boosting

boosting和bagging很类似，所使用的多个分类器类型都是一致的。另外，他们的主要区别点如下：

boosting中不同的分类器是通过串行得到的，每个分类器都是根据已经训练出来的分类器的性能来进行训练。 bagging中不同的分类器之前是没有影响的。

boosting最终的分类结果是各个基本分类器的加权得到，bagging分类器的权重是相等的。

boosting不改变所给的训练数据，只是改变所给训练数据的一个权值的分布。

Boosting的主要版本：AdaBoost, GBDT

接下来就介绍一下AdaBoost:

Ada Boost是一个Linear Aggregation的例子。是对分类错误的example权重提高，一步一步的得到不同的弱分类器，最后融合这些分类器的算法。

从样本中有放回抽样得到每次的训练集，以u纪录出现的次数。

在原始数据集上来看，就相当于是对不同的样本错误采取加权来计算Ein，当前g就是寻找这些加权后的最小Ein，现在我换一种思路，不再是每次放回抽样，然后怎样怎样，而是：

我现在有了g1,g1在一些样本上分类错误，在另一些样本上分类正确，我要怎么由g1得到g2呢？

由于我们希望不同的g差别很大，所以我们希望在新样本上，g1的表现很差，什么叫表现很差呢？就是和你随便猜的表现差不多，

也就是在 u(t + 1)上g1一半分错，一半分对。

所以就可以由之前的数据，进行“加权”得到新的数据进行训练得到g2。

假设之前的错误率为 r，那么正确分类的数据就要乘以 r，错误分类的数据就要乘以(1 - r)

定义方块t:

也就是说，如果这次分对了，那么权重就乘以方块t,分错了就除以方块t。这样对于错误率小于1/2的弱分类器，方块t就会大于1，错误的数据的权重就会得到加强。

好了，有了以上的描述，那么接下来就正式一点的来理一理这个算法Ada boost.

就是首先因为是平方误差，所以初始化权重u为1/N，然后每次就是在数据上找一个g，这基于 min Ein.然后由分类数据的对错确定数据之后的一个权重。

得到新数据之后再训练得到g2，然后得到新权重，然后。。。鸡生蛋，蛋生鸡，子子孙孙无穷尽也。。。

这其中，不能再使用uniform aggregation了，因为你第一次好的数据，在第二次差到极致，你这么组合有意思么？所以，这里采用Linear aggregation。而且这里的权重为ln(方块t)

所以，我们的AdaBoost只要搭配一个弱弱的演算法就好了，那么现在就介绍一个弱弱的演算法Decision Stump

就看单一的feature，在里面决定你要切在哪里，哪边为正，哪边为负。那么我们可以搜索所有参数的组合，得到最好的Decision Stump

物理上看，就比如一个二维的。每次只能切水平刀，竖直刀。

对于权重和更新参数的另一种更新规则，统计学习方法教材上有更详细的描述，而且我觉得那种更新方法似乎更有道理。

Adaboost优缺点：

优点：分类时，分类精度高

　　　　弱分类器好选择

　　　　构造简单，结果可理解

　　　　不容易产生过拟合

缺点：对异常值明感

Adaptive Boosting的更多相关文章

机器学习技法：08 Adaptive Boosting
Roadmap Motivation of Boosting Diversity by Re-weighting Adaptive Boosting Algorithm Adaptive Boosti ...
机器学习技法笔记：08 Adaptive Boosting
Roadmap Motivation of Boosting Diversity by Re-weighting Adaptive Boosting Algorithm Adaptive Boosti ...
随机森林（Random Forest），决策树，bagging， boosting（Adaptive Boosting，GBDT）
http://www.cnblogs.com/maybe2030/p/4585705.html 阅读目录 1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 ...
机器学习技法总结（五）Adaptive Boosting, AdaBoost-Stump,决策树
上一讲主要利用不同模型计算出来的g.採用aggregation来实现更好的g.假设还没有做出来g.我们能够採用bootstrap的方法来做出一系列的"diversity"的data ...
自适应增强(Adaptive Boosting)
简介 AdaBoost,是英文”Adaptive Boosting“(自适应增强)的缩写,是一种迭代提升算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成 ...
一步一步理解AdaBoosting(Adaptive Boosting)算法
最近学习<西瓜书>的集成学习之Boosting算法,看了一个很好的例子(https://zhuanlan.zhihu.com/p/27126737),为了方便以后理解,现在更详细描述一下步 ...
aggregation（2）：adaptive Boosting （AdaBoost）
给你这些水果图片,告诉你哪些是苹果.那么现在,让你总结一下哪些是苹果? 1)苹果都是圆的.我们发现,有些苹果不是圆的.有些水果是圆的但不是苹果, 2)其中到这些违反"苹果都是圆的" ...
【Adaptive Boosting】林轩田机器学习技法
首先用一个形象的例子来说明AdaBoost的过程: 1. 每次产生一个弱的分类器,把本轮错的样本增加权重丢入下一轮 2. 下一轮对上一轮分错的样本再加重学习,获得另一个弱分类器经过T轮之后,学得了T ...
转载：bootstrap, boosting, bagging 几种方法的联系
转:http://blog.csdn.net/jlei_apple/article/details/8168856 这两天在看关于boosting算法时,看到一篇不错的文章讲bootstrap, ja ...

随机推荐

DOM(四)：h5扩展方法
getElementByClassName()方法getElementByClassName()方法接收一个参数,即一个包含一或多个类名的字符串,返回带有指定类的所有元素的NodeList //取得所 ...
kiiti分割的数据及其处理
kitti和cityscape的gt的分割不太一样,下边缘不再是从黑色开始的,而是直接是类别 red,green,blue = img_gt[i,j] 1.道路的颜色(紫色):128 64 128 2 ...
字符串比较操作类StringComparer
StringComparer这个字符串比较操作类.它继承了四种接口IComparer, IEqualityComparer, IComparer<string>, IEqualityCom ...
mysql中locate和substring函数使用
locate函数使用 LOCATE(substr,str) 1.如果子串 substr 在 str 中不存在,返回值为 0: 2.如果子串 substr 在 str 中存在,返回该字符串第一次出现的位 ...
data-ng-init 指令
1.data-ng-init指令为AngularJS应用程序定义了一个初始值. 2.通常情况下,data-ng-init指令并不常用,将会使用控制器或模块来代替它.
visual attention
The visual attention mechanism may have at least the following basic components [Tsotsos, et. al. 19 ...
java基础必备单词讲解 day six
development development development development 开发 development developmentenvironment environment en ...
开发必看 | iOS开发常用设计模式！
ios开发学习中,经常弄不清楚ios的开发模式,今天我们就来进行简单的总结和探讨~(一)代理模式应用场景:当一个类的某些功能需要由别的类来实现,但是又不确定具体会是哪个类实现.优势:解耦合敏捷原则: ...
Navicat-12.0.26的激活
1.卸载掉早期版本,卸载干净,然后安装最新版Navicat(使用群文件中Iobit uninstaller8卸载) 2.安装完成后将破解补丁复制到安装目录下,运行破解补丁. 4.先patch,然后选择 ...
彻底搞定C指针--“函数名与函数指针”
函数名与函数指针一通常的函数调用一个通常的函数调用的例子: //自行包含头文件 void MyFun(int x); //此处的申明也可写成:void MyFun( int ); 点击打开链 ...

Adaptive Boosting

Adaptive Boosting的更多相关文章

随机推荐

热门专题