更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/

scikit-learn库之AdaBoost算法

当我们对Adaboost调参时，主要要对两部分内容调参，第一部分是对Adaboost的框架进行调参，第二部分是对弱学习器调参。本文主要介绍AdaBoost的两个模型AdaBoostClassifier和AdaBoostRegressor，会详解介绍AdaBoostClassifier模型，然后会对比着讲解AdaBoostRegressor模型。

接下来将会讨论上述两者的区别，由于是从官方文档翻译而来，翻译会略有偏颇，有兴趣的也可以去scikit-learn官方文档查看https://scikit-learn.org/stable/modules/classes.html#module-sklearn.ensemble

一、AdaBoostClassifier

1.1 使用场景

AdaBoostClassifier模型主要解决分类问题，并且它在scikit-learn库中使用了两种分类算法的实现，分别是SAMME和SAMME.R。

1.2 参数

base_estimator：弱分类器类型，object类型。理论上可以选择任何一个弱分类器，不过需要支持样本权重，一般用决策树或神经网络。如果algorithm='SAMME.R'，弱分类器应该支持概率预测，即支持predict_proba()方法。如果为默认值，算法会选择一个最大深度为1的决策树。默认为None。
n_estimators：最大迭代次数，int类型。弱学习器的最大迭代次数，如果迭代次数太小，容易欠拟合；如果迭代次数太大，容易过拟合。默认为50。
learning_rate：权重缩减系数，float类型。这个参数是正则化项的参数$\lambda$。较小的$\lambda$需要更多的迭代次数，即learning_rate和n_estimators需要一起调参。默认为1。
algorithm：算法类型，str类型。该参数主要用来度量学习器的权重。默认为'SAMME.R'。
- 'SAMME'：使用样本集分类效果作为弱分类器权重
- 'SAMME.R'：使用样本集分类的预测概率大小作为弱分类器权重
random_state：随机数种子，int类型。使用后可以保证随机数不会随着时间的变化而变化。默认为None。

1.3 属性

estimators_：list类型。弱学习集合。
classes_：array类型。类别列表。
n_classes_：int类型。类别数。
estimator_weights_：array类型。每个弱学习的权重。
estimator_errors_：array类型。每个弱学习额分类误差。
feature_importances_：array类型。返回特征重要度。

1.4 方法

decision_function(X)：计算样本X的决策函数值。
fit(X,y)：把数据放入模型中训练模型。
get_params([deep])：返回模型的参数，可以用于Pipeline中。
predict(X)：预测样本X的分类类别。
predict_log_proba(X)：返回样本X在各个类别上对应的对数概率。
predict_proba(X)：返回样本X在各个类别上对应的概率。
score(X,y[,sample_weight])：基于报告决定系数$R^2$评估模型。
set_prams(**params)：创建模型参数。
staged_decision_function(X)：返回每个阶段样本X的决策函数值。
staged_predict(X)：返回每个阶段样本X的预测值。
staged_predict_proba(X)：返回每个阶段样本X在各个类别上对应的概率。
staged_score(X,y[,sample_weight])：返回每个阶段样本X的$R^2$分数。

二、AdaBoostRegressor

AdaBoostRegressor模型和AdaBoostClassfier模型参数上差不多，只是前者一般用来解决回归问题，后者用来解决分类问题，预测值处理方式不同。并且AdaBoostRegressor模型在scikit-learn库中只是用了Adaboost.R2算法实现。

AdaBoostRegressor模型没有参数'algorithm'，而是使用了loss参数，即误差函数{'linear','square','exponential'}的选择。

04-03 scikit-learn库之AdaBoost算法的更多相关文章

(原创)（四）机器学习笔记之Scikit Learn的Logistic回归初探
目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...
Scikit Learn: 在python中机器学习
转自:http://my.oschina.net/u/175377/blog/84420#OSC_h2_23 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的 ...
SIGAI机器学习第二十二集 AdaBoost算法3
讲授Boosting算法的原理,AdaBoost算法的基本概念,训练算法,与随机森林的比较,训练误差分析,广义加法模型,指数损失函数,训练算法的推导,弱分类器的选择,样本权重削减,实际应用. AdaB ...
AdaBoost 算法-分析波士顿房价数据集
公号:码农充电站pro 主页:https://codeshellme.github.io 在机器学习算法中,有一种算法叫做集成算法,AdaBoost 算法是集成算法的一种.我们先来看下什么是集成算法. ...
集成学习之Adaboost算法原理小结
在集成学习原理小结中,我们讲到了集成学习按照个体学习器之间是否存在依赖关系可以分为两类,第一个是个体学习器之间存在强依赖关系,另一类是个体学习器之间不存在强依赖关系.前者的代表算法就是是boostin ...
Adaboost 算法
一 Boosting 算法的起源 boost 算法系列的起源来自于PAC Learnability(PAC 可学习性).这套理论主要研究的是什么时候一个问题是可被学习的,当然也会探讨针对可学习的问题的 ...
Adaboost 算法的原理与推导
0 引言一直想写Adaboost来着,但迟迟未能动笔.其算法思想虽然简单“听取多人意见,最后综合决策”,但一般书上对其算法的流程描述实在是过于晦涩.昨日11月1日下午,邹博在我组织的机器学习班第8次 ...
一个关于AdaBoost算法的简单证明
下载本文PDF格式(Academia.edu) 本文给出了机器学习中AdaBoost算法的一个简单初等证明,需要使用的数学工具为微积分-1. Adaboost is a powerful algori ...
Adaboost算法初识
1.算法思想很简单: AdaBoost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器.(三个臭皮匠,顶个诸葛亮) 它的 ...

随机推荐

Python高效编程技巧实战实战编程+面试典型问题中高阶程序员过渡
下载链接:https://www.yinxiangit.com/603.html 目录: 如果你想用python从事多个领域的开发工作,且有一些python基础, 想进一步提高python应用能力 ...
Linux Shell 基础知识（一）
1. 本文知识结构 2. shell 基础知识 2.1 shell 简单介绍 GNU bash shell 能提供对 Linux 系统的交互式访问,一般来说,使用快捷键 Ctrl + Alt + ...
Android数据列表展示之 RecylerView
一.概述 1.RecyclerView是什么? RecyclerView是一种新的视图组,目标是为任何基于适配器的视图提供相似的渲染方式.该控件用于在有限的窗口中展示大量数据集,它被作为ListVie ...
Java第二次作业第五题
自定义异常类,非法年龄类,并在person3类中使用此类,根据情况抛出异常,并进行处理. package naizi; class IllegalAgeException extends Except ...
38 (OC)* 进程、线程、堆栈
一.进程和线程 1.什么是进程进程是指在系统中正在运行的一个应用程序每个进程之间是独立的,每个进程均运行在其专用且受保护的内存空间内比如同时打开QQ.Xcode,系统就会分别启动2个进程通过“ ...
Django中自定义模型管理器(Manager)及方法
1.自定义管理器(Manager) 在语句Book.objects.all()中,objects是一个特殊的属性,通过它来查询数据库,它就是模型的一个Manager.每个Django模型至少有一个ma ...
Docker学习之docker架构
docker架构解释 1.docker命令提交给docker daemon进行处理,可以拖取镜像,运行容器等等. 2.最右边的实际上是互联网的sass服务,docker daemon可以和Regis ...
JS替换字符串多余的空格符
var str = 'sdfsdfds '; str.replace(/(^\s*)|(\s*$)/g, "");
FPGA 开发详细流程你了解吗？
FPGA 的详细开发流程就是利用 EDA 开发工具对 FPGA 芯片进行开发的过程. FPGA 的详细开发流程如下所示,主要包括电路设计.设计输入.综合(优化).布局布线(实现与优化).编程配置五大步 ...
MybatisPlus报错Invalid bound statement (not found)的解决方案
今天使用MybatisPlus,测试时报错Invalid bound statement (not found) 使用自定义的mapper接口中的方法可以执行,而调用MybatisPlus中baseM ...

04-03 scikit-learn库之AdaBoost算法