提升树的学习优化过程中，损失函数平方损失和指数损失时候，每一步优化相对简单，但对于一般损失函数优化的问题，Freidman提出了Gradient Boosting算法，其利用了损失函数的负梯度在当前模型的值：

　　作为回归问题提升树算法的残差近似值，去拟合一个回归树。

函数空间的数值优化

　　优化目标是使得损失函数最小，(N是样本集合大小)：

　　GBDT是一个加法模型： f_m(x) 是每一次迭代学习的到树模型

　　对于其每一步迭代：

　　其中

　　其实 L(y,F(x)) 就是损失函数，Φ(F(x)) 是当前x下的损失期望，g_m(x) 是当前x下的函数梯度。最终 f_m(x) 学习的是损失函数在函数空间上的负梯度。

　　对于权重 ρ_m 通过线性搜索求解：

　　理解：每一次迭代可以看做是采用梯度下降法对最优分类器 F^*(x) 的逐渐比较，每一次学习的模型 f_m(x) 是梯度，进过M步迭代之后，最后加出来的模型就是最优分类器的一个逼近模型，所以 f_m(x_i) 使用单步修正方向 -g_m(x_i)：

　　这里的梯度变量是函数，是在函数空间上求解（这也是后面XGBoost改进的点），注意以往算法梯度下降是在N维的参数空间的负梯度方向，变量是参数。这里的变量是函数，更新函数通过当前函数的负梯度方向来修正模型，使它更优，最后累加的模型近似最优函数。

算法描述

　　输入：训练数据集 T={(x₁,y₁),(x₂,y₂),···,(x_N,y_N)}

　　输出：回归树 f_M(x)

　　1. 初始化

　　2. 对 m=1,2,…M

　　　　a. 对 i=1,2,…,N ，计算

　　　　b. 对 r_mi 拟合一颗回归树，得到第m棵树的叶结点区域 R_mj, j=1,2,…,J ,即一棵由J个叶子节点组成的树

　　　　c. 对 j=1,2,…,J ,计算

　　　　上面两步相当于回归树递归在遍历所有切分变量j和切分点s找到最优j,s，然后在每个节点区域求最优的c

　　　　d. 更新

　　3. 得到回归树

　　在回归树生成时，建树选择分裂点必须要遍历所有数据在每个特征的每个切分点的值，如果是连续特征就计算复杂度非常大，也是GBDT训练主要耗时所在。

参考

GBDT原理-Gradient Boosting Decision Tree

梯度提升树GBDT总结的更多相关文章

scikit-learn 梯度提升树(GBDT)调参小结
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点. 1. scikit-learn ...
梯度提升树(GBDT)原理小结(转载)
在集成学习值Adaboost算法原理和代码小结(转载)中,我们对Boosting家族的Adaboost算法做了总结,本文就对Boosting家族中另一个重要的算法梯度提升树(Gradient Boos ...
机器学习之梯度提升树GBDT
目录 1.基本知识点简介 2.梯度提升树GBDT算法 2.1 思路和原理 2.2 梯度代替残差建立CART回归树 1.基本知识点简介在集成学习的Boosting提升算法中,有两大家族:第一是AdaB ...
scikit-learn 梯度提升树(GBDT)调参笔记
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点. 1. scikit-learn ...
梯度提升树(GBDT)原理小结
在集成学习之Adaboost算法原理小结中,我们对Boosting家族的Adaboost算法做了总结,本文就对Boosting家族中另一个重要的算法梯度提升树(Gradient Boosting De ...
笔记︱决策树族——梯度提升树(GBDT）
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 本笔记来源于CDA DSC,L2-R语言课程所 ...
梯度提升树GBDT算法
转自https://zhuanlan.zhihu.com/p/29802325 本文对Boosting家族中一个重要的算法梯度提升树(Gradient Boosting Decison Tree, 简 ...
机器学习（七）—Adaboost 和梯度提升树GBDT
1.Adaboost算法原理,优缺点: 理论上任何学习器都可以用于Adaboost.但一般来说,使用最广泛的Adaboost弱学习器是决策树和神经网络.对于决策树,Adaboost分类用了CART分类 ...
机器学习之梯度提升决策树GBDT
集成学习总结简单易学的机器学习算法——梯度提升决策树GBDT GBDT(Gradient Boosting Decision Tree) Boosted Tree:一篇很有见识的文章 https:/ ...

随机推荐

C#中DateTime.Ticks
DateTime.Ticks:表示0001 年 1 月 1 日午夜 12:00:00 以来所经历的 100 纳秒数,即Ticks的属性为100纳秒(1Ticks = 0.0001毫秒). Unix时间 ...
linux 目录结构及VIM
目录结构及VIM 文件系统说明: 文件系统就是操作管理存储设备或分区上的文件的方法和数据结构,也就是存储设备上组织文件的方式. 操作系统中负责管理和存储文件信息的软件机构叫文件管理系统,简称为文件系 ...
TVM图优化（以Op Fusion为例）
首先给出一个TVM 相关的介绍,这个是Tianqi Chen演讲在OSDI18上用的PPThttps://files.cnblogs.com/files/jourluohua/Tianqi-Chen- ...
7.SpringMVC 配置式开发-ModelAndView和视图解析器
ModelAndView 1.Model(模型) 1.model的本质就是HashMap,向模型中添加数据,就是往HashMap中去添加数据 2.HashMap 是一个单向查找数组,单向链表数组 3. ...
HTML插入地图
方法/步骤 1.打开“百度地图生成器”的网址:http://api.map.baidu.com/lbsapi/creatmap/index.html 如下图: 2.在“1.定位中心点”中,切换城市,并 ...
Delphi 方法的声明
Dart的List比较特殊的几个API
List里面常用的属性和方法: 常用属性: length 长度 reversed 翻转 isEmpty 是否为空 isNotEmpty 是否不为空常用方法: add 增加 addAll 拼接数组 i ...
「SNOI2019」通信分治建图
根据题意每个点可以直接与S,T相连也可以和前面的哨站相连暴力建边的话有n2条边要用分治优化建边: 类似于归并排序先对每一层分为左半边与右半边对每一半都拿出来先排序去重后直接排成一条链建 ...
BZOJ 2049: [Sdoi2008]Cave 洞穴勘测 (LCT维护连通性)
直接把x设为根,然后查询y所在联通块的根是不是x就行了. CODE #include <cstdio> #include <cstring> #include <algo ...
mysql自增主键清零方法
MySQL数据库自增主键归零的几种方法如果曾经的数据都不需要的话,可以直接清空所有数据,并将自增字段恢复从1开始计数: truncate table table_name; 1 当用户没有trunc ...

梯度提升树GBDT总结

函数空间的数值优化

算法描述

参考

梯度提升树GBDT总结的更多相关文章

随机推荐

热门专题