1.L1和l2损失是什么意思?

相较于MSE,MAE有个优点,那就是MAE对离群值不那么敏感,可以更好地拟合线性,因为MAE计算的是误差y−f(x)的绝对值,对于任意大小的差值,其惩罚都是固定的。

2.参数:

核心参数:

1.objective:

回归应用:用法都是:objective=type

type:

常见的有:

L2(MSE) \L1(MAE)\MAP

二分类应用:

多分类应用:

交叉熵应用:

排序应用:

2.boosting

默认使用gbdt,梯度下降决策树

3.data:

指的是训练数据

4.valid:

指的是验证集(测试集)的路径或文件,支持多个验证集

5.num_iterations:

迭代次数(增益次数)

6.learning_rate:

必须大于零的收缩率,双精度小数

7.num_leaves:

大于1,一颗树中的叶子的最大个数

8.tree _learner:

学习器是平行的还是单机学习,是数据平行还是特征平行

9.num_threads

线程数目

10.device_type

建立GPU支持后可以用GPU跑

11.seed

一般都是用random_state,可以时间点。实现每次运行程序划分的训练集和测试集都是同一个

使用控制参数:

1. force_col_wise:

特征非常多,线程数目特别多才会推荐使用

2.histogram_pool_size:

设置直方图的最大缓存数,<0代表没有限制

3.max_depth:

设置最大深度防止过拟合,<=0代表没有限制

4.min_data_in_leaf:

设置一个叶子的最小数据量

5.bagging_fraction:

小部分装袋:防止过拟合和加快训练

6.pos_bagging_fraction

用于二分类问题

7.neg_bagging_fraction

(0,1] 只能用于二分类

8.bagging_freq

每k 此迭代执行一次bagging 随机选择bagging_fraction*100%的数据用于下一次迭代

9.bagging_seed

用于固定打包时间

10.feature_fraction

在训练每棵树前 随机选择feature_fraction*100%的特征,值大小为(0,1]

11.feature_fraction_bynode

在每棵树节点随机选择一个特征子集

12.feature_fraction_seed

用于固定每次的抽取的部分特征

13.extra_trees

使用极度随机的树

14.extra_seed

固定extra_trees的时间

15.early_stopping_round

如果在到达设置的提前停止轮内,验证集的某个评价指标没有提高,训练就会停止.,否则继续训练

16.first_metric_only

17.max_delta_step:

用于限制最大叶子输出

18.

lambda_l1:L1正则项

lambda_l2:L2正则项

19.linear_lambda:

适用于线性回归树

20.min_gain_to_split:

执行分割的最小增益,可用于加速训练

21.drop_rate:  

[0,1]

只适用于dart模式下的 丢弃先前的树

22.max_drop

在一次增益迭代中丢弃的最大数目,适用于dart模式

23.skip_drop

取值[0,1],

设置在dart模式下跳过dropout的概率

24.xgboost_dart_mode

设置是否采用xgboost里的dart模块

25.uniform_drop

随机均衡丢弃

26.

drop_seed:

确定选择丢弃模型的时间

goss模型:

27.

top_rate

  

大梯度数据的保存概率

28.

other_rate:

小梯度数据的保存概率

29.

min_data_per_group

每种类别组的最小数据量的数据

30.max_cat_threshold

为类别特征设置限制分割点数量

类别型特征
类别型特征(Categorical Feature)主要是指只在有限选项内取值的特征。例如性别(男、女)、成绩等级(A、B、C)等。通常以字符串形式输入,除了决策树等少数模型能直接处理字符串形式的输入,逻辑回归、支持向量机等模型的输入必须是数值型特征才能正确工作。

31.cat-l2

类别分割中的正则项

32.cat_smooth

可以降低类别特征中的噪声,尤其是小样本。

33.max_cat_to_onehot

34.top_k

仅仅适用于 voting tree learner

35.monotone_constraints

单调特征

36.monotone_constraints_method

37.monotone_penalty:单调惩罚

38.verbosity

一般就是默认选1,显示信息

39.max_bin

将被分桶的特征值的最大分桶数量

40 max_bin_by_feature:

每个特征的最大分箱数量

41.min_data_in_bin

避免一箱一数据,防止过拟合

42.bin_construct_sample_cnt

被采样用于创建特征离散箱的数据数量

loading data directly from text file

直接从testfile中载入数据

43.label_column:

  用于指定标签列

44.weight_column:

用于指定权重列

45.group_column:

46.ignore_column

47.catagorical_feature

规定一些列是类别特征

Predict Parameters3

48.start_iteration_predict:

49.num_iteration_predict

50.predict_raw_score:

布尔型,=True是只预测初始得分

51 .predict_leaf_index:

52.pred_early_stop:

仅使用于分类和排序应用

==true会使用early-stopping来加速预测,可能会影响精度

53.pred_early_stop_margin:

在预测中边界的阈值

54.

  

lgb文档学习的更多相关文章

  1. EasyUI文档学习心得

    概述 jQuery EasyUI 是一组基于jQuery 的UI 插件集合,它可以让开发者在几乎完全不需要CSS以及复杂的JS代码情况下完成美观且功能强大的Web界面. 本文主要说明一些如何利用Eas ...

  2. Spring文档学习

    Spring文档学习 参考Spring Framework Documentation学习 1. IoC 容器 1.1 容器实例化 <beans> <import resource= ...

  3. Cassandra1.2文档学习解读计划——为自己鼓劲

    最近想深入研究一下Cassandra,而Cassandra没有中文文档,仅有的一些参考书都是0.7/0.6版本的.因此有个计划,一边学习文档(地址:http://www.datastax.com/do ...

  4. 《MATLAB从入门到放弃》二维曲线和图形绘制基础(二):使用Help文档学习line、plot、plotyy、subplot、hold绘图函数

    目录: »  plot 最常用的二维曲线绘图函数 >  帮助文档 >  基本使用语法 >  线条的样式.符号和颜色调整 >  图形属性调整 >  使用图形句柄进行设置 » ...

  5. 这可能是最详细的 iOS 学习入门指南(含书目/文档/学习资料)

    1 零基础小白如何进行 iOS 系统学习 首先,学习目标要明确: 其次,有了目标,要培养兴趣,经常给自己一些正面的反馈,比如对自己的进步进行鼓励,在前期小步快走: 再次,学技术最重要的一点就是多动手. ...

  6. 通过程序校验xml文档学习笔记

    校验xml文档,可以通过程序来校验,利用一段js代码即可. 各行代码的含义已经写出,运行这个html文件,检验如下xml代码: 结果如下: 如果xml文档出现错误: 结果如下: 其中,obj.asyn ...

  7. Nodejs v4.x.0API文档学习(2)Assert断言测试模块

    文档参考地址:https://nodejs.org/dist/latest-v4.x/docs/api/ Assert(断言) assert模块提供了一组简单的断言测试方法,可以拥有测试不变量.该模块 ...

  8. Nodejs v4.x.0API文档学习(1)简介

    文档参考地址:https://nodejs.org/dist/latest-v4.x/docs/api/ 简介 下面是用nodejs编写的一个web服务的例子,返回"Hello World& ...

  9. linux 内存-文档学习

    ptmalloc http://www.malloc.de/en/ tcmalloc https://github.com/gperftools/gperftools jcmalloc http:// ...

  10. <文档学习>AirSim/using_car.md Choosing Your Vehicle: Car or Multirotor

    如何在AirSim中使用汽车 默认情况下,AirSim中使用的车型为多转子multirotor. 如果你想使用汽车,那么只需在你的settings.json(https://github.com/Mi ...

随机推荐

  1. SQL Server性能优化工具Profiler

    SQL Server Profiler是什么 SQL Server Profiler是一个界面,用于创建和管理跟踪并分析和重播跟踪结果. 这些事件保存在一个跟踪文件中,稍后试图诊断问题时,可以对该文件 ...

  2. unity VideoPlayer 视频静音

    standVideo.SetDirectAudioMute(0,true);

  3. Ubuntu16 改 静态IP的方法

    https://blog.csdn.net/mdw5521/article/details/79270035

  4. JDBC之ResultSet和元数据

    ResultSet 从名字上就可以看到是结果集,表示的是查询出来的结果集. JDBC用ResultSet来封装结果集,查询结果表的对象. 查询结果分为两种情况: 单值 单个结果,比如说SQL如下: s ...

  5. [AGC043B] 123 Triangle

    个人思路: 首先,经过 \(1\) 轮就没有 \(3\) 了. 先考虑能否递推前 \(i\) 个数的答案,发现不行. 再考虑能否推出 \(i\) 个数的答案的计算公式,也发现不行. 然后就不会了. 正 ...

  6. ABAP 动态内表 实例展示以及代码Demo

    因根据查询条件展示的报表列数不一定一致,因此采用动态内表的方式进行处理 这里写了一个简单的Demo记录一下 效果如下图: 一般来说通过选择屏幕来控制列的,我这里就简单处理,直接对内表赋予相关值,包括相 ...

  7. 在MyBatis-Plus整合dynamic-datasource @DS失效

    因为是事务导致的 解决方案: 1.删除事务 2.使用分布式事务 3.修改事务的传播机制 3.使用DS的本地事务 @DSTransactional 但切记不可和Spring的事务共存 附传播机制 事务传 ...

  8. gRPC service 和client需要引用的包

    gPRC service 在ASP.NET Core中使用 直接引用Grpc.AspNetCore,该包含有Google.Protobuf.Grpc.AspNetCore.Server.ClientF ...

  9. java使用minio上传下载文件

    Minio模板类: @RequiredArgsConstructor public class MinioTemplate implements InitializingBean { private ...

  10. python日期时间、时间戳互相转换

    日期时间格式字符串转时间戳: 1 import time 2 3 def produce_ctime(stringTime): 4 """ 5 日期时间格式字符串 -&g ...