首先声明,LightGBM是针对大规模数据(样本量多,特征多)时,对XGBoost算法进行了一些优化,使得速度有大幅度提高,但由于优化方法得当,而精度没有减少很多或者变化不大,理论上还是一个以精度换速度的目的.如果数据量不大,那就对XGBoost没有什么优势了. 我认为有这几点: 1.GOSS(Gradient-based One-Side Sampling),基于梯度的单侧采样,对训练样本的采样. 如原始训练数据100w,高梯度数据有1w,那么会计算 1w+随机选择b%*余下的99w数据,然后…