集成学习是如何把多个分类器组合在一起的,不同的集成学习有不同的组合策略,本文做个总结. 平均法 对数值型输出,平均法是最常用的策略,解决回归问题. 简单平均法 [h(x)表示基学习器的输出] 加权平均法 [w是基学习器的权重,w>0] 基学习器的权重一般是根据训练数据得到,所以不完全可靠,对于规模较大的集成学习来说,容易造成过拟合,所以加权平均不一定优于简单平均. 一般而言,在基学习器性能相差较大时,选择加权平均,在基学习器性能类似时,选择简单平均. 投票法 解决分类问题,假设有N个类别,分类器…