一.简介 RF = Bagging + Decision Tree 随机:数据采样随机,特征选择随机 森林:多个决策树并行放在一起 几个误区: 不是每棵树随机选择特征,而是每一个结点都随机选择固定数目的特征 采样.样本数量为N,采样数量也为N,但是采取的是有放回的采样(bootstrap). 组合算法.训练结束之后,对新数据进行预测的时候,会让新数据在所有得到的M个决策树上进行预测,最后对结果进行平均或者进行投票.最早的算法是投票:每个树对每一类投票,sklearn的算法是对各个树进行了平均取结