定义: 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法. 目前我们会用到的主流的决策树算法包括:ID3,C4.5,CART等. ID3算法是以信息增益为准则选择信息增益最大的属性,信息增益对可取值数目较多的属性有所偏好,比如通过ID号可将每个样本分成一类,但是没有意义.同时ID3只能对离散属性的数据集构造决策树. c4.5算法是以信息增益率为准则选择