主要内容: 一.决策树模型 二.信息与熵 三.信息增益与ID3算法 四.信息增益比与C4.5算法 五.决策树的剪枝 一.决策树模型 1.所谓决策树,就是根据实例的特征对实例进行划分的树形结构.其中有两种节点:内节点表示一个特征,叶子结点表示一个类(或称为标签). 2.在决策树中,从根节点开始,对实例的所有特征进行测试,根据测试结果,选择最合适的特征作为依据,将实例分配到其子节点上:此时,每一个子节点都对应着该特征(即父节点上的特征)的一个取值.之后一直递归下去,直到所有节点上所有实例的类都一样.…