[数据挖掘]分类之decision tree. 1. ID3 算法 ID3 算法是一种典型的决策树(decision tree)算法,C4.5, CART都是在其基础上发展而来.决策树的叶子节点表示类标号,非叶子节点作为属性测试条件.从树的根节点开始,将测试条件用于检验记录,根据测试结果选择恰当的分支:直至到达叶子节点,叶子节点的类标号即为该记录的类别. ID3采用信息增益(information gain)作为分裂属性的度量,最佳分裂等价于求解最大的信息增益. 信息增益=parent节点熵 -…