CART算法全称是分类回归算法,(Classification And Regression Tree),他与ID3.C4.5的不同在于: 1.既可以处理分类问题又可以处理回归问题 2.使用基尼系数作为分类依据,比起使用熵计算简单 3.使用的是二分递归分割的技术,生成二叉树 原理不在赘述,基尼系数计算公式: 其中,A表示某一属性,C表示这个属性下共C种特征,Pi表示第i个特征发生的概率 当然,对于公式解释的有点乱,很容易搞混,下面结合实例介绍如何计算: 对于上面的属性,基尼系数计算如上所示. 对…