决策树算法是一种有监督的分类学习算法.利用经验数据建立最优分类树,再用分类树预测未知数据. 例子:利用学生上课与作业状态预测考试成绩. 上述例子包含两个可以观测的属性:上课是否认真,作业是否认真,并以此预测考试成绩.针对经验数据,我们可以建立两种分类树 两棵树都能对经验数据正确分类,实际上第二棵树更好,原因是什么呢?在此,我们介绍ID3分类算法. 1.信息熵 例如,我们想要获取球队比赛胜负的信息:中国队vs巴西队.中国队vs沙特队. 哪场比赛信息量高?答案是中国队vs沙特队.原因是中国队vs沙特…