ID3决策树算法是基于信息增益来构建的,信息增益可以由训练集的信息熵算得,这里举一个简单的例子 data=[心情好 天气好 出门 心情好 天气不好 出门 心情不好 天气好 出门 心情不好 天气不好 不出门] 前面两列是分类属性,最后一列是分类 分类的信息熵可以计算得到:出门=3,不出门=1,总行数=4分类信息熵 = -(3/4)*log2(3/4)-(1/4)*log2(1/4) 第一列属性有两类,心情好,心情不好 心情好 ,出门=2,不出门=0,行数=2 心情好信息熵=-(2/2)*log2…