由于上一例的实现中只针对了离散数据,为了扩充处理范围,我实现了一下对线性数据的简单处理,在其中我选择用中位数作为指标,平均数.众数等等其他数据在我看来异曲同工,最终也都会有较相似的结构. 求连续数据的香农熵 def calcLinerData(dataSet): num=len(dataSet) count={1:0,0:0} shannonEnt=0.0 for i in range(num): feature = [ example[-1] for example in dataSet] f