1.公式 上式中左边D是需要预测的测试数据属性,h是需要预测的类:右边式子分子是属性的条件概率和类别的先验概率,可以从统计训练数据中得到,分母对于所有实例都一样,可以不考虑,所有只需 ,返回最大概率的那个类别.但是如果测试数据中没有那个属性,整个预测概率会是0:此外,此式针对离散型属性进行训练,针对连续的数值型属性可以考虑分段,也可以假设其满足某种分布,比如正态分布,利用概率密度函数求概率. 2.部分改进 (1).针对测试数据中没有那个属性,可以平滑一下,比如下(针对非数值型属性): 上式中n是…