朴素贝叶斯是一种十分简单的分类算法,称其朴素是因为其思想基础的简单性,就文本分类而言,他认为词袋中的两两词之间的关系是相互独立的,即一个对象的特征向量中的每个维度都是互相独立的.这是朴素贝叶斯理论的思想基础. 朴素贝叶斯分类的正式定义: 设x={}为一个待分类项,而每个a为x的一个特征属性 有类别集合C={} 计算P(|x),P(|x),…,P(|x) 如果P(|x)=max{ P(|x),P(|x),…,P(|x)},则x 那么关键就是如何计算第三步中的各个条件概率,我们可以这样计算: 找到一…