1. 第一种,在norvig介绍的方法中,详细的阐述了argmaxc P(c|w)的转换和求解办法. 这个概率不好直接算,但可以根据贝叶斯定理等价于argmaxc P(w|c)*P(c) / P(w),因为是比较各个c之间的大小所以P(w)可以省略,最后就变成求argmaxc P(w|c)*P(c)就行了.P(c)可以看作是c在文本集合中出现的可能性:P(w|c)意味着本来心里想成是c结果打成了w的概率.那就很好办了,P(c)可以从靠谱的语料中统计:P(w|c)可以用编辑距离来模拟关系,即编辑距…