LR如何解决低维不可分 特征映射:通过特征变换的方式把低维空间转换到高维空间,而在低维空间不可分的数据,到高维空间中线性可分的几率会高一些.具体方法:核函数,如:高斯核,多项式核等等. 从图模型角度看LR LR模型可以看作是CRF模型的低配版,在完全不定义随机变量交互,只考虑P(Y|X)的情况下,得到的就是LR模型. 最大熵相比LR,可以提取多组特征(最大熵定义了多个特征函数),本质上等价的.CRF又是最大熵模型序列化的推广. 本质上,LR和softmax是等价的,而且也可证最大熵和softma…