PCA 问题背景 回顾一下我们特征选择中的问题.如果特征非常多,而且有一些特征是重复的,那么我们可以想办法剔除掉一些无用的特征.那里我们提到一个计算互信息的方法.那么这里换一种降维方法. 比如说这样的一种比较极端的情况,我们数据是二维的,但是很明显能看的出来有一个维度对于分类是没有任何作用的,那我们可以把这个数据投影到x轴上面,变成这样: 这样我们就把二维的数据降到了一维. 当然这只是一种比较极端的情况,但是对于任意情况也是可以推广的.比如上面这个情况,投到x轴是最好的情况,而投到y轴上是最差的…