通过数据压缩(降维)可以减少特征数量,可以降低硬盘和内存的存储,加快算法的训练. 还可以把高维的数据压缩成二维或三维,这样方便做数据可视化. 数据压缩是通过相似或者相关度很高的特征来生成新的特征,减少特征数量.例如,上图x1是厘米,x2是英寸,这两个特征相关度很高,可以压缩成一个特征. ====================================== 主成分分析(Principal Component Analysis, PCA)是常用的降维算法. 例如,要将二维数据压缩成一维数据,…