预处理的几种方法:标准化.数据最大最小缩放处理.正则化.特征二值化和数据缺失值处理. 知识回顾: p-范数:先算绝对值的p次方,再求和,再开p次方. 数据标准化:尽量将数据转化为均值为0,方差为1的数据,形如标准正态分布(高斯分布). 标准化(Standardization) 公式为:(X-X_mean)/X_std 计算时对每个属性/每列分别进行. 将数据按其属性(按列进行)减去其均值,然后除以其方差.最后得到的结果是,对每个属性/每列来说所有数据都聚集在0附近,方差值为1. sklearn中…