我们在用python进行机器学习建模时,首先需要对数据进行预处理然后进行特征工程,在这些过程中,数据的格式可能会发生变化,前几天我遇到过的问题就是: 对数据进行标准化.归一化.方差过滤的时候数据都从DataFrame格式变为了array格式. 这样数据的列名就会消失,且进行特征选择之后列的数量也会发生改变,因此需要重新对列进行映射,为其加上列名并转化为DataFrame的格式.一般情况下可以分为三种情况: 1.对数据进行缺失值填补.编码(处理分类型变量).二值化(处理连续型变量)一般都是按照列对…